연속기획
본문
직업보건에서 빅데이터를 활용한 위험도 평가방법
글. 김수근
- 의학박사 / 직업환경의학전문의
서론
지난 호에서는 빅데이터와 위험도 평가의 상호 연관성과 그 적용 분야를 살펴보았다. 이번 호에는 빅데이터를 활용한 구체적인 위험성 평가방법을 알아보고자 한다. 고용노동부는 올해 “자기규율 예방체계 및 엄중책임”의 핵심수단인 위험성평가 제도의 현장 안착 및 확산을 위하여 「사업장 위험성평가에 관한 지침(고시)」을 개정하여 시행하였다. 근로자의 사망·부상·질병의 빈도와 강도를 계량적으로 추정·결정토록 하는 문구를 삭제하고, 위험요인 파악과 개선대책 마련에 집중하도록 위험성평가를 새로 정의하였다. 그리고 그동안 위험성평가를 잘 몰라 주저하던 중소규모 사업장 노‧사가 사업장 위험을 찾아 재해를 예방할 수 있도록 손쉽고 간편한 체크리스트법, 핵심요인 기술법 등의 위험성평가 방법들을 담았다. 또한 위험성의 빈도·강도를 계량적으로 산출하지 않고도 위험성평가를 실시할 수 있도록 쉽고 간편한 체크리스트(Checklist), 핵심요인 기술법(OPS; One Point Sheet)*, 위험수준 3단계(저·중·고) 판단법 등의 다양한 방법을 제시하였다.
이러한 개정으로 사업장에서는 보다 자율적인 위험성평가를 수행할 수 있게 되었다. 따라서 사업장별로 특성에 맞추어서 위험성 평가를 실시하는 것이 확산될 것으로 기대된다. 보다 적극적으로 위험성 평가 기반의 직업보건관리를 하고자하는 사업장에서는 빅데이터를 활용한 위험성평가법을 구축하는 것이 바람직할 것이다.
빅데이터를 활용한 산업보건 위험성 평가방법
빅데이터를 활용한 직업건강 위험성 평가에는 대규모 데이터 세트와 고급 분석 기술을 활용하여 작업장의 건강 위험요인을 식별하고, 위험정도를 평가 및 완화하는 작업이 포함된다. 이러한 접근 방식은 직업건강 위험요인에 대한 보다 정확하고 실시간 통찰력을 제공하여 사업장에서 근로자를 위해 보다 안전하고 건강한 작업환경관리 및 건강관리를 수행하는 데 도움이 된다.
다음은 빅데이터를 사용하여 직업건강 위험성 평가를 수행하는 단계별 가이드이다.
- 1. 데이터 수집
-
사업장, 근로자, 건강 결과와 관련된 광범위한 데이터에는 다음이 포함될 수 있다.
- ①근로자 인구통계(연령, 성별, 직무 등)
- ②작업 환경 데이터(화학물질 노출, 소음 수준, 온도 등)
- ③건강 기록(부상 보고서, 병력, 결근 데이터, 건강진단결과 등)
- ④환경 데이터(공기질, 방사선 수준 등)
- ⑤장비 및 기계 데이터(유지보수 기록, 사용 데이터 등)
- ⑥인적 자원 데이터(직원 이직률, 교육 기록 등)
- ⑦센서, 전자 건강 기록, 인사(HR) 데이터베이스, 정부 건강 통계와 같은 외부 자료원 등
- 2. 데이터 통합
-
다양한 자료원의 데이터를 중앙 집중식 데이터베이스 또는 데이터 웨어하우스로 결합하고 통합한다. 데이터 통합은 출처가 다양한 데이터를 단일화되고 가치 있는 데이터 뷰로 통합하여 사용자가 빠르게 현명한 결정을 내릴 수 있도록 하는 프로세스이다. 이러한 데이터 정리 및 표준화는 데이터 품질과 일관성을 보장한다. 데이터 통합을 통해 모든 종류(구조화, 비구조화, 일괄 처리, 스트리밍)의 데이터를 취합하여 인벤토리 데이터베이스의 기본 쿼리에서 복잡한 예측 분석에 이르기까지 모든 작업을 수행할 수 있게 된다.
빅데이터, 사물 인터넷(IoT), Software as a service(SaaS), 클라우드 활동 등으로 인해 데이터 소스의 수가 폭발적으로 증가하고 전 세계에 존재하는 데이터의 양은 수직 증가하고 있다. 이러한 데이터 대부분은 독립된 사일로나 별도의 데이터 저장소에 수집 및 저장되어왔다. 데이터 통합은 데이터에서 더 높은 가치를 창출하고 유용한 정보를 얻기 위해 이러한 개별 데이터의 수집을 통합하는 프로세스이다.
운영을 개선하고, 고객만족도를 높이고, 점점 더 디지털화되는 세상에서 경쟁력을 갖추기 위해서는 모든 데이터에 대한 통계가 필요하기에 디지털 혁신 전략을 모색하고 있는 조직이라면 데이터 통합이 특히 중요하다.
이에 다양한 데이터 통합을 위한 솔루션이 개발 및 제시되고 있다. 예를 들어서 Google Cloud의 데이터 통합 솔루션인 Cloud Data Fusion은 사용자가 ETL/ELT 데이터 파이프라인을 효율적으로 구축하고 관리할 수 있도록 지원하는 클라우드 기반의 완전 관리형 데이터 통합 서비스이다.
이에 직업보건영역의 숙련된 빅데이터 전문가의 양성과 확보가 필요하지만 숙련된 직업보건영역의 데이터 전문가를 찾기가 어렵다는 것이 도전과제이다. 직업보건관리를 위한 의사결정을 내리기 위해 데이터에 액세스해야 할 때 종종 이러한 전문가의 도움을 필요로 하므로 데이터 분석을 통해 가치를 실현하는 데 지체가 되고 있다. 또한, 직업보건영역의 데이터 통합 이니셔티브에 필요한 인프라를 조달, 배포, 유지보수 및 관리할 때는 자본 지출과 운영 지출이 모두 추가로 발생한다. 따라서 국가단위에서 직업보건영역의 관리형 서비스로서 제공되는 클라우드 기반 데이터 통합을 선제적으로 구축하여 개별 사업장에서 데이터 통합에 지출될 비용 문제를 직접적으로 해결하는 것이 필요하다.
이렇게 구축할 데이터 통합 플랫폼에는 일반적으로 다음과 같은 다양한 도구가 포함되어야 할 것이다.
- ①데이터 수집 도구: 데이터를 확보하고 가져와서 즉시 사용하거나 나중에 사용하기 위해 저장할 수 있다.
- ②ETL 도구: ETL은 가장 일반적인 데이터 통합 방법인 추출(Extract), 변환(Transform), 로드(Load)를 나타낸다.
- ③데이터 카탈로그: 직업보건영역의 여러 데이터 사일로에 흩어져 있는 데이터 애셋을 찾고 인벤토리를 작성하는 데 유용하다.
- ④데이터 거버넌스 도구: 데이터의 가용성, 보안, 사용성 및 무결성을 보장하는 도구이다.
- ⑤데이터 정리 도구: 더티 데이터를 교체, 수정 또는 삭제 방법으로 정리하는 도구이다.
- ⑥데이터 마이그레이션 도구: 이 도구는 컴퓨터, 스토리지 시스템 또는 애플리케이션 형식 간에 데이터를 이전한다.
- ⑦마스터 데이터 관리 도구: 기업이 공통된 데이터 정의를 준수하고 단일 정보 소스를 실현할 수 있도록 지원하는 도구이다.
- ⑧데이터 커넥터: 데이터베이스 간에 데이터를 이동하며 변환을 수행할 수도 있다.
데이터 통합은 일반적으로 다음 작업을 수행하는 데 사용될 것이다.
- ①데이터 레이크 개발: 데이터 통합을 통해 고립된 온프레미스 플랫폼에서 데이터 레이크로 데이터를 이전하여 데이터의 가치를 높일 수 있다.
- ②데이터 웨어하우징: 데이터 통합을 통해 다양한 소스의 데이터를 하나의 데이터 웨어하우스에 결합하여 직업보건관리 목적으로 분석할 수 있다.
- ③통합관리: 데이터 통합을 통해 근로자의 인구통계, 소셜 네트워킹, 웹로그 분석 데이터 등의 모든 데이터를 분석 및 작업 수행을 위해 한 곳으로 이전할 수 있다.
- ④사물인터넷(IoT): 데이터 통합은 여러 IoT 소스의 데이터를 한곳에 수집하여 데이터의 가치를 실현하는 데 유용하다.
- ⑤데이터베이스 복제: 데이터 통합은 Oracle, MongoDB, MySQL 같은 소스 데이터베이스에서 클라우드 데이터 웨어하우스로 데이터를 복제하는 데 있어 핵심적인 요소이다.
결론
빅데이터를 이용한 직업건강 위험성 평가 수행 단계별 가이드를 제시하기 위하여 데이터 수집과 통합단계까지 살펴보았다. 다음으로는 데이터 분석과 위험요인 식별, 노출평가 등으로 위험도 평가의 단계별 가이드를 살펴볼 것이다.
이번 호에서는 다양한 자료원의 데이터 통합을 소개하였다. 개별기업이 산재해 있는 직업보건 데이터들을 수집해서 통합하려면 많은 비용지출이 필요하지만, 무엇보다도 관련된 전문가를 찾아서 활용하는 것이 쉽지 않다. 이에 국가에서 직업보건 영역의 데이터 통합 플랫폼을 구축하는 사업을 하는 것이 필요하다.