Vol.30 No.3 2023 May
지난호 보기
직업건강 이야기

연속기획

  • 웹진
  • 직업건강 이야기
  • 연속기획
  • band
  • blog
  • kakao
  • facebook
  • youtube
  • insta

본문

직업보건영역에서 빅데이터의 분석

글. 김수근

  • 의학박사/직업환경의학전문의
img

서론

지금까지 직업보건의 빅데이터의 정의와 AI의 관계 및 수집·저장·관리 방법 등 빅데이터의 활용 등에 대해서 알아보았다.
이 번호에는 빅데이터 활용을 위한 분석에 대해서 알아보고자 한다. 대부분의 빅데이터는 방대한 비정형 데이터 세트로 구성되며 일관되지 않은 개별 소스로부터 제공된다. 이러한 빅데이터 분석에 AI와 머신러닝 기술을 적용하지 않으면 모든 기능을 완전히 실현할 수 없다. 빅데이터의 5가지 V 중 하나는 "속도(velocity)"이다. 인사이트가 실행 가능하고 가치 있으려면 신속하게 제공되어야 한다. 분석 프로세스는 정기적으로 자체 최적화되고 경험에서 학습할 수 있어야 하며 이는 AI 기능과 최신 데이터베이스 기술로만 달성할 수 있다.

빅데이터 분석

빅데이터 분석은 직업보건의 추세, 위험요인의 패턴, 작업자 위치 및 행동 등을 파악하여 더 나은 안전과 건강을 위한 의사결정을 제공하기 위해 크고 복잡한 데이터 소스를 분석하는 프로세스이다.
빅데이터 분석이란 다양한 소스에서 다양한 크기의 정형·반정형 및 비정형 데이터를 포함하는 매우 방대하고 다양한 데이터 세트에 대해 고급 분석 기술을 사용하는 것이다.
빅데이터 분석의 복잡성으로 인해 예측 분석, 머신 러닝, 스트리밍 분석, 데이터베이스 내 및 클러스터 내 분석과 같은 기술을 비롯한 다양한 방법이 필요하다. 빅 데이터 분석은 데이터 입력량이 너무 방대해지고 거대해져 여러 소스에서 들어오는 모든 데이터를 처리하기 위해 더 큰 컴퓨팅 기능이 필요한 경우 사용한다. 빅데이터의 특성에 맞는 알고리즘과 데이터 모델링을 사용해 의미 있는 데이터를 시각화할 수 있다.
빅데이터 분석을 통해 분석가, 연구자 및 사용자는 액세스나 사용이 불가능했던 데이터를 사용하여 보다 나은 의사결정을 더욱 빠르게 내릴 수 있다. 빅데이터 분석을 사용하여 현재와 미래의 직업보건관리 체계를 구축하고, 이를 통해 데이터 수집과 검색을 완전히 새로운 수준으로 끌어 올릴 수 있다. 빅데이터 분석은 유휴 데이터(기존의 정형 데이터)와 유동하는 데이터(현재의 비정형 데이터)를 결합하여 실시간으로 활용한다. 텍스트 분석, 머신 러닝, 예측 분석, 데이터 마이닝, 통계 및 자연어 처리 등의 고급 분석 기술을 사용함으로써 이전에는 사용되지 않던 데이터 소스에서 독립적으로 또는 기존의 데이터와 함께 새로운 통찰력(insights)을 얻을 수 있다.
빅데이터 분석은 센서, 모바일 장치, 웹 클릭 스트림 및 트랜잭션과 같은 급증하는 소스에서 들어오는 빅데이터의 속도가 빨라지는 것이며 실시간 분석이 필요하다. 현재 일어나고 있는 상황을 활용하여 장비 고장을 방지하고, 사고를 예측하여 대응방법을 추천하며, 위험요인의 노출 추세의 변동을 파악해 작업자의 위험 상황을 식별할 수 있는 사업장은 미래의 직업보건관리의 우수하고 새로운 표준이 될 것이다. 왜냐하면 직업건강관리분야의 전문가와 관리자들은 빅데이터 분석으로 보다 정확하고 증거에 기반한 평가를 내릴 수 있기 때문이다. 또한, 빅데이터로 근로자들의 건강상태 동향을 파악하고 위험성평가를 실시하며 불필요한 서류작업들을 최소화하여 현장 중심의 활동을 할 수 있다.
직업건강관리분야의 전문가와 관리자들은 빅데이터를 분석해 이전에는 가능하지 않았던 직업건강관리 방식으로 빅데이터와 데이터 과학의 툴과 리소스를 활용할 수 있게 된다.

01인공지능의 활용

빅데이터와 인공지능(AI) 사이에는 밀접한 관계가 있다. AI는 직업건강에 대한 빅데이터와 같은 대량의 복잡한 데이터에서 통찰력을 분석하고 추출하는 데 사용될 수 있다. 기계 학습, 자연어 처리 및 컴퓨터 비전과 같은 AI 기술을 활용하여 사업장에서는 데이터의 숨겨진 패턴과 관계를 밝혀내고 예측 모델을 개발하여 새로운 위험과 개선 기회를 식별할 수 있다.
예를 들어, AI는 근로자 보상 청구 데이터를 분석하여 작업장 부상 및 질병과 관련된 추세와 패턴을 식별하는 데 사용될 수 있다. AI의 대량 데이터 분석으로 사고의 근본 원인식별 및 예측 모델 개발을 통해 고위험 시나리오를 식별하고, 향후 사고 예방을 위해 중재 우선순위를 정하게 된다.
마찬가지로, AI는 건강 검진 데이터를 분석하여 호흡기 질환 또는 근골격계 장애와 같은 직업성 질환의 조기 경고 신호를 식별하는 데 사용될 수 있다. AI의 대량의 데이터 분석으로 위험 요인 식별·평가를 하여 예측 모델을 개발하고 직업성 질병이 발병할 위험이 가장 높은 근로자를 식별하는 등 예방 및 관리를 위한 목표· 중재 방법 개발을 할 수 있게 된다.
전반적으로, 직업보건을 위한 빅데이터와 AI의 조합은 사업장에 건강 및 안전 결과를 주도하는 요인에 대한 귀중한 통찰력을 제공하고, 직장 건강 및 안전을 개선하기 위한 데이터 중심 전략을 개발함으로써 직장 건강 및 안전을 변화시킬 수 있는 잠재력을 가지고 있다.

02머신러닝의 훈련을 위한 빅데이터

머신러닝 알고리즘은 유입되는 데이터를 정의하며 데이터 내에서 패턴을 식별한다. 이러한 인사이트는 직업보건관리를 위한 의사결정에 대한 정보를 제공하고 프로세스를 자동화하는 데 도움이 된다. 데이터 세트에 대한 분석이 막강해질수록 시스템의 프로세스 학습과 지속적인 진화 및 적응 기회가 증가하므로 머신러닝은 빅데이터를 토대로 한다.
빅데이터 외에도 AI와 머신러닝 알고리즘을 훈련하는데 ‘스몰 데이터’를 갈수록 더 많이 사용하고 있다. 이 작은 데이터 세트는 간과되기 쉽지만, 가치 있는 정보를 담고 있을 수 있다. 궁극적으로 알고리즘이 더 많은 자료를 통해 학습할수록 더 우수한 결과를 얻게 된다.

03위험성 평가의 실행

빅데이터 분석을 통하여 직업보건의 위험성평가 자산을 어떻게 수행할 수 있을까? 직업 건강에 대한 위험성 평가를 수행하려면 작업장의 잠재적 위험을 식별하고 이러한 위험과 관련된 위험을 평가하는 것이 포함된다.
빅데이터는 잠재적 위험을 식별하고 위험을 평가하는 데 사용되는 많은 양의 데이터 및 정보에 대한 액세스를 제공함으로써 직업 건강의 위험 평가를 위한 귀중한 도구가 될 수 있다.
다음은 산업 보건의 위험 평가를 위해 빅데이터를 적용하는 몇 가지 방법이다.

  • 1) 작업장 위험에 대한 데이터 수집 및 분석

    빅데이터는 화학 물질 노출 또는 물리적 스트레스 요인과 같은 작업장 위험에 대한 데이터를 수집하고 분석하는 데 사용될 수 있다. 이 정보는 작업장 위험의 추세와 패턴을 식별하고 위험성 평가 영역의 우선순위로 정하는 데 사용될 수 있다.

  • 2) 작업장 위험의 건강 영향 평가

    빅데이터는 직업성 질환 또는 부상의 발생률과 같은 사업장 위험요인의 건강 영향을 평가하는 데 사용될 수 있다. 이 정보는 작업장 위험과 관련된 위험을 평가하고 통제 조치에 대한 영역을 우선시하는 데 사용될 수 있다.

  • 3) 제어방법에 대한 데이터 모니터링 및 분석

    빅데이터를 사용하여 작업장 위험을 줄이기 위해 구현된 제어방법의 효과에 대한 데이터를 모니터링하고 분석할 수 있다. 이 정보는 제어방법이 효과적이지 않은 영역을 식별하고 효과를 향상시키기 위해 조정하는 데 사용될 수 있다.

  • 4) 예측 분석 사용

    빅데이터를 사용하여 잠재적인 미래 위험과 위험을 식별할 수 있는 예측 모델을 개발할 수 있다. 이 정보는 미래의 위험이 발생하는 것을 막기 위해 사전 제어 조치를 개발하는 데 사용될 수 있다.

빅데이터는 센서, 소셜 미디어 또는 직원 설문 조사와 같은 다양한 데이터 소스를 결합하는 데 사용될 수 있다. 이 정보는 작업장 위험과 포괄적 견해를 제공하여 효과적인 위험성 평가 및 제어를 가능하게 할 수 있다.
전반적으로, 직업 건강의 위험 평가를 위해 빅데이터를 사용하려면 데이터 품질, 개인 정보 및 보안 문제를 신중하게 고려해야 한다. 사용된 데이터가 신뢰할 수 있고 정확하며 조직의 특정 요구와 관련이 있는지 확인하는 것이 중요하다. 또한 데이터의 개인 정보 및 보안을 보호하기 위해 적절한 조치를 취하는 것도 중요하다.

결론

빅데이터가 제공하는 인사이트는 거의 모든 직업보건에 도입 효과를 제공할 수 있다. 특히 직업건강관리를 개선하는 실행 가능한 인사이트를 제공하는 경우에 효과가 있다.
빅데이터로 직업건강관리를 준비하는 사업장은 시스템과 프로세스가 빅데이터 수집, 저장, 분석에 충분히 준비되어 있는지 확인해야 한다. 무엇보다도 데이터의 소스와 품질을 신중하게 평가하여 특정 요구 사항 및 요구 사항을 충족하는지 확인하는 것이 중요하다. 이러한 빅데이터를 구축하고 정리하면 직업건강위험과 관련된 패턴과 추세를 식별하기 위한 분석을 시작할 수 있다. 여기에는 통계 방법, 데이터 시각화 도구 및 기계 학습 알고리즘을 사용하여 상관관계를 식별하고 향후 결과를 예측하는 것이 포함될 수 있다.
빅데이터를 분석한 후 평가 중인 특정 산업 건강 위험의 맥락에서 결과를 해석하는 것이 중요하다. 여기에는 주제별 전문가와 협력하여 작업장 건강 및 안전에 대한 데이터의 의미를 이해하고 적절한 제어 조치를 식별하는 것이 포함될 수 있다. 이처럼 빅데이터 분석을 구현하면 직업보건관리의 많은 기회를 얻을 수 있다.
이후부터는 빅데이터를 정기적으로 모니터링하고 업데이트해야 한다. 시간이 지남에 따라 데이터를 모니터링하고 업데이트하여 현재와 관련성이 유지되는 것이 중요하기 때문이다.