수족구병의 발병 예측 모델과 발생 경보 시스템 구축
질병도 빅데이터로 예측하고 막는다
해마다 크고 작은 전염병이 우리 생활을 위협하고 있다. 그 중에서 의료 전문가 과정 우수조가 주목한 것은 수족구병으로, 건강보험심 사평가원의 의료 데이터와 기후, 인구 데이터 등을 결합하여 수족구 병의 발병 예측 모델을 개발하였다. 이는 실시간으로 수족구병을 예 측하거나 경고하여 질병의 감염을 조기에 차단하고 예방을 돕는 시 스템이다.
The Challenges
수족구병(手足口病, hand-foot-and-mouth disease)은 입과 손발에 물집이 생기는, 어린이 에게 비교적 흔하게 생기는 급성 바이러스 질환이다. 병의 증세가 워낙 특징적이기 때문에 일반인들도 대부분은 병을 쉽게 파악할 수 있다. 하지만 간혹 손과 발에 생기는 물집의 숫 자가 매우 적거나 물집이 아닌 작고 붉은 일반적인 발진이 생기게 되면 파악이 어려운 경우 도 있다.
이 병은 장바이러스가 몸에 들어와 생긴다. 대개는 증상이 가벼워 열이 없거나 있어도 미열 이다. 입 안의 물집이 터져 궤양이 생기는데, 이렇게 되면 음식을 먹을 때 아프기 때문에 일 시적으로 식사량이 줄었다가 자연히 좋아지는 가벼운 질환이다. 그러나 간간이 전혀 먹지 못하여 탈수가 생기거나, 뇌수막염, 뇌염과 같은 신경계 합병증이 발생해 입원하기도 하며, 극히 일부에서는 생명을 잃는 경우도 생길 수 있기 때문에 주의가 필요한 병이다.
의료 전문가 우수조 구성원들은 대부분 아이들을 키우고 있어 자연스럽게 아이들에 대한 이야기를 나누게 되었다. 그 과정에서 수족구병 때문에 아이들이 유치원이나 어린이집을 못 가거나 다른 아이로부터 전염되어 아이들이 많이 힘들어한다는 점을 공유하게 되었다. 구성원들은 건강보험심사평가원(심평원)의 데이터를 이용하여 수족구병의 발병 예측 모델 을 만들면, 많은 부모와 아이들이 수족구병을 예방하는데 도움이 될 수 있을 것이란 결론에 도달하였다. 이에 다양한 분석기법을 통해 수족구병의 발병 원인을 재검증하고, 발병 예측 모델과 발생 경보 시스템을 만들어 발병 가능성을 사전에 예측하고 대비해 발병률을 낮추 는데 기여하는 것을 목표로 삼았다.
The Approach
1) 데이터 수집과 전처리 과정
구성원들은 프로세스를 기획하고, 데이터 수집부터 착수하였다.

2010년부터 2014년까지 5년의 기간을 정하고 심평원과 기상청, 통계청의 자료를 수집하 였다. 먼저 심평원에서는 요양기관과 질병별 처방 및 수가 데이터를 확보하여 그 중 기관, 시·도, 환자의 성별과 나이 등의 데이터를 집계하였다.
또 신문과 학술논문을 통해 수족구병이 기온 및 습도와 관련이 있다는 것을 알고 기상청에 서 날짜와 지역별 온도, 습도, 풍량, 강수량 등의 날씨정보를 수집하여 주간 단위로 평균기 온, 최저·최고기온, 일강수량, 평균풍속, 상대습도를 집계하였다. 동시에 일교차도 관련이 있을 것으로 보고 최고기온에서 최저기온을 뺀 값으로 일교차 자료를 만들었다.
한편 수족구병은 전염성이 강하여 인구밀도와도 관련이 있을 것으로 보고, 통계청에서 서울과 5개 광역시(부산, 인천, 대구, 광주, 대전)의 0세에서 19세까지의 인구수 데이터 (296,105명)를 모아 0~3세(영아), 4~6세(유아), 7~9세(초등학교 저학년), 10세 이상(초등 학교 고학년)으로 그룹화하였다. 그리고 남녀, 연령, 월별 단위의 통계를 시각화하였다
덧글 남기기