[논문]Reed - Frost 모형을 이용한 전염병 감염 확률 추정

엄은진; 황진섭; 최보승

doi:10.7465/jkdi.2017.28.1.57

Reed - Frost 모형을 이용한 전염병 감염 확률 추정
An estimation method of probability of infection using Reed - Frost model 원문보기

Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지, v.28 no.1, 2017년, pp.57 - 66

엄은진 (대구대학교 대학원 통계학과) , 황진섭 (대구대학교 전산통계학과) , 최보승 (고려대학교 응용통계학과)

초록
AI-Helper

질병의 확산 과정을 설명하기 위한 모형으로 가장 대표적인 방법은 Kermack과 McKendrick (1927)에 의해 제안된 SIR (susceptible - infectious - recovered) 모형이다. SIR 모형을 구축하기 위해서는 질병의 감염률 (transition rate)과 회복률 (recovery rate)이 주어져 있거나 질병의 전체 확산 과정이 데이터로 주어진 경우 추정을 통하여 구할 수 있다. 하지만 데이터가 제한적으로 관찰된 경우 직접적인 감염률와 회복률의 계산이 불가능 하다. 본 연구에서는 관찰된 자료가 가지는 한계점을 고려하여 질병의 초기 확산과정에서 질병 감염 확률을 추정하기 위하여 리드-프로스트 (Reed-Frost) 모형 (Andersson과 Britton, 2000)을 적용하였다. 리드-프로스트 모형은 질병의 최초 감염자 수, 최종 감염자 수, 그리고 최초 감염대상자의 수가 주어졌을 때 이를 통하여 감염 확률을 추정하기 위한 모형이다. 본 연구에서는 서아프리카의 카메룬 공화국에서 조사된 역학 조사 자료를 이용하여 콜레라의 초기 감염 확률을 추정하였다. 그리고 추정된 결과를 이용하여 다시 SIR 모형에 적용하여 질병의 확산 경로에 대한 예측을 수행하였다. 예측 결과 조사 지역의 주민 가운데 50% 이상이 감염될 것으로 예측되었으며 질병의 전파는 약 한달 정도 지속될 것으로 예측 되었다.

Abstract ▼ AI-Helper

SIR model (Kermack and McKendrik, 1927) is one of the most popular method to explain the spread of disease, In order to construct SIR model, we need to estimate transition rate parameter and recovery rate parameter. If we don't have any information of the two rate parameters, we should estimate using observed whole trajectory of pandemic of disease. Thus, with restricted observed data, we can't estimate rate parameters. In this research, we introduced Reed-Frost model (Andersson and Britton, 2000) to calculate the probability of infection in the early stage of pandemic with the restriction of data. When we have an initial number of susceptible and infected, and a final number of infected, we can apply Reed - Frost model and we can get the probability of infection. We applied the Reed - Frost model to the Vibrio cholerae pandemic data from Republic of the Cameroon and calculated the probability of infection at the early stage. We also construct SIR model using the result of Reed - Frost model.

주제어

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

그리고 키우고 있는 가축으로부터 표본을 추출하여 오염 및 감염여부를 함께 조사 하였다. 건강상태에 대해서는 조사 시점 30일 동안의 위장 증상을 경험하였는지에 대한 질문을 수행하였다. 설사, 피 묻은 설사, 복부 경련, 구토, 메스꺼움 또는 발열등의 현상을 조사를 진행하였다.
그리고 추정된 감염 확률과 관찰된 데이터의 전체 인구수와 전염병 감염자수 등과의 정보를 조합하여 SIR 모형의 구축이 가능하다. 관찰된 자료에 이용한 리드-프로스트 모형의 적합 방법을 알아보자.
본 연구에서는 서아프리카 카메룬 공화국에서 직접 조사된 수인성 전염병인 콜레라 관련 데이터를 이용하여 질병의 초기 시점에서의 감염 확률을 계산한 후 관찰된 데이터와 추가적인 문헌 조사 값을 통하여 SIR 모형을 구축하고자 하였다. 질병의 확산과정의 초기 시점 데이터, 즉 횡단면 자료가 가지는 한계를 극복하고 가구 안에서의 질병 이동 경로를 파악할 수 있다는 장점을 활용하여 리드-프로스트 모형을 적용하여 초기 추정치를 추정하였다.
본 연구의 목적은 역학 조사 자료를 이용하여 수인성 전염병 가운데 하나인 콜레라의 확산과정을 설명하기 위한 모형을 구축하는데 그 목적이 있다. 특히 질병 발생의 초기 시점에서 수집된 자료를 이용하여 질병의 초기 확률을 추정하고 초기 추정값을 활용하여 질병 발생 모형을 구축해 보고자 한다.
본 연구의 목적은 역학 조사 자료를 이용하여 수인성 전염병 가운데 하나인 콜레라의 확산과정을 설명하기 위한 모형을 구축하는데 그 목적이 있다. 특히 질병 발생의 초기 시점에서 수집된 자료를 이용하여 질병의 초기 확률을 추정하고 초기 추정값을 활용하여 질병 발생 모형을 구축해 보고자 한다.

가설 설정

전염병의 전파 과정을 모형화 하는데 있어서 가장 대표적인 방법은 Kermack와 McKendrick (1927)에 의해 제안된 SIR 모형이다. SIR 모형은 모든 구성원들이 접촉 가능하고, 두 구성원들 사이에서 전염이 발생할 가능성이 동일하다고 가정한다. SIR 모형은 전염병 유행의 전체 모집단을 크게 3 집단으로 구분한 후 이 집단간의 이동을 모형화 하여 전염병의 초기 전파과정을 설명하기 위하여 제안된 모형이다.

제안 방법

질병의 확산과정의 초기 시점 데이터, 즉 횡단면 자료가 가지는 한계를 극복하고 가구 안에서의 질병 이동 경로를 파악할 수 있다는 장점을 활용하여 리드-프로스트 모형을 적용하여 초기 추정치를 추정하였다. 구축된 우도함수로부터 초기 발생 확률의 최대 우도 추정치를 계산하였다. 리드-프로스트 모형은 상대적으로 간단한 형태의 질병 예측 모형이라 할 수 있다.
4)을 이용하여 초기시점에서의 전염병 감염 확률을 추정하고자 하였다. 그리고 문헌조사를 통하여 추가적인 모수의 정보를 구한 후 이를 가지고 전염병 모형을 구축하기 위한 SIR 모형을 구축하였다.
수인성 전염병인 콜레라의 특성을 파악하기 위하여 가정용 저장 용기 및 식수원에서 표본을 수집하였다. 그리고 키우고 있는 가축으로부터 표본을 추출하여 오염 및 감염여부를 함께 조사 하였다. 건강상태에 대해서는 조사 시점 30일 동안의 위장 증상을 경험하였는지에 대한 질문을 수행하였다.
건강상태에 대해서는 조사 시점 30일 동안의 위장 증상을 경험하였는지에 대한 질문을 수행하였다. 설사, 피 묻은 설사, 복부 경련, 구토, 메스꺼움 또는 발열등의 현상을 조사를 진행하였다. 전반적으로 문맹률이 낮은 지역이기 때문에 모든 조사는 사전 동의를 통하여 구두로 조사한 후 이를 문서화 하였다.
이제 계산된 초기 질병 발생 확률을 이용하여 SIR 모형을 구축하여 보자. 시물레이션을 이용하여 식(1.
설사, 피 묻은 설사, 복부 경련, 구토, 메스꺼움 또는 발열등의 현상을 조사를 진행하였다. 전반적으로 문맹률이 낮은 지역이기 때문에 모든 조사는 사전 동의를 통하여 구두로 조사한 후 이를 문서화 하였다. 본 연구에서는 이 가운데 질병의 발생 정보가 모두 제공되고 있는 DOU, DOM 두 마을의 데이터를 이용하여 분석을 진행하였다.
실제 조사는 가구 단위로 총 120개의 가구를 대상으로 조사가 수행되었다. 지도상에 표시된 가구에 대하여 무작위 추출을 통하여 표본 가구가 선택되었고 각 가구로부터 기본적인 인구 통계 뿐만 아니라 각종 건강 상태에 대하여 면접 조사를 수행하였다. 수인성 전염병인 콜레라의 특성을 파악하기 위하여 가정용 저장 용기 및 식수원에서 표본을 수집하였다.
본 연구에서는 서아프리카 카메룬 공화국에서 직접 조사된 수인성 전염병인 콜레라 관련 데이터를 이용하여 질병의 초기 시점에서의 감염 확률을 계산한 후 관찰된 데이터와 추가적인 문헌 조사 값을 통하여 SIR 모형을 구축하고자 하였다. 질병의 확산과정의 초기 시점 데이터, 즉 횡단면 자료가 가지는 한계를 극복하고 가구 안에서의 질병 이동 경로를 파악할 수 있다는 장점을 활용하여 리드-프로스트 모형을 적용하여 초기 추정치를 추정하였다. 구축된 우도함수로부터 초기 발생 확률의 최대 우도 추정치를 계산하였다.
총 조사기간은 2개월이지만 마을 별로는 각각 한달 동안 조사가 이루어 졌으며 조사 기간에 질병이 발생한 시기와 발생한 사람의 정보를 각각 기록해 놓았다. 각각의 가구를 관찰 단위로 하였을 때 가구 안에서 질병의 발생 및 전파 정도를 정확히 파악할 수 있다.

대상 데이터

본 연구는 전염병의 초기 감염 확률을 추정하기 위하여 서아프리카에 위치한 카메룬 공화국의 Maroua 지역의 건강 조사 자료를 이용하였다 (Profitos 등, 2014). 그 들의 연구에 의하면 설문조사 데이터는 2013년 6월 1일부터 8월 1일까지 Maroua지역의 네 군데 마을을 대상으로 하여 조사 되었다. 이 기간은 해당 지역의 우기의 시작 시점과 일치하고 네 군데 마을의 선정은 지난 2009년과 2011년에 걸쳐 창궐한 콜레라 발생률을 기준으로 선정하였다.
본 연구는 전염병의 초기 감염 확률을 추정하기 위하여 서아프리카에 위치한 카메룬 공화국의 Maroua 지역의 건강 조사 자료를 이용하였다 (Profitos 등, 2014). 그 들의 연구에 의하면 설문조사 데이터는 2013년 6월 1일부터 8월 1일까지 Maroua지역의 네 군데 마을을 대상으로 하여 조사 되었다.
본 연구에서 적용한 수인성 전염병 가운데 하나인 콜레라 데이터를 이용한 것이다. 수인성 전염병 이기 때문에 사람에 의해서 전파되는 것 뿐 만 아니라 불결한 환경에 의해서 전파의 가능성이 높은 질병이다.
전반적으로 문맹률이 낮은 지역이기 때문에 모든 조사는 사전 동의를 통하여 구두로 조사한 후 이를 문서화 하였다. 본 연구에서는 이 가운데 질병의 발생 정보가 모두 제공되고 있는 DOU, DOM 두 마을의 데이터를 이용하여 분석을 진행하였다.
지도상에 표시된 가구에 대하여 무작위 추출을 통하여 표본 가구가 선택되었고 각 가구로부터 기본적인 인구 통계 뿐만 아니라 각종 건강 상태에 대하여 면접 조사를 수행하였다. 수인성 전염병인 콜레라의 특성을 파악하기 위하여 가정용 저장 용기 및 식수원에서 표본을 수집하였다. 그리고 키우고 있는 가축으로부터 표본을 추출하여 오염 및 감염여부를 함께 조사 하였다.
전체 785명의 개인에 대하여 건강 상태에 대한 자료 수집이 이루어 졌다. 실제 조사는 가구 단위로 총 120개의 가구를 대상으로 조사가 수행되었다. 지도상에 표시된 가구에 대하여 무작위 추출을 통하여 표본 가구가 선택되었고 각 가구로부터 기본적인 인구 통계 뿐만 아니라 각종 건강 상태에 대하여 면접 조사를 수행하였다.
그 들의 연구에 의하면 설문조사 데이터는 2013년 6월 1일부터 8월 1일까지 Maroua지역의 네 군데 마을을 대상으로 하여 조사 되었다. 이 기간은 해당 지역의 우기의 시작 시점과 일치하고 네 군데 마을의 선정은 지난 2009년과 2011년에 걸쳐 창궐한 콜레라 발생률을 기준으로 선정하였다. 전체 785명의 개인에 대하여 건강 상태에 대한 자료 수집이 이루어 졌다.

이론/모형

전체 확산 및 소멸과정의 데이터가 주어져 있지 않기 때문에 각종 반응 상수를 직접적으로 추정할 수 없다. 본 연구에서는 이러한 한계를 극복하기 위하여 리드-프로스트 (Reed-Frost) 모형(Anderson과 Britton, 2000, P. 4)을 이용하여 초기시점에서의 전염병 감염 확률을 추정하고자 하였다. 그리고 문헌조사를 통하여 추가적인 모수의 정보를 구한 후 이를 가지고 전염병 모형을 구축하기 위한 SIR 모형을 구축하였다.

성능/효과

수집된 질병의 확산 자료가 충분한 시간을 가지고 수집되어 전체적인 질병의 확산경로를 파악할 수 있도록 수집되었다면 SIR 모형과 같은 질병 확산 모형에 적용하여 모형의 구축이 가능할 것이다. 그러나 본 연구에서 수집된 자료는 이와는 달리 단기간에 수집된 횡단면 자료라 볼 수 있으며 리드-프로스트 모형을 이용한 발생 확률 추정이 보다 적절할 수 있다. 그리고 추정된 감염 확률과 관찰된 데이터의 전체 인구수와 전염병 감염자수 등과의 정보를 조합하여 SIR 모형의 구축이 가능하다.
그러나 본 연구에서 수집된 자료는 이와는 달리 단기간에 수집된 횡단면 자료라 볼 수 있으며 리드-프로스트 모형을 이용한 발생 확률 추정이 보다 적절할 수 있다. 그리고 추정된 감염 확률과 관찰된 데이터의 전체 인구수와 전염병 감염자수 등과의 정보를 조합하여 SIR 모형의 구축이 가능하다. 관찰된 자료에 이용한 리드-프로스트 모형의 적합 방법을 알아보자.
그 사이에 굵은 점선으로 표시된 부분은 회복군을 나타낸다. 이 모의실험의 결과를 해석하면 조사가 이루어진 Maroua지역에서는 대략적으로 25일 이상 질병이 지속되며 전체 지역 주민가운데 절반 이상에 해당하는 270명 정도가 증상을 보일 것으로 예상된다.
문명의 발달과 전염병의 전파범위와 발생빈도는 비례하기 때문이다. 질병의 역사와 발생의 연구를 보면, 문명화된 인류는 원시시대의 인류보다 훨씬 더 다양하고 복잡한 형태의 질병들에 시달리는 것으로 나타났다. 다시 말하자면 문명화 된 생활이 발달하면 할수록 더 많은 전염병에 시달리게 된다는 것이다.

후속연구

반응 상수의 경우 과거의 문헌 연구를 통하여 제공받거나 전염병의 확산과정의 전체 과정 (trajectory)이 관찰되었다면 이를 이용하여 추정할 수 있을 것이다. 그러나 본 연구에서 이용한 자료는 특정지역에서 조사된 전염병의 초기 확산과정의 초기 자료로 제한되어 있다. 전체 확산 및 소멸과정의 데이터가 주어져 있지 않기 때문에 각종 반응 상수를 직접적으로 추정할 수 없다.
하지만 주어진 자료의 한계점과 장점을 최대한 활용하여 적합하는데 그 의의가 있다고 할 수 있다. 따라서 본 연구에서 제시된 방법을 이용하여 초기 발생 확률을 계산한 후 본격적으로 질병 확산 모형을 구축하는데 초기 정보로 활용될 수 있을 것이다.
각 집단의 초기치는 관찰 혹은 조사를 통하여 구할 수 있다. 반응 상수의 경우 과거의 문헌 연구를 통하여 제공받거나 전염병의 확산과정의 전체 과정 (trajectory)이 관찰되었다면 이를 이용하여 추정할 수 있을 것이다. 그러나 본 연구에서 이용한 자료는 특정지역에서 조사된 전염병의 초기 확산과정의 초기 자료로 제한되어 있다.
많은 경우에 있어서 질병 확산 모형 구축을 위하여 이용되는 자료들은 광범위한 지역에서 질병의 초기 발생 단계부터 어느 정도 시간이 흐른 후에 확산과정이 진정되고 더 이상 전파가 이루어지지 않은 이후의 자료를 이용하는 것이 보다 일반적이다. 수집된 질병의 확산 자료가 충분한 시간을 가지고 수집되어 전체적인 질병의 확산경로를 파악할 수 있도록 수집되었다면 SIR 모형과 같은 질병 확산 모형에 적용하여 모형의 구축이 가능할 것이다. 그러나 본 연구에서 수집된 자료는 이와는 달리 단기간에 수집된 횡단면 자료라 볼 수 있으며 리드-프로스트 모형을 이용한 발생 확률 추정이 보다 적절할 수 있다.
따라서 질병의 확산 과정을 구축하는데 있어서 식수원의 오염 정도나 가축의 감염도 인간의 감염에 영향을 미칠 수 있다. 향후 연구를 통하여 이러한 환경 요인을 함께 고려한 질병 확산 모형의 구축을 수행해 볼 수 있을 것이다.

질의응답

핵심어	질문	논문에서 추출한 답변
	전염병이란 무엇인가?	전염병은 세균, 기생충, 바이러스와 같은 다양한 병원체에 의해 감염되어 발병하는 질환이다. 병원체에 의한 감염은 다른 사람과의 접촉, 음식과 물의 섭취, 호흡에 의한 병원체의 흡입 등 여러 경로를 통해 발생한다.
	에볼라는 어떤 질환인가?	최근에는 광우병, 구제역, 사스 (SARS), 인플루엔자에 이어 에볼라, 메르스 (MERS), 지카 바이러스, 콜레라 등 각종 전염병이 전역을 위협하고 있다. 에볼라는 아프리카를 중심으로 일어나고 있고 메르스는 중동호흡기 질환이다. 에볼라는 치사율이 약 90%가 넘는 전염병으로 질병 발생 시 사망할 확률이 높다.
	수인성 전염병의 집단발생은 어떤 것에 의하는가?	수인성 전염병은 물과 식품이 전염성 있는 병원성 미생물에 오염되어 발생하는 질환으로 콜레라, 세균성이질, 장티푸스 등의 법정전염병을 의미한다 (Lim, 2007). 감염성 수인성 질환의 집단발생은 물, 식품 등의 공동매개체에 의한다. 오염된 물을 직접 섭취하거나 오염된 물로 조리한 식품에서 콜레라균, 살모넬라균등이 발생할 수 있는 것이다.

참고문헌 (23)

Abbey, H. (1952). An examination of the Reed-Frost theory of epidemics. Human Biology, 24, 201-233.

상세보기
Andersson, H. and Britton, T. (2000). Stochastic epidemic models and their statistical analysis, Springer, New York.
Bernoulli, D. and Blower, S. (2004). An attempt at a new analysis of the mortality caused by smallpow and of the advantages of inoculation to prevent it. Reviews in Medical Virology, 14, 275-288.

상세보기
Brauer, F. and Castillo-Chavez, C. (2001). Mathematical models in population biology and epidemiology, Springer, New York.
Choi, B. and Rempala, G. A. (2012). Inference for discretely observed stochastic kinetic networks with applications to epidemic modeling. Biostatistics, 13, 153-165.

상세보기
Daley, D. J. and Gany, J. (2005). Epidemic Modeling: An Introduction, Cambridge University Press, New York.
Deijfen, M. (2011). Epidemics and vaccination on weighted graphs. Mathematical biosciences, 232, 57-65.

상세보기
Eisenberg, M. C., Robertson, S. L. and Tien, J. H. (2012). Identifiability and estimation of multiple transmission pathways in cholera and waterborne disease. Journal of Theoretical Biology, 324, 84-102.
Gillespie, D. T. (1977). Exact stochastic simulation of coupled chemical reactions. The Journal of Physical Chemistry, 81, 2340-2361.

상세보기
Hoops, S., Sahle, S., Gauges, R., Lee, C., Pahle, J., Simus, N., Singhal, M., Xu, L., Mendes, P. and Kummer, U. (2006). COPASI-a complex pathway simulator. Bioinformatics, 22, 3067-3074.

상세보기
Hwang, N. A., Jeong, B. Y., Lim, Y. C. and Park, J. S. (2007). Diseases data analysis using sir nonlinear regression model. Journal of The Korean Data Analysis Society, 9, 49-59.
Kermack, W. O. and McKendrick, A. G. (1927). A contribution to the mathematical theory of epidemics. Proceedings of the Royal Society A: Mathematical Physical and Engineering Sciences, 115, 700-721.

상세보기
Kim, C. S. (2010). Development and evaluation of influenza confinement strategy using mathematical estimating model, Final report, Korea Centers for Disease Control & Prevention, Osong, Korea.
Lee, J. H., Murshed, M. S. and Park, J. S. (2009). Estimation of infection distribution and prevalence number of Tsutsugamushi fever in Korea. Journal of the Korean Data & Information Science Society, 20, 149-158.
Lim, H. (2007). Contributing factors of infectous waterborne and foodborne outbreaks in Korea. Journal of the Korean Medical Association, 50, 582-591.

상세보기
Lim, Y., Do, M. and Choi, B. (2016). A construction of susceptible - infected - removed model using Korean MERS pandemic data. Journal of the Korean Data Analysis Society, 18, 105-115.
Mendes, P., Hoops, S. and Gauges, R. (2009). Computational modeling of bochemical networks using COPASI. Methods in Molecular Biology-Clifton then Totowa, 500, 17-60.
Neurirth, E., Arganbright, D. (2004). The active modeler: Mathematical modeling with Microsoft Excel, Tnomson Brooks/Cde, Belmont.
Profitos, M., Mouhaman, A., Lee, S., Garabed, R., Moritz, M., Piperata, B., Tien, J., Bisesi, M. and Lee, J. (2014). Muddying the Waters: A new area of concern for drinking water contamination in Cameroon. International Journal of Environmental Research and Public Health, 11, 12454-12526.

상세보기
Ryu, S. and Choi, B. (2015). Development of epidemic model using the stochastic method. Journal of the Korean Data & Information Science Society, 26, 301-312.

원문보기 상세보기
Schaber, J. (2012). Easy parameter identifiability analysis with COPASI. Bio systems, 110, 183-185.

상세보기
Seo, M. and Choi, B. (2015). An estimation method for stochastic epidemic model. Journal of the Korean Data Analysis Society, 17, 1247-1259.
Trottier, H. and Philippe, P. (2001). Deterministic modeling of infectious diseases: Theory and methods. The Internet Journal of Infectious Disease, 1.

저자의 다른 논문 :

LOADING...

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증