Capture-recapture 방법을 이용한 1998년 제주도 볼거리 유행시 보고 자료의 완전성 평가 Evaluation of the Completeness of Case Reporting during the 1998 Cheju-do Mumps Epidemic, Using Capture-recapture Methods원문보기
Objectives : To estimate mumps incidence during the study period and to evaluate the completeness of case reporting. Methods : Capture-recapture methods, originally developed for counting wildlife animals, were used. The data sources were 1) the National Notifiable Communicable Disease Reporting Sys...
Objectives : To estimate mumps incidence during the study period and to evaluate the completeness of case reporting. Methods : Capture-recapture methods, originally developed for counting wildlife animals, were used. The data sources were 1) the National Notifiable Communicable Disease Reporting System (NNCDRS; 848 cases), 2) the School Health Reporting System, temporarily administered by the Division of Education (SHRS; 1,026 cases), and 3) a survey of students (785 cases). We estimated the number of unobserved mumps cases by matching the three data sources and fitting loglinear models to the data. We then determined the estimated total number of mumps cases by adding this to the number of observed cases. Completeness was defined as the proportion of observed cases from each source to the total of estimated cases. Results : The total number of observed cases was 1,844 and the total number of estimated cases was 1,935 (95%, CI: $1,878\sim2,070$). The overall completeness was 43.8% of the NNCDRS, 53.0% of the SHRS, and 40.6% of the survey. However, completeness varied by area and age. Conclusion : Although the completeness of NNCDRS data appeared higher than in the past, it is difficult to generalize this result In Korea, it is possible to estimate the size of health hazards relatively cheaply and quickly, by applying capture-recapture methods to various data using a multiple data collection system.
Objectives : To estimate mumps incidence during the study period and to evaluate the completeness of case reporting. Methods : Capture-recapture methods, originally developed for counting wildlife animals, were used. The data sources were 1) the National Notifiable Communicable Disease Reporting System (NNCDRS; 848 cases), 2) the School Health Reporting System, temporarily administered by the Division of Education (SHRS; 1,026 cases), and 3) a survey of students (785 cases). We estimated the number of unobserved mumps cases by matching the three data sources and fitting loglinear models to the data. We then determined the estimated total number of mumps cases by adding this to the number of observed cases. Completeness was defined as the proportion of observed cases from each source to the total of estimated cases. Results : The total number of observed cases was 1,844 and the total number of estimated cases was 1,935 (95%, CI: $1,878\sim2,070$). The overall completeness was 43.8% of the NNCDRS, 53.0% of the SHRS, and 40.6% of the survey. However, completeness varied by area and age. Conclusion : Although the completeness of NNCDRS data appeared higher than in the past, it is difficult to generalize this result In Korea, it is possible to estimate the size of health hazards relatively cheaply and quickly, by applying capture-recapture methods to various data using a multiple data collection system.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
1998년 제주도에서 발생한 볼거리 유행 시기(3월 3일부터 8월 31일) 중 3월 3 일부터 6월 20일까지의 유행에 대하여 법정전염병 신고 자료, 교육청 보고 자료 및 역학조사반 환자 조사 자료 등의 3가지 자료원으로부터 발생자를 파악하고, catpure-recapture 방법을 적용하여 전체 환자 발생 규모를 추정하고 법정 전염병 신고자료의 완전성을 평가하고자 하였다.
평가하며, 3) 앞으로 국내 질병감시에서 capture-recapture 방법의 활용에 대해 고찰하고자 한다.
가설 설정
먼저 폐쇄형 인구집단에 대한 가정인데, 제주도는 비교적 고립되고 안정된 지역이며, 또한 볼거리의 임상적 특성이 사망을 일으키거나 위중한 결과로 인해 다른 지역으로의 후송을 필요로 하지 않는다는 점에서 이 가정은 잘 만족시킨다고 할 수 있다.
제안 방법
다시 적합시켜 계층별 N을 추정하고 profile likelihood interval을 구하였다. 그리고 계층별 N의 합을 구하여 전체 발생 건수를 추정하였다.
기초 분석에서 나타난 결과를 토대로 표집 확률의 이질성(heterogeneous catchability)의 원인이 될 수 있는 소집단으로 층화하고, 각 층에 대해 로그 선형모형을 다시 적합시켜 계층별 N을 추정하고 profile likelihood interval을 구하였다. 그리고 계층별 N의 합을 구하여 전체 발생 건수를 추정하였다.
변수들에 따라 각 자료원에 수집될 확률이 다르게 나타날 가능성(heterogeneous catchability)을 고려하기 위해 각각의 자료원에 대하여 성별, 연령, 지역, 발병일에 관한 분포를 살펴보았고, 여기에서 이질성의 단서가 된 변수들은 층화분석의 층화 기준으로 하였다. 이때 비교척도는 각 변수별로 연구기간 중 발생률 (incidence rate during the study period; IR)을 이용하였다.
이 연구는 특정 전염병의 유행 시기에 3가지 자료원을 확보하여 capturerecapture 방법을 적용하여 신고 자료의 완전성을 파악하였다. 국내의 전염병 신고자료의 완전성이 낮다고 알려져 있는데, 외국의 경험들을 보더라도 신고율이 완벽한 경우는 없어 여러 보완적인 방법으로 지역사회에서의 전염성 발생 규모를 파악하여야 한다.
층화 기준으로 하였다. 이때 비교척도는 각 변수별로 연구기간 중 발생률 (incidence rate during the study period; IR)을 이용하였다.
6월 10일 이후였다. 이미 앞서의 두 가지 자료를 확보하였지만, 임상적 특징과 백신 접종력 등 주요한 역학적 정보들이 대부분 누락되어 있었고, 두 자료를 대조한 결과 많은 환례들이 보고에서 빠져 있을 가능성이 있었기 때문에 학교를 대상으로 환례에 대한 재조사를 실시하게 되었다. 이때 사례 정의는 의료기관에서 진료를 받은 경우와 의료기관을 찾지 않았더라도 볼거리 주증상을 경험한 경우를 모두 포함하였다.
이렇게 조사된 환자 수는 1, 065명이었으며 담임교사에 의한 조사였기 때문에 의료기관에서 진단을 받은 경우와 의료기관을 찾지 않은 환자들까지 포함하고 있었다. 조사 변수는 이름, 성별, 연령, 학교와 학년, 반, 증상 발현일 등이었으며 일부 사례에는 백신 접종력이 포함되어있었다.
대상 데이터
먼저, 세 가지의 자료원이 포함하고 있는 대상집단과 조사 시기에 차이가 있었기 때문에 비교 가능성을 높이기 위하여 연령을 학령기인 7~18세로 제한하고, 대상 기간은 1998년 3월 3일부터 현지 자료수집 종료 시점인 1998년 6월 20일(결측값인 경우 신고일을 근사치로 함)까지의 자료만을 분석에 사용하였다.
이론/모형
분석에는 SAS® 6.12를 이용하였으며, 포와슨 분포에 로그를 링크한 “proc genmod” 를적용하였다(Stokes 등, 1995). 모형은 다음의 식 (2)와 같이 표현된다.
이상의 과정을 거쳐 추정한 비관찰 도수 n000를 관찰도수(n)에 더한 합을 전체 발생 건수에 대한 추정값 N으로 하였으며, 신뢰 구간은 profile likelihood interval 추정방법을 사용하였다(Regal과 Hook,1984; Cormack, 1989; Buckland와 Garthwaite, 1991; Regal과 Hook, 1991).
성능/효과
000, x2-test). 각 자료원 사이의 완전성을 비교해 보았을 때 교육청 자료가 53.0%로 가장 높게 나타났으며 이어 보건소 자료 43.8%, 역학조사 자료 40.6%로 나타났는데, 이들 사이의 차이는 모두 통계적으로 모두 유의미한 것이었다 0=0.000, F-test)(Table 5).
각 자료원별로 성별, 연령, 지역, 발생일 분포를 살펴보면 포함 연령과 발생 시기의 분포가 다르고, 지역별 구성비도 다르다는 것을 알 수 있다(Table 3).
각 자료원으로부터 조사된 사례를 이용하여 대상기간의 지역별 발생률 (/1, 000)을 구한 결과, 제주시의 경우 학교를 통해 조사된 두 개 자료의 발생률에는 차이가 없었으며 법정 전염병 신고자료에 의한 발생률이 나머지 두 가지에 비해 더 낮게 나타났다. 서귀포시의 경우 자료원마다 발생률간에 유의한 차이가 있었으며(p=0.
각 자료원으로부터 조사된 사례를 이용하여 대상기간의 학교 종류별 발생률 (/1,000)을 구한 결과 세 자료원에서 모두 초등학생이 가장 높았고, 중학생, 고등학생의 순서로 낮아졌으며p=0.000, x2- trend test), 학령 별로 자료원에 의한 발생률의 차이를 살펴보았을 때 초등학생 중학생, 고등학생 모두 통계적으로 유의미한 차이를 보였다(p=0.009, 0.000, 0.002, x2-test)(Fig. 3).
첫째, 연구 기간 동안 인구의 변화가 없어야 한다(closed population). 둘째, 고유한 개인 식별자가 존재하여 (identifiability) 자료를 짝짓기 할 수 있어야 하며, 셋째, 특정 자료원에 대하여 각 개인이 표집될 확률은 동일해야 한다. (homogeneous catchability of individuals).
또한 이번 연구에서의 완전성이 다른 연구들에 비해 높은 것은 사실이지만, 43.8%의 완전성이라는 것은 여전히 법정전염병 신고자료만으로 우리나라의 전염병 발생 규모를 즉정하는 것에는 문제가 있음을 보여준다.
총 1,844명이었다. 로그 선형모형을 이용한 capture-recapture 방법을 적용한 결과 추정 발생 건 수는 1, 935(95% CI:1, 878-2, 070)건이었고, 법정전염병 신고 자료의 완전성은 43.8%으로 추정되었다. 도시 지역(49.
Table 5와 같다. 법정 전염병 신고자료의 경우 층화하지 않은 상태에서 43.8%의 완전성을 보였으며 지역 별로 층화한 경우 시 지역이 49.8%로 군 지역의 42.3%와 유의미한 차이가 있었다 (p=0.005, x2-test). 마찬가지로 초등학생과 중·고등학생으로 층화한 경우에도 완전성 은 각각 47.
4%)에 비하여 법정 전염병 신고의 완전성이 높았다. 신고 자료의 완전성이 43.8%라는 이 연구의 결과는 기존에 알려진 법정전염병 신고율 보다 높은 것이었다. 이는 대규모 유행 시기이었다는 점과 여러 경로 즉, 유행에 대한 보건 기관의 독려, 역학조사반의 지역의 보건의료인에 대한 설명회, 언론 보도에 의한 인지도 향상 등으로 인하여 신고율이 평상시보다 높았던 것으로 생각한다.
자료원 간의 독립성 가정 만족 여부는, 적합된 모형식에서 교호작용항으로 판단할 수 있는데, 층화하지 않은 경우와 층화한 경우 모두에서 각각 유의한 교호작용이 있는 것으로 나타났다. 이렇게 로그 선형모형을 사용하였을 경우 비독립성 가정에 위배는 교호작용항을 모형에 포함 시 킴으로써 해결할 수 있지만, 두 자료원들만 짝지은 경우 자료의 의존성 방향에 따라 매우 비뚤린 결과를 낳을 것이라고 예상할 수 있다(Wittes 등, 1974; Brenner 등, 1995).
자료원별로 일주일 간격의 환자 발생 분포를 살펴보았을 때 나머지 두 자료원에 비해 교육청 보고 자료에서 유행이 빨리 나타나는 것을 관찰할 수 있었다(Fig. 4).
후속연구
국내에서도 현재 개발 중에 있는 각종 질병 감시체계와 예시된 연구들에서처럼 대상 인구와 질병 특성에 맞는 다양한 자료를 활용하여 capture-recapture 방법을 적용하면 질병 발생의 규모를 좀더 정확히 파악할 수 있을 것으로 보인다. 최근 에이를 이용하여 의료보험 청구자료의 완전성을 평가한 연구(하미나 등, 1997), 지역 암등록 자료의 완전성을 평가한 연구 (임정수 등, 1999) 등이 발표되 었는데, 앞으로 활용 범위가 확대될 수 있을 것이다.
경우가 많다. 따라서 1차적으로 자료의 질을 높이기 위해 정확도와 보고율을 높이는 방법이 강구되어야겠지만 이와 더불어 자료의 불완전성을 인정하고 효과적으로 이를 보완할 수 있는 노력을 기울이는 것도 필요할 것이다.
향후 유행 시기뿐만 아니라 평상시에도 2가지 이상의 자료원을 확보하여, 다른 전염병에도 적용할 수 있을 것으로 생각한다. 이는 신고의 완전성을 파악하여 지역사회의 발생 규모를 보다 정확하게 추정하고, 나아가 신고의 완전성을 높이는데 기여할 수 있을 것으로 생각한다.
최근 에이를 이용하여 의료보험 청구자료의 완전성을 평가한 연구(하미나 등, 1997), 지역 암등록 자료의 완전성을 평가한 연구 (임정수 등, 1999) 등이 발표되 었는데, 앞으로 활용 범위가 확대될 수 있을 것이다. 일례로 이 연구에서처럼 학생 계층에 많이 발생하면서 위중도가 높지 않아 의료기관을 찾는 정도가 낮을 것으로 생각되는 호흡기 전염병의 경우 학교를 활용한 감시체계 자료를 이용하여 법정 전염병 신고자료를 보완하고 평가할 수 있고, 또한 지역사회의 각종 전염병 유행조사 시에 수집 가능한 여러 자료들을 활용하여 보정된 발생 추정값을 구할 수 있을 것이다.
국내의 전염병 신고자료의 완전성이 낮다고 알려져 있는데, 외국의 경험들을 보더라도 신고율이 완벽한 경우는 없어 여러 보완적인 방법으로 지역사회에서의 전염성 발생 규모를 파악하여야 한다. 향후 유행 시기뿐만 아니라 평상시에도 2가지 이상의 자료원을 확보하여, 다른 전염병에도 적용할 수 있을 것으로 생각한다. 이는 신고의 완전성을 파악하여 지역사회의 발생 규모를 보다 정확하게 추정하고, 나아가 신고의 완전성을 높이는데 기여할 수 있을 것으로 생각한다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.