$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

순환신경망을 이용한 질병발생건수 예측
Predicting the number of disease occurrence using recurrent neural network 원문보기

응용통계연구 = The Korean journal of applied statistics, v.33 no.5, 2020년, pp.627 - 637  

이승현 (SK주식회사 C&C) ,  여인권 (숙명여자대학교 통계학과)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 건강보험심사평가원에서 제공한 약 120만명의 2014년 고령환자의료자료(HIRA-APS-2014-0053)과 기상자료를 일반화추정방정식(generalized estimating equation; GEE) 모형과 long short term memory (LSTM) 기반 순환신경망(recurrent neural network; RNN) 모형으로 분석하여 기상 조건에 따른 주요 주상병의 발생 빈도를 예측한다. 이를 위해 환자가 의료 서비스를 받은 기관의 지역을 이용하여 환자의 거주지를 추정하고 해당 지역의 주별 기상 관측소 자료와 의료자료를 병합하였다. 질병 발생 상태를 세 개의 범주(질병에 걸리지 않음, 관심 주상병 발생, 다른 질병 방생)로 나누었으며 각 범주에 속할 확률을 GEE 모형과 RNN 모형으로 추정하였다. 각 범주별 발생 건수는 해당 범주의 속할 추정확률의 합으로 계산하였으며 비교분석결과 RNN을 이용한 예측이 GEE를 이용한 예측보다 정확도가 높은 것으로 나타났다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, the 1.24 million elderly patient medical data (HIRA-APS-2014-0053) provided by the Health Insurance Review and Assessment Service and weather data are analyzed with generalized estimating equation (GEE) model and long short term memory (LSTM) based recurrent neural network (RNN) model...

주제어

표/그림 (8)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 9%(768만5천명)를 차지한다. 고령인구의 지속적인 증가로 인하여 사회경제적인 변화가 필요할 것으로 보여 연구를 진행하게 되었다. 이 논문에서는 우리나라 환자의 상당 부분을 차지하고 있는 고령환자들의 건강보험심사평가원(이하 심평원) 의료보험 청구자료를 분석하여 성과 연령과 같은 인구생태학적 정보와 거주 지역의 기상 자료가 특정 주상병에 걸릴 확률에 어떻게 영향을 주는지를 모형화하고 해당 지역에 발생한 환자의 수를 예측해 본다.
  • 본 논문에서는 기상 자료와 질병 발생과의 연관성을 이용하여 질병 발생 건수를 예측해 보았다. 분석에는 기계학습 방법 중 LSTM 기반 RNN 모형과 통계학습 방법 중 GEE 모형을 사용하였으며 환자를 주별로 지역, 성별, 연령으로 나누고 관심 질병을 호흡기 질환, 순환기 질환, 피부 및 피하조직 질환에 대한 질병 발생 건수 예측하였다.
  • 고령인구의 지속적인 증가로 인하여 사회경제적인 변화가 필요할 것으로 보여 연구를 진행하게 되었다. 이 논문에서는 우리나라 환자의 상당 부분을 차지하고 있는 고령환자들의 건강보험심사평가원(이하 심평원) 의료보험 청구자료를 분석하여 성과 연령과 같은 인구생태학적 정보와 거주 지역의 기상 자료가 특정 주상병에 걸릴 확률에 어떻게 영향을 주는지를 모형화하고 해당 지역에 발생한 환자의 수를 예측해 본다.
  • 이 논문의 분석 목적은 개별 환자에 대한 각 범주별 확률이 아니라 특정 연령, 지역, 성별에 따라 해당 주의 기상상태에 따라 몇 명의 환자가 발생했는지를 알아보기 위함으로 각 범주의 확률에 해당 분류 그룹의 인원수를 곱한 기댓값을 구하는 것이다. 즉, nij를 i번째 주의 j번째 그룹(160)에 속하는 전체 환자수라 하고 #를 i번째 주의 j번째 그룹의 k번째 범주(k = 1, 2, 3)에 해당하는 확률의 추정값이라고 하면 동일 지역에 대해서는 동일 기상자료가 사용되기 때문에 j번재 그룹 내의 모든 환자들에 대한 세범주의 확률은 동일한다.
  • 4/M4버전에서 명목형 다항분포에 대한 ‘PROC GEE’를 사용할 수 있었으며 다항분포인 경우에는 가상관행렬(working correlation matrix)은 독립 형태만 가능했다. 이러한 이유로 본 연구에서는 GEE와 RNN을 비교하는 연구를 진행하였다. GEE 모형과 RNN 모형에 대한 내용은 기존 문헌에 방대하게 나와 있어 별도로 내용을 설명하지 않고 해당모형에서 변수를 어떻게 설정했는지를 중심으로 설명하고자 한다 (GEE는 Diggle 등 (2002), Hardin과 Hilbe (2003)).

가설 설정

  • 모수 θijk는 i번째 환자가 j 시점에서 k번째 상태에 있을 확률로 이 환자의 연령과 성별, 거주지역의 기상자료에 영향을 받을 것이라고 가정한다.
본문요약 정보가 도움이 되었나요?

참고문헌 (9)

  1. Ballester, F., Michelozzi, P., and Iniquez, C. (2003). Weather, climate, and public health, Journal of Epidemiology & Community Health, 57, 759-760. 

  2. Basu, R. and Samet, J. M. (2002). Relation between elevated ambient temperature and mortality, A Review of the Epidemiologic Evidence, 24, 190-202. 

  3. Diggle, P., Heagerty, P., Liang, K. Y., and Zeger, S. L. (2002). Analysis of Longitudinal Data (2nd ed), Oxford University Press, Oxford. 

  4. Hardin, J. W. and Hilbe, J. M. (2003). Generalized Estimating Equations, Chpman & Hall/CRC, FL. 

  5. Hochreiter, S. and Schmidhuber, J. (1997). Long short-term memory, Neural Computation, 9, 1735-1780. 

  6. Hopfield, J. J. (1982). Neural networks and physical systems with emergent collective computational abilities. In Proceedings of the National Academy of Sciences of the United States of America, 79, 2554-2558. 

  7. Touloumis, A., Agresti, A., and Kateri, M. (2013). Generalized estimating equations for multinomial responses using a local odds ratio parameterization, Biometrics, 69, 633-640. 

  8. 안혜연, 정주희, 김채희, 윤진아, 김현수, 오인보, 이지호, 원경미, 이영미, 김유근 (2016). 학술논문 분석을 통한 기상민감질환 선정 및 기상 인자와의 관련성 고찰, 한국환경과학회 2016년 정기학술대회 발표논문집, 25, 839-851. 

  9. 주영수(2008). 기후변화와 건강, 대한내과학회지, 75, 489-491. 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로