$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

Analysis of Research Topics and Trends on COVID-19 in Korea Using Latent Dirichlet Allocation (LDA) 원문보기

韓國컴퓨터情報學會論文誌 = Journal of the Korea Society of Computer and Information, v.25 no.12, 2020년, pp.83 - 91  

Heo, Seong-Min (Dept. of Applied Mathematics, Kumoh National Institute of Technology) ,  Yang, Ji-Yeon (Dept. of Applied Mathematics, Kumoh National Institute of Technology)

초록
AI-Helper 아이콘AI-Helper

본 연구에서는 DBpia에 등록된 코로나19 관련 논문을 대상으로 연구 토픽을 밝히고 연구 변화 추세를 검토한다. 잠재 디리슐레 할당(Latent Dirichlet Allocation) 알고리즘을 적용한 결과, 7개의 연구 토픽을 도출하였고, 각 토픽은 "International Dynamics", "Technology & Security", "Psychological Impact", "Biomedical-Related", "Economic Impact", "Online Education", "Religion-Related"에 관한 내용이었다. 또한 다범주 로짓모형을 사용하여 연구 토픽의 추세 변화를 살펴본 결과, 2020년 6월 전에는 국제적 역학관계 및 생물 의학 관련 논문이 주를 이루었다면, 이후에는 다양한 분야로 연구 주제가 확대되었다. 특히 경제적인 영향, 온라인 교육, 심리적인 영향에 관한 연구가 꾸준히 증가함을 확인할 수 있었다. 이러한 결과는 향후 코로나19 관련 공동 연구의 가이드 라인을 제시하고, 활발한 연구 활동을 위한 기초자료로 활용될 수 있을 것이다.

Abstract AI-Helper 아이콘AI-Helper

This study aims to identify research topics and examine the trend of Covid19-related papers on DBpia. Applying latent Dirichlet allocation (LDA), we have extracted seven research topics, each of which concerns "International Dynamics", "Technology & Security", "Psychological Impact", "Biomedical-Rel...

주제어

표/그림 (6)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 연구에서는 이러한 연구진들의 노력의 산물인 연구 논문을 이용하여, 코로나19 관련 연구의 토픽들을 밝히고 각토픽들이 어떠한 추세인지를 보이는지를 검토하였다. 토픽모델링 기법 중 LDA 알고리즘을 DBpia에 등록된 국내 논문 290편에 적용한 결과 총 7개의 연구토픽을 발견하였고, 토픽내 주요 단어들을 검토함으로써 각 토픽은 "International Dynamics", "Technology & Security", "Psychological Impact", "Biomedical-Related", "Economic Impact", "Online Education", "Religion-Related"에 관한 내용임을밝힐 수 있었다.
  • 본 연구에서는 코로나19 관련 연구 토픽을 발견하고 시기별 트렌드를 분석하고 있다. 이는 앞으로 코로나19 관련 연구 전략을 수립하는데 필요한 기초자료로 활용되고, 관련 정부 정책의 방향성을 제시하는데 기여할 수 있을 것이다.
  • 본 연구에서도 이 네 가지의 측도를 활용하여 타당하면서도 해석이 용이하도록 적절한 토픽의 개수를 정하는 것을 목표로 한다. 토픽의 개수를 선택한 후 영문 초록에 LDA를 적용하여 토픽을 도출하고, 출현 단어를 검토하여잠재 토픽의 특성을 반영할 수 있도록 토픽의 이름을 정하고 있다.
  • 이에 관련 연구의 토픽의 변화가 어떻게 이루어지고 있는지 다범주 로짓모형을 이용하여 살펴보고자 한다. 6월에 게재된 논문의 수가 급증한 점을 감안하여 6월을 기준으로 전, 후로 나눈 후, 각 토픽이 등장하는 패턴의 변화를 검토한다.
  • 특히 코로나19의 유행이 지속됨에 따라 관련연구 주제도 확대되었으리라 예상되는 바, 연구 트렌드를파악하기 위해서는 최근 연구를 포함한 재분석이 반드시요구된다. 이에 본 연구에서는 지금까지 DBPia에 수록된코로나19 관련 논문을 전체를 대상으로 국내 연구 트렌드와 토픽들을 분석하고 있다. 대부분의 기존의 연구들이 심사 전 공개 아카이브에 올라온 논문을 대상으로 하는 반면, 본 연구에서는 전문가 심사 후 게재가 이루어진 논문을 대상으로 한다는데 차이가 있다.
  • 코로나19 관련 논문의 게재가 급증한 2020년 6월을 전후로 해서 연구 토픽의 추세 변화가 있는지를 살펴보았다. Fig.

가설 설정

  • 활용하고 있다. LDA는 토픽 내 단어 분포와 문서 내 토픽 분포의 결합으로 특정 문서 내 단어들이 생성된다고 가정한다[21-22]. 토픽을 선택하는 과정 및 토픽 내 단어를 선택하는 과정은 다항(multinomial) 분포를 따른다고 가정하고, 켤레(conjugate) 관계인 디리슐레(Dirichlet) 를 각 문서에 포함된 주제의 사전분포로 사용한다.
  • LDA는 토픽 내 단어 분포와 문서 내 토픽 분포의 결합으로 특정 문서 내 단어들이 생성된다고 가정한다[21-22]. 토픽을 선택하는 과정 및 토픽 내 단어를 선택하는 과정은 다항(multinomial) 분포를 따른다고 가정하고, 켤레(conjugate) 관계인 디리슐레(Dirichlet) 를 각 문서에 포함된 주제의 사전분포로 사용한다. 추론의 대상인 베이지언 사후분포는 보통 해석적으로 해를 찾을 수가 없기 때문에, 사후분포에서 추정하고자 하는 모수들을 조건부 확률로부터 순차적으로 추출하는 깁스 샘플링 (Gibbs sampling)이 사용되고 있다[23].
본문요약 정보가 도움이 되었나요?

참고문헌 (30)

  1. Centers for Disease Control and Prevention(CDC), https://www.cdc.gov/sars/ 

  2. F. S. Dawood, A. D. Iuliano, C. Reed, et al., "Estimated global mortality associated with the first 12 months of 2009 pandemic influenza A H1N1 virus circulation: a modelling study," The Lancet infectious diseases, Vol. 12, No. 9, pp. 687-695, Sep. 2012. DOI: 10.1016/S1473-3099(12)70121-4 

  3. World Health Organization, "Middle East respiratory syndrome coronavirus (MERS-CoV) - The Kingdom of Saudi Arabia," Jul. 2019. https://www.who.int/csr/don/ 24-july-2019-mers-saudi-arab ia/en/ 

  4. Korea Disease Control and Prevention Agency, http://www.cdc.go.kr/contents.es?mida20301020709 

  5. World Health Organization, "WHO Director-General's remarks at the media briefing on 2019-nCoV on 11 February 2020," Feb. 2020. https://www.who.int/dg/speeches/detail/who- director-general-s-remarks-at-the-media-briefing-on-2019-ncov-on-11-february-2020 

  6. World Health Organization, "WHO Director-General's Opening Remarks at the Media Briefing on Covid-19 - 11 March 2020," Mar. 2020. https://www.who.int/dg/speeches/detail/who-directorgeneral-s-opening-remarks-at-the-media-briefing-on-covid-19---11-march-2020 

  7. K. F. Yuen, X. Wang, F. Ma, and K. X. Li, "The Psychological Causes of Panic Buying Following a Health Crisis," International Journal of Environmental Research and Public Health, Vol. 17, No. 10, pp. 3513-3536, May 2020. DOI: 10.3390/ijerph17103513 

  8. N. Zhu, D. Zhang, W. Wang, et al., "A novel coronavirus from patients with pneumonia in China, 2019," New England Journal of Medicine, Vol. 382, No. 8, pp. 727-733, Feb. 2020. DOI: 10.1056/NEJMoa2001017 

  9. S. P. Kaur and V. Gupta, "COVID-19 Vaccine: A comprehensive status report," Virus Research, Vol. 288, Oct. 2020. DOI: doi: 10.1016/j.virusres.2020.198114 

  10. Y. Jeong, "2019 Novel Coronavirus Disease Outbreak and Molecular Genetic Characteristics of Severe Acute Respiratory Syndrome-Coronavirus-2," Journal of Bacteri- ology and Virology, Vol. 50, No. 1, pp. 1-8, Jan. 2020. DOI: 10.4167/jbv.2020.50.1.001 

  11. M. Nicola, Z. Alsafi, C. Sohrabi, et al., "The socio-economic implications of the coronavirus pandemic (COVID-19): A review," International Journal of Surgery, Vol. 78, pp. 185-193, Jun. 2020. DOI: 10.1016/j.ijsu.2020. 04.018 

  12. D. Banerjee and M. Rai, "Social isolation in Covid-19: The impact of loneliness," International Journal of Social Psychiatry, Vol. 66, No. 6, pp. 525-527, Sep. 2020. DOI: 10.1177/0020764020922269 

  13. S. Jun and J. Kim, "Theoretical Background and Prospects for the Untact Industry," Journal of New Industry and Business, Vol. 38, No. 1, pp. 96-116, Jun 2020. https://www.dbpia.co.kr/journal/articleDetail?nodeIdNODE09405985 

  14. W. Kim, J. Han, and K. E. Lee, "Predictors of Mortality in Patients with COVID-19: A Systematic Review and Meta-analysis," Korean Journal of Clinical Pharmacy, Vol. 30, No. 3, pp. 169-176, Sep. 2020. DOI: 10.24304/kjcp. 2020.30.3.169 

  15. F. Shi, J. Wang, J. Shi, et al., "Review of artificial intelligence techniques in imaging data acquisition, segmentation and diagnosis for covid-19", IEEE Reviews in Biomedical Engineering, Apr. 2020. DOI: 10.1109/RBME. 2020.2987975 

  16. A. Ebadi, P. Xi, S. Tremblay, et al., "Understanding the temporal evolution of COVID-19 research through machine learning and natural language processing," arXiv preprint arXiv:2007.11604, 2020. 

  17. H. Zhang and R. Shaw, "Identifying Research Trends and Gaps in the Context of COVID-19," International Journal of Environmental Research and Public Health, Vol. 17, No. 10, pp. 3370-3386, May 2020. DOI: 10.3390/ijerph171033 70 

  18. T. Kim, "COVID-19 News Analysis Using News Big Data : Focusing on Topic Modeling Analysis," The Journal of the Korea Contents Association, Vol. 20, No. 5, pp. 457-466, May 2020. DOI: 10.5392/JKCA.2020.20.05.457 

  19. Korea Institute of Science and Technology, "KISTI DATA INSIGHT," Vol 12, Apr. 2020. http://mirian.kisti.re.kr/ insight/insight.jsp 

  20. D. M. Blei, "Probabilistic topic models," Communications of the ACM, Vol. 55, No. 4, pp. 77-84, Apr. 2012. DOI: 10.1145/2133806.2133826 

  21. D. M. Blei, A. Y. Ng, and M. I. Jordan, "Latent dirichlet allocation," Journal of machine Learning research, Vol. 3, pp. 993-1022, Jan. 2003. DOI: 10.1162/jmlr.2003.3.4-5.993 

  22. J. Y. Yang, "Convergence Study on Research Topics for Thyroid Cancer in Korea," Journal of the Korea Convergence Society, Vol. 10, No. 2, pp. 75-81, Feb. 2019. DOI: 10.15207/JKCS.2019.10.2.075 

  23. G. Casella and E. I. George, "Explaining the Gibbs sampler," The American Statistician, Vol. 46, No. 3, pp. 167-174, Feb. 2012. DOI: 10.1080/00031305.1992.10475878 

  24. S. Yoon and M. Kim, "Topic Modeling on Fine Dust Issues Using LDA Analysis," Journal of Energy Engineering, Vol. 29, No. 2, pp. 23-29, May. 2020. DOI: 10.5855/ENERGY. 2020.29.2.023 

  25. J. Sim and H. Kim, "A Searching Method for Legal Case Using LDA Topic Modeling," Journal of the Institute of Electronics and Information Engineers, Vol. 54, No. 9, pp. 67-75, Sep. 2017. DOI: 10.5573/ieie.2017.54.9.67 

  26. S. Moon, S. Chung, and S. Chi, "Topic modeling of news article about international construction market using latent Dirichlet allocation," Journal of the Korean Society of Civil Engineers, Vol. 38, No. 4, pp. 595-599, Aug. 2018. DOI: 10.12652/Ksce.2018.38.4.0595 

  27. T. L. Griffiths and M. Steyvers, "Finding scientific topics. Proceedings of the National academy of Sciences," Vol. 101, No. suppl 1, pp. 5228-5235, Apr. 2004. DOI: 10.1073/pnas.0307752101 

  28. R. Deveaud, E. SanJuan, and P. Bellot, "Accurate and effective latent concept modeling for ad hoc information retrieval," Document numerique, Vol. 17, No. 1, pp. 61-84, Jun. 2014. DOI: 10.3166/DN.17.1.61-84 

  29. J. Cao, T. Xia, J. Li, Y. Zhang, and S. Tang, "A density-based method for adaptive lda model selection," Neurocomputing, Vol. 72, No. 7, pp. 1775-1781, Mar. 2009. DOI: 10.1016/j.neucom.2008.06.011 

  30. R. Arun, V. Suresh, C. V. Madhavan, and M. N. Murthy, "On finding the natural number of topics with latent dirichlet allocation: Some observations," Pacific-Asia Conference on Knowledge Discovery and Data Mining, Vol. Part I, pp. 391-402, Jun. 2010. DOI : 10.1007/978-3-642-13657-3_43 

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로