$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 다이나믹 토픽 모델을 활용한 D(Data)·N(Network)·A(A.I) 중심의 연구동향 분석
Investigation of Research Trends in the D(Data)·N(Network)·A(A.I) Field Using the Dynamic Topic Model 원문보기

한국융합학회논문지 = Journal of the Korea Convergence Society, v.11 no.9, 2020년, pp.21 - 29  

우창우 (충북대학교 컴퓨터과학과 및 정보통신기획평가원 SW클라우드기획팀) ,  이종연 (충북대학교 소프트웨어학과)

초록
AI-Helper 아이콘AI-Helper

최근 디지털 사회의 도래로 다양한 데이터가 폭발적으로 증가하고, 그중 문헌 내 주제어를 도출하는 토픽 모델링에 관한 연구가 활발히 진행되고 있다. 본 논문의 연구목표는 토픽 모델링 방법 중 하나인 DTM(Dynamic Topic Model) 모델을 적용해 D.N.A.(Data, Network, A.I) 분야에 대한 연구동향을 탐색하는데 있다. 실험 데이터는 최근 6년간(2015~2020) ICT(Information and Communication Technology) 분야 중 기술대분류가 SW·AI에 해당하는 연구과제 1,519개 사업에 대해 DTM 모델을 적용하였다. 실험결과로, D.N.A. 분야의 기술 키워드 Big data, Cloud, Artificial Intelligence와 확장된 의미의 기술 키워드 Unstructured, Edge Computing, Learning, Recognition 등이 매년 연구에 표출되었으며, 해당 키워드 들이 특정 연구과제에 종속되지 않고 다른 연구과제에서도 포괄적으로 연구되고 있음을 확인하였다. 끝으로 본 논문의 연구결과는 향후 D.N.A. 분야에 대한 정책기획·과제기획 등 연구개발 기획 과정과 기업의 기술 확보전략·마케팅 전략 등 다양한 곳에 활용될 수 있을 것으로 기대한다.

Abstract AI-Helper 아이콘AI-Helper

The Topic Modeling research, the methodology for deduction keyword within literature, has become active with the explosion of data from digital society transition. The research objective is to investigate research trends in D.N.A.(Data, Network, Artificial Intelligence) field using DTM(Dynamic Topic...

주제어

표/그림 (7)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 따라서 본 논문에서는 D.N.A. 분야에 대한 연구동향 파악을 위해 국내 연구개발 활동을 지원하는 ICT분야 국가연구개발사업 과제정보 데이터에 시계열 분석이 가능한 DTM 모델을 적용하는데 연구목표를 둔다. 세부적인 연구방법은 다음과 같다.
  • 본 논문은 최근 6년간 수행된 SWㆍAI 분야의 연구과제 데이터 분석을 통해 D.N.A. 분야의 연구동향을 도출 하였다. 실험결과 2015년과 2016년은 데이터와 네트워크 분야의 연구가 활발하게 진행되었으며, 2017년 이후부터는 인공지능에 관한 연구가 활발하게 진행되었음을 확인하였다.
  • 위와 관련되어 연구동향을 파악하기 위한 데이터 분석 방법은 통계적 분석, 정량적 분석, 전문가 토의 및 설문조사 등 연구목적과 방법에 따라 다양하게 선택할 수 있지만 본 연구에서는 전체 문서집합을 대상으로 텍스트 분석과 통계적 분석을 적용한 토픽 모델링(Topic Modeling) 방법으로 분석하고자 하였다. 토픽 모델링은 개별 문서에서 내포하고 있는 단어의 확률적인 계산을 통해 전체 문서가 의미하는 토픽을 발견하는 데이터마이닝 기법 중 하나로, 대표적인 LDA(Latent Dirichlet Allocation) 모델[4] 외에 DTM(Dynamic Topic Model) 모델[5], ATM(Author Topic Model) 모델[6], PAM(Pachinko Allocation Model) 모델[7], TOT(Topics Over Time) 모델[8] 등 수십여 개의 파생된 모델이 제시되었다[9].
  • 이는 20년, 30년 등 더 긴 시점을 갖는 데이터를 DTM 모델과 LDA 모델로 분석하였을 때 시간의 흐름에 따른 토픽의 변화로 인해 두 모델이 완전히 다른 키워드를 반환할 수 있다는 점을 시사하고 있으며, 본 연구는 연구목적에 맞는 D.N.A. 분야의 연구동향 분석을 위해 DTM 모델이 적합하다고 판단하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
ICT(Information and Communication Technology) 기술에 있어서 기술의 대중화에 힘쓰고 있는 글로벌 기업들과는 달리, 국내에선 어떤 현실을 보여주는가? Apple, Google, Microsoft 등 글로벌 기업들은 인공지능을 핵심 R&D(Research and Development) 분야로 삼고 API(Application Programming Interface) 및 클라우드 서비스 등을 통해 기술의 대중화에 힘쓰고 있지만, 국내의 경우 시장참여자 전체를 견인할 수 있는 선순환 구조의 생태계가 미비함이 현실이다[3]. 이러한 우려 속에서 D.
Garter와 IDC에서 ICT(Information and Communication Technology) 기술의 메가트렌드로 무엇을 선정했는가? 최근 디지털 사회의 도래로 다양한 데이터가 폭발적으로 증가하면서 문헌 내 주제어를 도출하는 연구방법 중 하나인 토픽 모델링에 관한 연구가 활발해지고 있다. 시장조사 전문기관인 Gartner와 IDC에서는 ICT(Information and Communication Technology) 기술의 메가트렌드 중 하나로 빅데이터와 인공지능을, MIT에서는 추론과 학습 및 의사소통이 가능한 인공지능을 혁신기술로 선정하였고[1] 사람과 사람을 연결시키던 전통적인 네트워크 기술은 더 이상 사람과 사람이 아닌 Cloud, Machine to Machine, Internet of Things 등 사람과 사물, 사물과 사물을 대상으로 하는 초연결 사회로 나아가기 위해 변화하고 있다[2].
토픽 모델링이란? 위와 관련되어 연구동향을 파악하기 위한 데이터 분석 방법은 통계적 분석, 정량적 분석, 전문가 토의 및 설문조사 등 연구목적과 방법에 따라 다양하게 선택할 수 있지만 본 연구에서는 전체 문서집합을 대상으로 텍스트 분석과 통계적 분석을 적용한 토픽 모델링(Topic Modeling) 방법으로 분석하고자 하였다. 토픽 모델링은 개별 문서에서 내포하고 있는 단어의 확률적인 계산을 통해 전체 문서가 의미하는 토픽을 발견하는 데이터마이닝 기법 중 하나로, 대표적인 LDA(Latent Dirichlet Allocation) 모델[4] 외에 DTM(Dynamic Topic Model) 모델[5], ATM(Author Topic Model) 모델[6], PAM(Pachinko Allocation Model) 모델[7], TOT(Topics Over Time) 모델[8] 등 수십여 개의 파생된 모델이 제시되었다[9].
질의응답 정보가 도움이 되었나요?

참고문헌 (24)

  1. H. J. Lee, P. M. Ryu, S. J. Lim, M. K. Jang & H. K. Ki. (2014). Technology Trends of AI for Big Data Knowledge Processing. Electronics and Telecommunications Trends, 29(4), 30-38. DOI : 10.22648/ETRI.2014.J.290404 

  2. T. K. Kang, Y. H. Kang, Y. C. Ryoo & T. S. Cheung. (2019). Research Trend in Ultra-Low Latency Networking for Fourth Industrial Revolution. Electronics and Telecommunications Trends, 34(6), 108-122. DOI : 10.22648/ETRI.2019.J.340610 

  3. J. Y. Lee & B. S. Cho. (2016). Suggestions for Nurturing Ecosystem to Spur Artificial Intelligence Industry. Electronics and Telecommunications Trends, 31(2), 51-62. DOI : 10.22648/ETRI.2016.J.310206 

  4. David M. Blei, Andrew Y. Ng. & Michael I. Jordan. (2003). Latent Dirichlet allocation. Journal of Machine Learning Research, 3, 993-1022. DOI : 10.1162/jmlr.2003.3.4.-5.993 

  5. David M. Blei & John D. Lafferty. (2006). Dynamic Topic Models. Proceedings of the 23rd international conference on Machine learning, 113-120. DOI : 10.1145/1143844.1143859 

  6. Michal Rosen Zvi, Thomas Griffiths, Mark Steyvers & Padhraic Smyth. (2004). The Author-Topic Model for Authors and Documents. Proceedings of the 20th conference on Uncertainty in artificial intelligence, 487-494. 

  7. Wei Li & Andrew McCallum. (2006). Pachinko Allocation : DAG-Structured Mixture Models of Topic Correlations. Proceedings of the 23rd international conference on Machine learning, 577-584. DOI : 10.1145/1143844.1143917 

  8. Xuerui Wang & Andrew McCallum. (2006). Topics over time: a non-Markov continuous-time model of topical trends. Proceedings of the 12th ACM SIGKDD international conference on Knowledge discovery and data mining, 424-433. DOI : 10.1145/1150402.1150450 

  9. Hamed Jelodar, Yongli Wang, Chi Yuan, Xia Feng, Xiahui Jiang, Yanchao Li & Liang Zhao. (2018). Latent Dirichlet Allocation (LDA) and Topic modeling: models, applications, a survey. Multimedia Tools and Applications, 78, 15169-15211. DOI : 10.1007/s11042-018-6894-4 

  10. T. J. Kim. (2020). COVID-19 News Analysis Using News Big Data : Focusing on Topic Modeling Analysis. The Journal of the Korea Contents Association, 20(5), 457-466. DOI : 10.5392/JKCA.2020.20.05.457. 

  11. H. C. Lee, J. H. Jang & K. T. Kim. (2020). A Study on the Conflict Structure of the Standing Committee through Topic A[4nalysis of the National Assembly Minutes : Health and Welfare Committee in the First Half of the 20th National Assembly. Korean Party Studies Review, 19(2), 131-167. DOI : 10.30992/KPSR.2020.06.19.2.131 

  12. G. C. Kim & H. J. Noh. (2019). Research Trends of Regional Geography Education Using Topic Modeling. Social Studies Education, 58(4), 49-67. DOI : 10.37561/sse.2019.12.58.4.49 

  13. W. J. Lee & H. Y. Lee. (2019). A Technology Landscape of Artificial Intelligence: Technological Structure and Firms' Competitive Advantages. Journal of Korea technology innovation society, 22(3), 340-361. DOI : 10.35978/jktis.2019.06.22.3.340 

  14. K. W. Cho & Y. W. Woo. (2019). Topic Modeling on Research Trends of Industry 4.0 Using Text Mining. Journal of the Korea Institute of Information and Communication Engineering, 23(7), 764-770. DOI : 10.6109/jkiice.2019.23.7.764 

  15. S. I. Hwang & M. K. Kim. (2019). An Analysis of Artificial Intelligence(A.I.) : related Studies' Trends in Korea Focused on Topic Modeling and Semantic Network Analysis. Journal of Digital Contents Society, 20(9), 1847-1855. DOI : 10.9728/dcs.2019.20.9.1847 

  16. Scott Deerwester, Susan T Dumais, George W Furnas, Thomas K Landauer & Richard Harshman. (1990). Indexing by latent semantic analysis. Journal of the American Society for Information Science, 41(6), 391-407. DOI : 10.1002/(SICI)1097-4571(199009)41:6<391 

  17. Thomas Hofmann. (2001). Unsupervised learning by probabilistic latent semantic analysis. Machine Learning, 42(1-2), 177-196. DOI : 10.1023/A:1007617005950 

  18. Arnab Bhadury, Jianfei Chen, Jun Zhu & Shixia Liu. (2016). Scaling up Dynamic Topic Models. WWW '16 : Proceedings of the 25th International Conference on World Wide Web, 381-390. DOI : 10.1145/2872427.2883046 

  19. Lin Liu, Lin Tang, Wen Dong, Shaowen Yao & Wei Zhou. (2016). An Overview of Topic Modeling and its current applications in bioinformatics. Springerplus, 5(1), 1608-1630. DOI : 10.1186/s40064-016-3252-8 

  20. Derek Greene & James P. Cross. (2017). Exploring the Political Agenda of the European Parliament Using a Dynamic Topic Modeling Approach. Political Analysis, 25(1), 77-94. DOI : 10.1017/pan.2016.7 

  21. Allen H. Huang, Reuven Lehavy, Amy Y. Zang & Rong Zheng. (2017). Analyst Information Discovery and Interpretation Roles: A Topic Modeling Approach. MANAGEMENT SCIENCE, 64(6), 2473-2972. DOI : 10.1287/mnsc.2017.2751 

  22. Andra-Selina Pietsch & Stefan Lessmannb. (2018). Topic modeling for analyzing open-ended survey responses, JOURNAL OF BUSINESS ANALYTICS, 1(2), 93-116. DOI : 10.1080/2573234X.2019.1590131 

  23. Paulo Bicalho, Marcelo Pita, Gabriel Pedrosa, Anisio Lacerda & Gisele L. Papp. (2017). A general framework to expand short text for topic modeling. Information Sciences, 393, 66-81. DOI : 10.1016/j.ins.2017.02.007 

  24. Pooja Kherwa & Poonam Bansal. (2019). Topic Modeling: A Comprehensive Review. EAI Endorsed Transactions on Scalable Information Systems, 7(24), 1-16. DOI : 10.4108/eai.13-7-2018.159623 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로