$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

BERTopic을 활용한 텍스트마이닝 기반 인공지능 반도체 기술 및 연구동향 분석
Topic Modeling on Patent and Article Big Data Using BERTopic and Analyzing Technological Trends of AI Semiconductor Industry 원문보기

Journal of information technology applications & management, v.31 no.1, 2024년, pp.139 - 161  

김현경 (KT) ,  이정훈 (Graduate School of Information, Yonsei University) ,  강선구 (IoT Service Convergence Graduate School of Information, Yonsei University)

Abstract AI-Helper 아이콘AI-Helper

The Fourth Industrial Revolution has spurred widespread adoption of AI-based services, driving global interest in AI semiconductors for efficient large-scale computation. Text mining research, historically using LDA, has evolved with machine learning integration, exemplified by the 2021 BERTopic tec...

주제어

표/그림 (16)

AI 본문요약
AI-Helper 아이콘 AI-Helper

문제 정의

  • 이에 연구의 목적은 아래와 같다. 본 논문의 연구 목적은 인공지능 반도체와 관련된 기술 특허와 논문데이터를 객관적인 방법론으로 분석하여 실증적인 기술 토픽을 제시하고, 이를 바탕으로 인공지능 반도체 기업, 및 국가 연구소등 인공지능 반도체 산업의 다양한 연구 주체에 기초적인 시사점을 제공하는 것이다. 인공지능 반도체는 전 세계에서 국가적, 산업적으로 중요성이 부각되고 있지만, 정량적인 데이터를 바탕으로 기술 트렌드를 도출하는 연구는 전무한 실정이다.
  • 본 연구는 최근 제안된 토픽모델링 방법론인 BERTopic을 통해 인공지능 반도체 산업의 주요 기술들을 도출하는 것을 목표로 한다. 연구 목표를 달성하기 위해 설정된 연구문제는 다음과 같다.
  • 본 연구에서는 인공지능 반도체의 특허와 논문 데이터를 바탕으로 하여, 2022년 새롭게 제시된 BERTopic이라는 토픽모델링 방법론을 활용하여 인공지능 반도체 기술의 동향을 분석한다. 본 논문은 총 5장으로 구성되어 있으며, 제1장은 연구의 배경과 목적, 방법 및 목적으로 이루어져 있다.
  • , 2013]. 본 연구의 목적인 인공지능 반도체 산업의 기술 동향을 파악하기 위해 가장 적절한 방법론은 토픽 모델링으로, 토픽 모델링에 관한 선행연구를 통해 어떤 토픽 모델 방법론을 채택하는 것이 가장 적절한지 살펴본다.
  • 또한 유효한 검색데이터를 늘리기 위해, 현재 인공지능반도체 산업을 영위하고 있는 회사를 검색식에 추가하여 인공지능반도체 회사 별 인공지능 반도체 관련 특허를 추가로 추출하였다. 이를 통해 수집된 데이터들을 바탕으로 토픽 모델링을 진행하여 인공지능 반도체의 기술 구조를 파악하는 것을 목표로 한다.
  • , 2022]. 이에, 본 논문에서는 아직 초기시장에 머물러 있는 인공지능 반도체 산업의 특성을 반영하여 논문데이터를 추가하여, 한국 및 미국의 특허와 논문 데이터에 대한 BERTopic 기반의 토픽모델링을 통해 인공지능 반도체 기술 구조를 도출하고 연구동향을 분석한다.
  • 하지만 인공지능 반도체 산업이 초기시장 인 만큼 해당 산업에서 특허와 같은 정량적 지표를 활용한 기술트렌드 분석에 대한 선행 연구가 부족한 실정이다. 이에, 본 연구는 객관적인 방법론으로 사용하여 인공지능반도체 산업의 기술동향 및 연구 동향를 분석하고자 한다.
  • 하지만 아직 연구 초기 단계로, 실제로 Google Scholar에 LDA를 검색하면 1,140,000개의 검색 결과가 도출되는 것과 대비하여, BERTopic은 408개의 검색 결과밖에 나오지 않는 등 대중적으로 널리 채택된 토픽모델링 방법론이라고 할 수 없다. 이에, 본 연구에서는 기존 통계적 방법론을 적용한 토픽 모델링 방법 대비 단점들을 개선하여 2021년 제시된 BERTopic으로 토픽 모델링을 실행하여 인공지능 반도체 관련 연구의 토픽들을 탐색하고자 한다.
본문요약 정보가 도움이 되었나요?

참고문헌 (56)

  1. Angelov, D., "Top2vec: Distributed representations of topics", arXiv preprint?arXiv:2008.09470, Aug 19, 2020. 

  2. Atzeni, D., Bacciu, D., Mazzei, D., and?Prencipe, G., "A Systematic Review of?Wi-Fi and Machine Learning Integration?with Topic Modeling Techniques", Sensors,?Vol. 22, No. 13, 2022, p. 4925. 

  3. Batra, G., Jacobson, Z., Madhav, S.,?Queirolo, A., and Santhanam, N., "Artificial-intelligence hardware: New opportunities for semiconductor companies", McKinsey?and Company, January 2, 2019. 

  4. Bergstrom, C. T., West, J. D., and?Wiseman, M. A., "The eigenfactor™ metrics", Journal of Neuroscience, 2019, Vol.?28, No. 45, pp. 11433-11434. 

  5. Blei, D. M., Ng, A. Y., and Jordan, M.?I., "Latent dirichlet allocation", Journal?of Machine Learning Research, Vol. 3,?Issue, Mar, 2003, pp. 993-1022. 

  6. Chaudhuri, A., Talukdar, J. and Chakrabarty,?K., "Special Session: Fault Criticality?Assessment in AI Accelerators", 2022?IEEE 40th VLSI Test Symposium (VTS),?San Diego, CA, USA, Apr, 2022, pp. 1-4. 

  7. Choi, S. and Yeon, S., "ETRI AI Strategy#?2: Strengthening Competencies in AI?Semiconductor & Computing Technologies", Electronics and Telecommunications Trends, Vol. 35, No. 7, 2020, pp.?13-22. 

  8. Deerwester, S., Dumais, S. T., Furnas,?G. W., Landauer, T. K., and Harshman,?R., "Indexing by latent semantic analysis", Journal of the American Society for?Information Science, Vol. 41, No. 6, 1990,?pp. 391-407. 

  9. Devlin, J., Chang, M.-W., Lee, K., and?Toutanova, K., "Bert: Pre-training of?deep bidirectional transformers for language understanding", arXiv preprint?arXiv:1810.04805, 2018. 

  10. Drucker, P. F., "Managing in a time of?great change", Oxford: Butterworth Heinemann,?1995, 

  11. Ebeling, R., Saenz, C. A. C., Nobre, J.,?and Becker, K., "The effect of political?polarization on social distance stances?in the brazilian covid-19 scenario", Journal of Information and Data Management, 2021, Vol. 12, No. 1. 

  12. Garfield, E., "The impact factor", Current?Contents, Vol. 25, No. 20, 1994, pp. 3-7. 

  13. Grzeszczyk, T. A. and Grzeszczyk, M.?K., "Improving the discovery of technological opportunities using patent classification based on explainable neural?networks", European Research Studies?Journal, Vol. 24, No. 3, 2021, pp. 402-409. 

  14. Gu, J., Lee, J., Chung, M., and Lee, J.,?"Electric Vehicle Technology Trends?Forecast Research Using the Paper and?Patent Data", Journal of Digital Convergence, Vol. 15, No. 2, 2017, pp. 165-172. 

  15. Hahm, Y. and Lee, S., "The distinctiveness of big data business model in its?components: A comparative analysis of?Korea-US cosmetic big data business?cases", Journal of Information Technology and Architecture, 2016, Vol. 13, No.?1, pp. 63-75. 

  16. Hearst, M., "What is text mining?" SIMS,?UC Berkeley, Oct, 17, 2003. 

  17. Hofmann, T., "Probabilistic latent semantic indexing", Paper presented at the?Proceedings of the 22nd annual international ACM SIGIR Conference on Research and Development in Information?Retrieval, 1995. 

  18. Hung, M., Park, S., Chae, B., and Lee,?J., "Analysis of Major Research Trends?in Artificial Intelligence through Analysis of Thesis Data", Journal of Digital?Convergence, Vol. 15, No. 5, May 28,?2017, pp. 225-233. 

  19. Ibtesam, M., Solangi, U., Kim, J., Ansari?M., and Park, S., "Highly Efficient Test?Architecture for Low-Power AI Accelerators", IEEE Transactions on Computer-Aided Design of Integrated Circuits and?Systems, Vol. 41, No. 8, Aug, 2022, pp.?2728-2738 

  20. Jung, M., Park, S., Chae, B., Lee, J.,?"Analysis of major research trends in artificial intelligence through analysis of?thesis data", Journal of Digital Convergence, Vol. 15, No. 5, 2017, pp. 255-233. 

  21. Kang, B., Song, M., and Cho, H., "A Study?on Opinion Mining of Newspaper Texts?based on Topic Modeling", JAMS, Vol. 47,?No. 4, Nov, 2013, pp. 315-334. 

  22. Kherwa, P. and Bansal, P., "Topic Modeling:?A Comprehensive Review", EAI Endorsed?Transactions on Scalable Information?Systems, Vol. 7, No, 24, 2020, pp. 1-16. 

  23. Kim, S., "Topic Model Augmentation and?Extension Method using LDA and?BERTopic", KOSIM, Vol. 39, No. 3, 2022,?pp. 99-132. 

  24. Kim, S., Cho, H., and Kang, J., "The?Status of Using Text Mining in Academic?Research and Analysis Methods", The?Journal of Information Technology and?Architecture, Vol.13, No. 2, 2016, pp.?317-329. 

  25. Kim, T., Choi, H., and Lee, H., "A Study?on the Research Trends in Fintech using?Topic Modeling", Journal of the Korea?Academia-Industrial cooperation Society,?Vol. 17, No. 11, Nov. 30, 2016, pp.?670-681. 

  26. Kim, Y., "A Study on the Analysis of AI?Semiconductor Industry Trends and?Implicaiotns", Proceedings of Symposium of the Korean Institute of communications and Information Sciences, Jun,?2018, pp. 45-1104. 

  27. Ko, Y., Lee, S., Cha, M., Kim, S., Lee,?J., Han, J., and Song, M., "Topic Modeling Insomnia Social Media Corpus using?BERTopic and Building Automatic Deep?Learning Classification Model", JKOSIM,?Vol. 39, No. 2, 2022, pp. 111-129. 

  28. Kwon, Y., "AI Processor Technology Trends", Electronics and telecommunications trends, Vol. 33, No. 5, Oct 1,?2018, pp. 121-134. 

  29. Kwon, Y., "Understanding of structural?changes of keyword networks in the computer engineering field", KIPS Transactions on Software and Data Engineering,?Vol. 2, No. 3, 2013, pp. 187-194. 

  30. Lee, J. and Oh, C., "A study on the technological development path of the AI semiconductor industry and the catch-up?chance for latecomers: Focusing on technical patent analysis as the view of the?technological life cycle", Innovation?studies, Vol. 17, No. 3, 2022, pp.?113-133. 

  31. Lee, J., "Research on Trend of Solar-Photovoltaic(PV) Technology Using Papers?and Patents Data: Using LDA Algorithm",?Graduate School of Information, Yonsei?University, 2017, Seoul. 

  32. Lee, J.-H., Lee, I.-S., Jung, K.-S., Chae,?B.-H., and Lee, J.-Y., "Patents and papers trends of solar-photovoltaic (PV)?Technology using LDA algorithm",?Journal of Digital Convergence, Vol. 15,?No. 9, 2017, pp. 231-239. 

  33. Lee, M., Chung, J., Lee, J., Han, J., and?Kwon, Y., "Trends in AI processor technology", Electronics and Telecommunications Trends, Vol. 35, No. 3, 2020, pp.?66-75. 

  34. Lee, S., Song, J., and Kim, Y., " An empirical comparison of four text mining?methods", Journal of Computer Information Systems, Vol. 51, No. 1, 2010, pp.?1-10. 

  35. Lee, W., "Analyzing technological structure and trends of artificial intelligence:?Using patent and open source project data", 2021. 

  36. Lee, Y., Nambiar, V., Goh, K. and Tuan?Do, A., "Post-Silicon Validation Methodology for Resource-Constrained Neuromorphic Hardware", IECON 2020 The?46th Annual Conference of the IEEE?Industrial Electronics Society, Singapore,?Oct, 2020, pp. 3836-3840. 

  37. Liu, L., Tang, L., Dong, W., Yao, S., and?Zhou, W., "An overview of topic modeling?and its current applications in bioinformatics", SpringerPlus, Vol. 5, No.?1, 2016, pp. 1-22. 

  38. Mikolov, T., Chen, K., Corrado, G., and?Dean, J., "Efficient estimation of word?representations in vector space", Proceedings of Workshop at ICLR, 2013. 

  39. Mimno, D., Li, W., and McCallum, A.,?"Mixtures of hierarchical topics with pachinko allocation", Paper presented at?the Proceedings of the 24th International?Conference on Machine Learning, 2017. 

  40. Nam, S. and Lee, H., "Airline Passenger?Characterizations Using LDA Topic?Modeling", Korean management science?review, Vol 36, No. 3, Sep, 2019, pp. 67-85. 

  41. Noh, S., "Analysis of Issues Related to?Artificial Intelligence Based on Topic?Modeling", Journal of Digital Convergence, Vol. 18, No. 5, May 28, 2020, pp.?75-87. 

  42. Park, D., "An analysis of user needs by?user's review, based on text-mining : focusing on Bank-Salad and Mint", Graduate?School of Information, Yonsei University, 2022, Seoul. 

  43. Park, J., "Analyzing AI semiconductor?trends and global business activities using patent data", Graduate School of?Information, Yonsei University, 2020,?Seoul. 

  44. Park, J., Hong, S., and Kim, J., "A Study on Science Technology Trend and Prediction Using Topic Modeling", Journal of the?Korea Industrial Information Systems?Research, Vol. 22, No. 4, August 31,?2017, pp. 19-28. 

  45. Pessoa, A., "Innovation and Economic?Growth: What is the actual importance?of R&D?", Universidade do Porto,?Faculdade de Economia do Porto, FEP?Working Papers, No, 254, Nov, 2007. 

  46. Rani, S. and Kumar, M., "Topic modeling?and its applications in materials science?and engineering", Materials Today: Proceedings, Vol 45, 2021, pp. 5591-5596. 

  47. Saidi, F., Trabelsi, Z., and Thangaraj,?E., "A novel framework for semantic classification of cyber terrorist communities?on Twitter", Engineering Applications of?Artificial Intelligence, Vol. 115, 2022, pp.?105271. 

  48. Shefer, D. and Frenkel, A., "R&D, firm?size and innovation: An empirical analysis", Technovation, Vol. 25, No, 1, 2022,?pp, 25-32. 

  49. Silveira, R., Fernandes, C., Neto, J. A.?M., Furtado, V., and Pimentel Filho, J.?E., "Topic modelling of legal documents?via legal-bert", SSRN Electronic Journal,?2021. 

  50. So, J. and Shin, P., "Rating Prediction?by Evaluation Item through Sentiment?Analysis of Restaurant Review", Journal?of the Korea Society of Computer and?Information, Vol. 25, No. 6, June 30,?2020, pp. 81-89. 

  51. Tekic, Z., Kukolj, D., Drazic, M., and?Vitas, M., "Towards Understanding The?Role and Value of Patents in a?Knowledge-Based Economy", DAAAM?International Scientific Book, 2003. 

  52. Thielmann, A. F., Weisser, C., Kneib,?T., and Saefken, B., "Coherence-Based?Document Clustering", 2023 IEEE 17th?International Conference on Semantic?Computing (ICSC), Laguna Hills, CA,?USA, 2023, pp. 9-16. 

  53. Vayansky, I. and Kumar, S. A. P., "A review of topic modeling methods", Information systems, Oxford, Vol. 94, 2021,?p. 101582. 

  54. Wang, J. and Hsu, C., "A topic-based patent analytics approach for exploring?technological trends in smart manufacturing", Journal of Manufacturing?Technology Management, Vol. 193, No.?1, 2020, pp. 110-135 

  55. Wang, Y., Shi, Z., Guo, X., Liu, X., Zhu,?E., and Yin, J., "Deep embedding for determining the number of clusters", Paper?presented at the Proceedings of the AAAI?Conference on Artificial Intelligence,?2018. 

  56. Werzinsky, J., Zhong, Z., and Zou, X.,?"Analyzing Folktales of Different?Regions Using Topic Modeling and?Clustering", arXiv.2206.04221, 2022. 

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로