$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

시계열분석과 인공신경망을 이용한 실시간검색어 변화 예측
Predicting changes of realtime search words using time series analysis and artificial neural networks 원문보기

디지털융복합연구 = Journal of digital convergence, v.15 no.12, 2017년, pp.333 - 340  

정민영 (광주여자대학교 실버케어학과)

초록
AI-Helper 아이콘AI-Helper

실시간검색어는 지금 바로 이슈가 되는 검색어의 검색 증가율이 단기간에 급상승하는 것을 중심으로 하기 때문에 일정기간 지속적으로 관심도를 유지하고 있는 이슈를 나타내지 못하고 이들이 가까운 미래에 어떤 변화를 보이는지에 대한 것도 알 수 없는 한계를 가지고 있다. 본 논문에서는 이러한 한계를 극복할 수 있도록 일정기간 동안 상위 10위 안에 속한 적이 있는 실시간검색어에 대해 일자별, 시간별 지속성을 평가하여 꾸준히 관심을 받는 검색어를 추출한다. 그런 다음, 이들 중 상위에 속하는 검색어의 관심도가 어떻게 변화하는지를 알 수 있게 하는 시계열 분석과 신경망을 이용하는 방법을 제시하고 이를 통해 도출한 실제 예를 통해 가까운 미래의 변화량을 예측한 결과를 보인다. 일자별로는 시계열 분석을, 시간별로는 인공신경망의 학습을 통해 예측하는 것이 좋은 결과를 보인다는 것을 알 수 있다.

Abstract AI-Helper 아이콘AI-Helper

Since realtime search words are centered on the fact that the search growth rate of an issue is rapidly increasing in a short period of time, it is not possible to express an issue that maintains interest for a certain period of time. In order to overcome these limitations, this paper evaluates the ...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 따라서 본 논문에서는 이러한 한계를 극복할 수 있도록 일정기간 실시간검색어 상위 10에 속한 적이 있는 것에 대한 검색 지속성을 일자별, 시간별로 평가하여 일자별 지속성이 큰 상위 10개와 시간별 지속성이 큰 상위 10개를 구하고, 이를 바탕으로 일정기간 동안 변화량을 분석하여 가까운 미래의 변화를 예측하는 방법과 이 방법을 적용한 실제적인 사례를 제시하고자 한다.
  • 본 논문에서는 [Table 1]과 같이 입력층의 노드수에 따라 다양한 은닉층, 출력층의 노드수를 정의하여 최적의 인공신경망 모델을 선정하고자 테스트하였고 그 결과 평균오차가 비교적 작고 12시간을 예측할 수 있는 모델 6을 최적의 모델로 선정하였다. 은닉층이 1개 층인 경우에 사용할 수 있는 R언어의 nnet 패키지에 있는 nnet()함수[19]를 사용하여 인공신경망 학습을 수행하고 최적의 인공신경망 모델에 의해 12시간까지의 미래를 예측한다.
  • 본 논문에서는 실시간검색어가 단기간 급상승 검색증가율을 기준으로 상위 10개를 선정하는 미시적 관점때문에 일정기간 꾸준히 관심도를 유지하는 검색 지속성과 검색어가 가까운 미래에 어떤 변화를 보이는지에 대한 검색 방향성을 알 수 없는 한계를 극복할 수 있도록 하기 위하여 일정기간 실시간검색어의 검색 지속성을 일자별, 시간별로 변화량 중심으로 평가하여 일자 단위 변화량 기반의 '출현일자 상위 10 검색어'에 대한 일자별 시계열 분석과 시간 단위 변화량 기반의 '출현시간 상위 10 검색어'에 대한 인공신경망 학습에 의한 변화 예측을 하는 방법을 제시하였다.
  • 본 논문에서는 이를 개선하여 실시간검색어의 지속성을 추출하기 위한 방법으로 제시한 것이 일자 단위 변화량을 기준으로 집계하는 방법과 시간 단위 변화량을 기준으로 집계하는 방법이다.
  • 이 중에서 지수평활법은 단기간에 발생하는 불규칙데이터를 평활화 하되 최근의 시계열 자료에 더 가중치를 두어 예측하는 방법이므로 가까운 미래를 예측하는데 많이 사용한다[17]. 본 논문에서는 지수평활법에 의한 시계열 분석을 통해 가까운 미래를 예측하고자 한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
실시간검색어의 한계점은 무엇인가? 하지만, 주로 사용자의 관심도가 일시적으로 급상승하는 검색어를 제공하는 서비스를 중심으로 하기 때문에 일정기간 동안 지속적으로 관심을 받는 검색어에 관한 것은 알 수 없을 뿐 아니라 지속성이 높은 검색어가 가까운 미래에 어떻게 변화할지에 대한 흐름을 파악하는 정보를 제공하기는 힘들다[11,12]. 이러한 서비스와 유사하게 현재까지의 일정기간 동안 변화를 알려주는 것으로 구글 트랜드가 있지만 이 서비스는 특정 검색어의 최대 검색량에 대한 상대적 지표만을 알려주므로 다른 검색어들과의 비교할 수 있는 질적인 차이를 파악하기 힘들다.
시계열 분석이란 무엇인가? 시계열 분석은 시간에 따른 변화량을 계열화한 시계열 데이터를 시간의 흐름에 따라 변화하는 함수로 표현하고 이를 통해 흐름을 분석하는 것으로, 과거에서 현재까지의 변화량을 분석함으로써 가까운 미래에 대한 예측하는데 활용되고 있다[16]. 대표적인 시계열 분석 방법에는 회귀법, 이동평균법, 지수평활법, 요소분할법 등이 있다.
시계열 분석 방법에는 무엇이 있는가? 시계열 분석은 시간에 따른 변화량을 계열화한 시계열 데이터를 시간의 흐름에 따라 변화하는 함수로 표현하고 이를 통해 흐름을 분석하는 것으로, 과거에서 현재까지의 변화량을 분석함으로써 가까운 미래에 대한 예측하는데 활용되고 있다[16]. 대표적인 시계열 분석 방법에는 회귀법, 이동평균법, 지수평활법, 요소분할법 등이 있다. 이 중에서 지수평활법은 단기간에 발생하는 불규칙데이터를 평활화 하되 최근의 시계열 자료에 더 가중치를 두어 예측하는 방법이므로 가까운 미래를 예측하는데 많이 사용한다[17].
질의응답 정보가 도움이 되었나요?

참고문헌 (21)

  1. Min Chen, Shiwen Mao, and Yunhao Liu, "Big Data: A Survey", Mobile Netw Appl, Vol. 19, pp. 171-209, 2014. 

  2. Ibrahim Abaker Targio Hashem, Ibrar Yaqoob, Nor Badrul Anuar, Salimah Mokhtar, Abdullah Gani, and Samee Ullah Khan, "The rise of big data on cloud computing:Review and open research issues", Information Systems, Vol. 47, pp. 98-115, 2015. 

  3. Su-Hyeon Namn, "Knowledge Creation Structure of Big Data Research Domain", Journal of Digital Convergence, Vol. 13, No. 9, pp. 129-136, 2015. 

  4. Shinkon Kim, Sukjun Lee, and JeonggonA Kim, "Study on the Development of Phased Big Data Distribution Model Based on Big Data Distribution Ecology", Journal of Digital Convergence, Vol. 14, No. 5, pp. 95-106, 2016. 

  5. Naver Search Help, "Realtime hot searches", https://help.naver.com/support/service/main.nhn?serviceNo606&categoryNo1989, 2015. 

  6. Daum Search Help, "Realtime hot issues" http://cs.daum.net/faq/15/14957.html#28971, 2016. 

  7. Min-Yeong Chong, "Selecting a key issue through association analysis of realtime search words", Journal of Digital Convergence, Vol. 13, No. 12, pp. 161-169, 2015. 

  8. Min-Yeong Chong, "Extracting week key issues and analyzing differences from realtime search keywords of portal sites", Journal of Digital Convergence, Vol. 14, No. 12, pp. 237-243, 2016. 

  9. Kyoung-HoChoi,Jeong-Hye Park, "The Analysis of Public Awareness about Literary Therapy by Utilizing Big Data Analysis - The aspects of convergence literature and statistics", Journal of Digital Convergence, Vol. 13, No. 4, pp. 395-404, 2015. 

  10. Matthew A. Russell, "Mining the Social Web:Data Mining Facebook, Twitter, LinkedIn, Google+, GitHub and More", p.411, O'Reilly Media, Inc., 2013. 

  11. Xiao Fang, and Olivia R. Liu Sheng, "Designing a better web portal for digital government: a web-mining based approach", Proceedings of the 2005 national conference on Digital government research. Digital Government Society of North America, pp. 277-278, 2005. 

  12. KISO Validation Committee, "The fourth validation report about realtime hot searches of Naver", 2015. 

  13. Simon Dennis, Peter Bruza and Robert McArthur, "Web Searching: A Process-Oriented Experimental Study of Three Interactive Search Paradigms", Journal of the American Society for Information Science and Technology, Vol. 53, No. 2, pp. 120-133, 2002. 

  14. Seong-Hoon Lee and Dong-Woo Lee, "Current Status of Big Data Utilization", Journal of Digital Convergence, Vol. 11, No. 2, pp. 229-233, 2013. 

  15. Jon Starkweather, "Introduction to basic Text Mining in R", p.10, University of North Texas, 2014. 

  16. George E. P. Box,Gwilym M. Jenkins,Gregory C. Reinsel, and Greta M. Ljung, Time Series Analysis: Forecasting and Control, John Wiley & Sons, 2016. 

  17. Alysha M De Livera, Rob J Hyndman, and Ralph D Snyder, "Forecasting time series with complex seasonal patterns using exponential smoothing", Journal of the American Statistical Association, Vol. 106, pp. 1513-1527, 2011. 

  18. Guoqiang Zhang, B. Eddy Patuwo, and Michael Y. Hu, "Forecasting with artificial neural networks: The state of the art", International Journal of Forecasting, Vol. 14, pp. 35-62, 1998. 

  19. Frauke Gunther and Stefan Fritsch, "neuralnet: Training of Neural Networks", The R Journal Vol. 2, No. 11, pp. 30-38, 2010. 

  20. Yoon-Su Jeong, "Subnet Generation Scheme based on Deep Learning for Healthcare Information Gathering", Journal of Digital Convergence, Vol. 15, No. 3, pp. 221-228, 2017. 

  21. Eun-Jung Choi, Sea-Won Choi, Se-Yeon Lee, and Myhung-Joo Kim, "Analysis of the effect of the mention in SNS on the result of election", Journal of Digital Convergence, Vol. 15, No. 2, pp. 191-197, 2017. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로