$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

자동 트렌드 탐지를 위한 속성의 정의 및 트렌드 순위 결정 방법
Trend Properties and a Ranking Method for Automatic Trend Analysis 원문보기

정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용, v.36 no.3, 2009년, pp.236 - 243  

오흥선 (한국과학기술원 정보통신공학과) ,  최윤정 (한국과학기술원 정보통신공학과) ,  신욱현 (한국과학기술원 정보통신공학과) ,  정윤재 (한국과학기술원 정보통신공학과) ,  맹성현 (한국과학기술원 정보통신공학과)

초록
AI-Helper 아이콘AI-Helper

특허, 뉴스, 블로그와 같이 시간 정보가 있는 문서들로부터의 자동적인 트렌드 분석(trend analysis)은 토픽탐지 및 추적 기술(TDT: Topic Detection and Tracking)과 더불어 중요한 연구 분야로 대두되고 있다. 과거 연구들은 대부분 트렌드과 관련된 단어의 출현 빈도 정보를 이용하여 주어진 개념의 중요도를 측정하고 이 개념의 시간에 따른 트렌드 라인을 보여주는 것에 초점을 맞췄다. 신출 트렌드 (emerging trend)를 탐지하기 위해서는 주어진 개념의 출현 빈도수 변화와 같은 간단한 방법이나 학습 데이타와 비교하여 차이를 탐지하여 제시하는 방법이 사용되었다. 그러나 여러 트렌드 중에서 특징적인 트렌드를 찾아서 사용자에게 제공하기 위해서는 트렌드 순위 결정 함수가 필요하다. 본 논문은 트렌드의 다양한 측면을 정량화하기 위하여 출현 빈도로 구성된 트렌드 곡선으로부터 네 가지 속성 (변동성, 지속성, 안정성, 누적량) 을 정의하고 이를 활용한 트렌드 순위 결정 방법을 제안한다. 일련의 실험을 통하여 각 속성의 유용성을 검증하고 속성들의 조합이 순위 결정에 어떤 영향을 미치는지 분석하였다. 실험결과로부터 네 가지 속성을 모두 조합할 경우 특징적인 트렌드 탐지에 더욱 기여하는 것을 알 수 있다.

Abstract AI-Helper 아이콘AI-Helper

With advances in topic detection and tracking(TDT), automatic trend analysis from a collection of time-stamped documents, like patents, news papers, and blog pages, is a challenging research problem. Past research in this area has mainly focused on showing a trend line over time of a given concept b...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 트렌드의 다양한 측면을 정량화하기 위한 4가지 트렌드 속성 및 이를 이용한 새로운 트렌드 순위 결정 방법을 제안한다. 제안하는 트렌드 순위 결정 방법은 기존의 출현 빈도 정보를 활용하여 4 가지 속성값을 결정하고 이를 조합함으로써 하나의 특징적인 값을 계산하고 비교하는 것으로 이루어져 있다.
  • 트렌드를 탐지할 수 있는 대상의 수가 많아질수록 많은 트렌드 중 특징적인 트렌드를 선별하는 문제가 중요해진다. 논문은 과거 출현 빈도 합을 이용한 트렌드 순위 결정 방법의 한계를 소개하며 이를 극복하기 위한 4가지 속성(변동성, 지속성, 안정성, 누적량)을 정의하고 4가지 속성과유전 알고리즘을 이용하는 새로운 트렌드 순위 결정 방법을 제안하였다. 각 속성들과 제안된 순위 결정 방법을 검증하기 위하여 실제 웹 문서로부터 50개의 평가 케이스와 그에 상응하는 금본위 트렌드를 구축하고 이용하여 여러가지 실험을 하였다.
  • 본 실험의 목적은 앞서 정의한 4가지의 속성들이 트렌드 강도를 측정에 있어 유용성을 입증하는 것이다. 4 가지의 속성 중 누적량은 누적 출현 빈도수와 같은 의미로 이미 다른 연구에서 일반적으로 자주 쓰고 있는 것이지만, 다른 3가지의 속성은 본 논문에서 처음 정의되는 것이기 때문에 각 속성의 유용성 입증이 필요하다.

가설 설정

  • 각 케이스는 5개의 서브 트렌드로 구성되어있고 각 트렌드는 서로 다른 속성값을 가지고 있다. 따라서 350개의 케이스가 4가지의 속성으로 가능한 모든 조합을 포함할 수 있다고 가정한다.
  • 본 연구에서 트렌드는 한 객체(object)에 대하여 주어진 기간 동안의 인기도 분포(popularity distribution) 로정의한다. 트렌드의 대상 객체는 사용자가 흥미를 가지는 토픽 중에서 명시적인 대상을 나타낸다.
본문요약 정보가 도움이 되었나요?

참고문헌 (17)

  1. Firminger, L., Trend Analysis: a collection of sub methodologies, Swinburne University of Technology, 2003 

  2. Glance, N., M. Hurst, and T. Tomokiyo, Blog-Pulse: Automated Trend Discovery for Weblogs, In WWW 2004 Workshop on the Weblogging Ecosystem: Aggregation, Analysis and Dynamics, 2004 

  3. Mei, Q. and C.X. Zhai., Discovering evolutionary theme patterns from text: an exploration of temporal text mining, In Proceedings of the eleventh ACM SIGKDD international conference on Knowledge discovery in data mining, 2005 

  4. Google Trends: http://www.google.com/trends 

  5. Lavrenko, V., et al., Language models for financial news recommendation, In Proceedings of the ninth international conference on Information and knowledge management, 2000 

  6. Kontostathis, A., et al., A Survey of Emerging Trend Detection in Textual Data Mining, In Survey of Text Mining: Clustering, Classification, and Retrieval, 2003 

  7. Rajaraman, K. and A.H. Tan, Topic Detection, Tracking, and Trend Analysis Using Self-Organizing Neural Networks, In Proceedings of the 5th Pacific-Asia Conference on Knowledge Discovery and Data Mining, 2001 

  8. Morinaga, S. and K. Yamanishi, Tracking dynamics of topic trends using a finite mixture model. In Proceedings of the tenth ACM SIGKDD international conference on Knowledge discovery and data mining, 2004 

  9. Fung, G.P.C., J.X. Yu, and W. Lam, News Sensitive Stock Trend Prediction. In Proceedings of the 6th Pacific-Asia Conference on Advances in Knowledge Discovery and Data Mining, 2002 

  10. Lee, J., S. Cho, and J. Baek, Trend detection using auto-associative neural networks: Intraday KOSPI 200 futures, In Computational Intelligence for Financial Engineering, 2003 

  11. Lent, B., R. Agrawal, and R. Srikant, Discovering trends in text databases, In Proceedings of the 3rd International Conference on Knowledge Discovery and Data Mining (KDD), 1997 

  12. Run-Length Encoding: http://en.wikipedia.org/wiki/Run-length_encoding 

  13. Wright, A.H., Genetic algorithms for real parameter optimization. Foundations of Genetic Algorithms, 1991 

  14. Budanitsky, A. and G. Hirst, Evaluating WordNetbased Measures of Lexical Semantic Relatedness. Computational Linguistics, 2006 

  15. Yih, W., J. Goodman, and V.R. Carvalho, Finding advertising keywords on web pages. In Proceedings of the 15th international conference on World Wide Web, 2006 

  16. Verity, http://www.verity.comges 

  17. Holzman, L.E., Fisher, Fisher, T.A., Galisky, L. M., Kontostathis, A., and Pottenger, W. M., A Software Infrastructure for Research in Textual Data Mining. The International Journal of Artificial Intelligence Tools, volume 14, 2004 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로