$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

온라인 뉴스 제목 분석을 통한 특정 장소 이벤트 성과 예측을 위한 형태소 분석 방법
A Morphological Analysis Method of Predicting Place-Event Performance by Online News Titles 원문보기

한국전자거래학회지 = The Journal of Society for e-Business Studies, v.21 no.1, 2016년, pp.15 - 32  

최석재 (Humanitas BigData Research Center, Kyung Hee University) ,  이재웅 (Humanitas BigData Research Center, Kyung Hee University) ,  권오병 (School of Management, Kyung Hee University)

초록
AI-Helper 아이콘AI-Helper

공개된 데이터인 온라인 뉴스 기사 중 상당수는 도시와 같은 특정 장소에서 발생하는 이벤트에 관련된 사실과 의견을 담고 있어 독자의 의사 결정에 영향을 끼친다. 따라서 대량의 인터넷 뉴스 기사를 분석하면 향후 사람들이 특정 이벤트에 대하여 어떠한 선택을 할지 예상할 수 있을 것이다. 이에 본 연구는 온라인 뉴스 기사 제목을 형태소 분석하여 특정 장소에서 이루어질 이벤트의 성과를 사전에 예측하는 방법을 제안하고자 한다. 기사 제목은 기사의 가장 핵심적인 내용을 담고 있어 본문보다 사실과 의견이 더 정확하게 발현될 뿐 아니라, 모바일 환경에서는 기사 본문보다 더 큰 영향력을 가지기 때문에 이벤트의 성과 예측에 효과적인 자료이다. 이에 인터넷 뉴스 기사의 제목을 수집하여 학습 데이터와 평가 데이터로 구분하고, 학습 데이터에서 유의한 극성을 보이는 형태소를 추출하여 전체 기사의 제목을 감성 분석하였다. 여기에 뉴스 기사가 갖는 특성이 반영될 수 있도록 기사 검색량과 기사 산출량 정보를 변인에 추가하여 이벤트 성과를 예측하는 알고리즘을 수립하였다. 그 결과 70.6%의 성공률로 성과를 예측하여 다른 비교 대상 분석 방법과 분명한 차이를 보였다. 도출된 이벤트 성과 예측 정보는 이벤트를 준비하는 기관 및 업체에서 예상 수요량을 결정할 때 도움을 줄 수 있을 것이다.

Abstract AI-Helper 아이콘AI-Helper

Online news on the Internet, as published open data, contain facts or opinions about a specific affair and hence influences considerably on the decisions of the general publics who are interested in a particular issue. Therefore, we can predict the people's choices related with the issue by analyzin...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본고에서는 문서를 모든 품사의 형태소 단위로 분리하여 긍정적인 문서에서 배타적으로 사용되는 형태소와 부정적인 문서에서 배타적으로 사용되는 형태소를 추출하여 극성 형태소 목록을 수집하였다. 기존 연구에서는 명사와 동사 등 실질 어휘만을 대상으로 긍부정 어휘 목록을 구축한 것에 비하여본 연구에서는 형식 형태소에 대해서도 목록 가능성을 살핌으로써 한국어의 특성에 맞는긍부정 단어의 목록을 확보하였다. 영어의 경우에도 전치사, 접속사, 관사 등의 형식형태소가 적지 않은 만큼 적용이 가능할 것이다.
  • 따라서 본 연구에서는 특정 장소의 이벤트에 대해서 사전에 게재된 비정형데이터로서의 인터넷 뉴스를 분석하여 그 장소에서 벌어질 이벤트의 성과(예: 예상 참가자 수)를 예측하는 방안을 마련하고자 한다. 이를 해결하기 위하여 본 연구에서는 뉴스 기사의 전문을 분석하기보다 기사의 가장 핵심적인 요소인 기사 제목만을 분석하는 접근법을 택하였다.
  • 이처럼 감성 단어의 수집과 감성 문서의 분석에는 언어적 특징과 문서의 특징을 고려해야 함에도 불구하고 기존의 연구는 이를 충분히 반영하지 못했다. 본 논문에서는 이러한 점을 보완 및 반영하여 연구를 진행한다.
  • 본 연구는 데이터 마이닝 기법을 이용하여 이벤트의 성과를 예측하는 방안을 제안하였다. 제안한 방안은 저비용이면서 객관적이고 적시적인 정보를 줄 수 있다는 점에서 성과 예측을 위하여 많은 비용을 들이기 어려운 지방 자치단체 및 관련 기관에 큰 도움을 줄 수 있을 것으로 생각한다.
  • 이와 같은 뉴스 기사의 특징을 고려한 본 연구의 예측 함수는 긍정적 기사의 양을 단순히 긍정적으로 보는 단순 예측 함수에 비하여 높은 성과를 내었다. 본 연구는 데이터 마이닝을 통한 성과 예측 시에는 데이터의 긍부정성의 증감을 데이터의 성격에 비추어 해석해야 한다는 시사점을 제시한다.
  • 본 연구는 이벤트 시작 직전 일의 기사를 바탕으로 이루어졌다. 의미 있는 결과를 얻을 수 있었으나, 차후 전 기간에 걸친 이벤트 관련 기사의 수집을 통한 분석이 이루어진다면 추가적으로 시사성 있는 결과를 확보할 것으로 보인다.
  • 그러나 해당 이벤트의 인지도가 이미 높아 성공에 대한 자신감이 있다면 홍보성 기사의 양은 그렇게 높아지지 않을 것이다. 본 연구에서는 개최 직전 홍보성 기사의 증감을 예상 관람객 수에 반비례하는 결정요인으로 본 반면, 홍보성 기사와 무관한 사회적으로 발생한 부정적 사건은 예상 관람객 수에 비례하게 부정적으로 영향을 미치는 결정요인으로 보았다. 이와 같은 뉴스 기사의 특징을 고려한 본 연구의 예측 함수는 긍정적 기사의 양을 단순히 긍정적으로 보는 단순 예측 함수에 비하여 높은 성과를 내었다.
  • 셋째, 지역 뉴스를 분석하여 잠재적 가능성이 있는 이벤트 아이템을 발굴하는 방안이다. 지역 간 뉴스를 비교하여 해당 지역에만 특징적으로 나타나는 키워드를 분석하는 방법[21]을 통해 그 지역의 차별화된 강점을 찾고, 이를 시대적 문화 코드에 접목시켜 경제적 효과를 낳을 수 있는 방안을 마련할 필요가 있다.
  • 기계적이고 자동화된 방법으로 대량의 감성 단어를 추출할 필요가 있다. 앞으로 점수가 부여된 영화 리뷰와 같이 긍부정성이 명확한 문서를 대량으로 수집하여 감성 단어를 확보하는 방안에 대하여 연구하고자 한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
온라인 뉴스 기사는 어떤 영향을 끼치는가? 공개된 데이터인 온라인 뉴스 기사 중 상당수는 도시와 같은 특정 장소에서 발생하는 이벤트에 관련된 사실과 의견을 담고 있어 독자의 의사 결정에 영향을 끼친다. 따라서 대량의 인터넷 뉴스 기사를 분석하면 향후 사람들이 특정 이벤트에 대하여 어떠한 선택을 할지 예상할 수 있을 것이다.
온라인 뉴스 기사라는 비정형 텍스트에서 기사가 의도하는 긍부정성의 정확도를 추론하는 것이 어려운 이유는 무엇인가? 그러나 온라인 뉴스 기사라는 비정형 텍스트에서 기사가 의도하는 긍부정성(stance)의정확도를 추론하는 것은 쉬운 일이 아니다. 주된 원인은 뉴스 기사가 사건을 심층적으로 다루는 경우에는 특정 사안에 대한 복수의 의견이 실릴 수 있어 텍스트 마이닝 추론 결과가 뉴스가 원래 의도하던 주된 긍부정성과 일치하지 않을 수 있기 때문이다. 즉, 하나의 뉴스 기사는 설득력을 갖추기 위하여 자신의 견해를 뒷받침하는 내용은 물론 다른 견해의 내용도 들어가며, 이해를 돕기 위해 핵심적인 내용이 아닌 주변적인 이야기도 함께 전달되는 것이다.
기사 제목은 어떤 자료인가? 이에 본 연구는 온라인 뉴스 기사 제목을 형태소 분석하여 특정 장소에서 이루어질 이벤트의 성과를 사전에 예측하는 방법을 제안하고자 한다. 기사 제목은 기사의 가장 핵심적인 내용을 담고 있어 본문보다 사실과 의견이 더 정확하게 발현될 뿐 아니라, 모바일 환경에서는 기사 본문보다 더 큰 영향력을 가지기 때문에 이벤트의 성과 예측에 효과적인 자료이다. 이에 인터넷 뉴스 기사의 제목을 수집하여 학습 데이터와 평가 데이터로 구분하고, 학습 데이터에서 유의한 극성을 보이는 형태소를 추출하여 전체 기사의 제목을 감성 분석하였다.
질의응답 정보가 도움이 되었나요?

참고문헌 (40)

  1. Ahn, S. and Cho, S., "Stock Prediction Using News Text Mining and Time Series Analysis," Korea Computer Congress, Vol. 37, No. 1, pp. 364-369, 2010. 

  2. Ahn, S. H., Lee, S. H., and Kwon, O. S., "Activation Dimension: A Mirage in the Affective Space?," Korean Psychology Association, Vol. 7, No. 1, pp. 107-123, 1993. 

  3. Allport, G. W. and Odbert, H. S., "Traitnames: A psycho-lexical study," Psychological Monographs, Vol. 47, No. 1, 1936. 

  4. Baccianella, S., Esuli, A., and Sebastiani, F., "SentiWordNet 3.0: An Enhanced Lexical Resource for Sentiment Analysis and Opinion Mining," In Proceedings of the 7th Conference on International Language Resources and Evaluation (LREC '10), pp. 2200-2204, 2010. 

  5. Bautin, M., Vijayarenu L., and Skiena, S., "International Sentiment Analysis for News and Blogs," ICWSM, 2008. 

  6. Entman, R. M., "How the Media Affect What People Think: An Information Processing Approach," The Journal of Politics, Vol. 51, No. 2, pp. 347-370, 1989. 

  7. Falkheimer, J., "When Place Images Collides: Place Branding and News Journalism," InGeographies of Communication: the Spatial Turn in Media Studies, Nordicom, 2006. 

  8. Fehr, B. and Russell, J. A., "Concept of emotion viewed from a prototype perspective," Journal of experimental psychology: General, Vol. 113, No. 3, pp. 464-486, 1984. 

  9. Fenton, N., "New Media, Old News, Journalism and Democracy in the Digital Age," English language edition Published by SAGE Publications, 2009. 

  10. Fox, C., "A Stop List for General Text," SIGIR forum, Vol. 24, No. 1-2, pp. 19-35, 1990. 

  11. Gim, E., "A Study on the Korean Emotion Verbs," Ph.D. Thesis, Chonnam National University, 2004. 

  12. Go, A., Huang, L., and Bhayani, R., "Twitter sentiment analysis," Entropy, p. 17, 2009. 

  13. Godbole, N., Srinivasaiah, M., and Skiena, S., "Large-Scale Sentiment Analysis for News and Blogs," ICWSM, pp. 7-21, 2007. 

  14. Hatzivassiloglou, V. and McKeown, K. R., "Predicting the semantic orientation of adjectives," Proceedings of the 35th annual meeting of the association for computational linguistics and eighth conference of the european chapter of the association for computational linguistics, Association for Computational Linguistics, pp. 174-181, 1997. 

  15. Hiroshi, K., Tetsuya, N., and Hideo, W., "Deeper sentiment analysis using machine translation technology," Proceedings of the 20th international conference on Computational Linguistics. Association for Computational Linguistics, p. 494, 2004. 

  16. Kamps, J., Marx, M., Mokken, R. J., and Rijke, M. De., "Using WordNet to Measure Semantic Orientations of Adjectives," LREC, Vol. 4, pp. 1115-1118, 2004. 

  17. Kanhabua, N., Balnco, R., Matthews, M., "Ranking related news predictions," SIGIR 2011 Proceedings of the 34th international ACM SIGIR conference on Research and development in Information Retrieval, pp. 755-764, 2011. 

  18. Korea Press Foundation, "2014 Media Audience Opinion Survey," 19th User Behavior Survey of the media environment changes 2014-5, 2014. 

  19. Lee, G., "Economic News and Stock Market Correlation: A Study of the UK Market," Conference on Terminology and Knowledge Engineering, 2002. 

  20. Lee, S. J. and Kim, H. J., "Keyword Extraction from News Corpus using Modified TF-IDF," The Journal of Society for e-Business Studies, Vol. 14, No. 4, pp. 59-73. 

  21. Lee, W. and Lim, N., "A Study on the Elements of City Brand Image and Influences," Journal of Korea Planners Association, Vol. 40, No. 6, pp. 177-192, 2005. 

  22. Leon, J. A., "The effects of headlines and summaries on news comprehension and recall," Reading and Writing: An Interdisciplinary Journal, Vol. 9, pp. 85-106, 1997. 

  23. Liu, B., Hu, M., and Cheng, J., "Opinion observer: analyzing and comparing opinions on the web," Proceedings of the 14th international conference on World Wide Web, ACM, 2005. 

  24. Mitchell, M. L. and Mulherin, J. H., "The impact of public information on the stock market," Journal of Finance, pp. 923-950, 1994. 

  25. Nasukawa, T. and Yi, J., "Sentiment analysis: Capturing favorability using natural language processing," Proceedings of the 2nd international conference on Knowledge capture, ACM, pp. 70-77, 2003. 

  26. Pang, B., Lee, L., and Vaithyanathan, S., "Thumbs up?: sentiment classification using machine learning techniques," Proceedings of the ACL-02 conference on Empirical methods in natural language processing-Volume 10, Association for Computational Linguistics, pp. 79-86, 2002. 

  27. Park, I. J., "The analysis of Korean affective terms: listing affective terms and exploring dimensions in the affective terms," Master thesis, Seoul National University, 2001. 

  28. Peramunetilleke, D. and Wong, R. K., "Currency Exchange Rate Forecasting from News Headlines," ADC '02 Proceedings of the 13th Australasian database conference, Vol. 5, pp. 131-139, 2002. 

  29. Pew Research Center, The State of the News Media 2012: An Annual Report on American Journalism, Retrieved from http://www.journalism.org/2012/10/01/future-mobile-news/>, 2012. 

  30. Read, J., "Using emoticons to reduce dependency in machine learning techniques for sentiment classification," Proceedings of the ACL student research workshop, Association for Computational Linguistics, pp. 43-48, 2005. 

  31. Riloff, E., Wiebe, J., and Wilson, T., "Learning subjective nouns using extraction pattern bootstrapping," Proceedings of the seventh conference on Natural language learning at HLT-NAACL 2003, Association for Computational Linguistics, Vol. 4, pp. 25-32, 2003. 

  32. Salton, G., "Automatic Text Processing: The Transformation, Analysis, and Retrieval of," Reading: Addison-Wesley, 1989. 

  33. Schumaker, R. P. and Chen, H., "Textual analysis of stock market prediction using breaking financial news: The AZFin text system," ACM Transactions on Information Systems(TOIS), Vol. 27, No. 2, p. 12, 2009. 

  34. Shaver, P., Schwartz, J., Kirson, D., and O'connor, C., "Emotion knowledge: further exploration of a prototype approach," Journal of personality and social psychology, Vol. 52, No. 6, pp. 1061-1086, 1987. 

  35. Turney, P. D. and Littman, M. L., "Measuring praise and criticism: Inference of semantic orientation from association," ACM Transactions on Information Systems (TOIS), Vol. 21, No. 4, pp. 315-346, 2003. 

  36. Wilson, T., Wiebe, J., and Hoffmann, P., "Recognizing contextual polarity in phrase- level sentiment analysis," Proceedings of the conference on human language technology and empirical methods in natural language processing, Association for Computational Linguistics, pp. 347-354, 2005. 

  37. Yang, C., Lin, K. H. Y., and Chen, H. H., "Emotion classification using web blog corpora," Web Intelligence, IEEE/WIC/ACM International Conference on, IEEE, pp. 275-278, 2007. 

  38. Yao, J., Wu, G., Liu J., and Zheng, Y., "Using bilingual lexicon to judge sentiment orientation of Chinese words," Computer and Information Technology, 2006. CIT '06. The Sixth IEEE International Conference on, IEEE, p. 38, 2006. 

  39. Yu, E., Kim, Y., Kim, N., Jeong, S. R., "Predictiong the Direction of the Stock Index by Using a Domain-Specific Sentiment Dictionary," Journal of Intelligence and Information Systems, Vol. 19, No. 1, pp. 95-110, 2013. 

  40. Yu, H. and Hatzivassiloglou, V., "Towards answering opinion questions: Separating facts from opinions and identifying the polarity of opinion sentences," Proceedings of the 2003 conference on Empirical methods in natural language processing, Association for Computational Linguistics, pp. 129-136, 2003. 

저자의 다른 논문 :

관련 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로