$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 빅데이터 분석을 위한 한국어 SentiWordNet 개발 방안 연구 : 분노 감정을 중심으로
The Study of Developing Korean SentiWordNet for Big Data Analytics : Focusing on Anger Emotion 원문보기

한국전자거래학회지 = The Journal of Society for e-Business Studies, v.19 no.4, 2014년, pp.1 - 19  

최석재 (School of Management, Kyung Hee University) ,  권오병 (School of Management, Kyung Hee University)

초록
AI-Helper 아이콘AI-Helper

빅데이터 내에 존재하는 감정 정보를 추출하여 사용자들이 특정 대상에 대하여 갖고 있는 인식이 어떠한지를 파악하고자 하는 노력이 활발히 이루어지고 있다. 상품, 영화, 그리고 사회적 이슈 등에 대한 문장을 분석하여 사람들이 해당 주제에 어떠한 견해를 가지고 있는지를 분석하고 측정하여 구체적인 선호도를 알아내는 것이다. 문장에서 드러나는 감정 정도를 얻기 위해서는 감정어휘의 목록과 정도값을 제시할 수 있는 감정어휘사전이 필요하므로 본 연구에서는 감정어휘를 발견하는 방법과 이들의 정도값을 결정하는 문제를 다룬다. 기본적인 방법은 기초 감정어휘의 목록 수집과 이들의 정도값은 선행연구 결과와 직접 설문 방식을 이용하고, 확장된 목록의 수집과 정도값은 사전의 표제어 설명부(glosses)를 이용해 추론하는 것이다. 그 결과 발견된 감정어휘는 전형성을 띠고 있는 기본형 감정어휘, 기본형 감정어휘의 gloss에 사용된 확장형 1단계 1층위 감정어휘, 비 감정어휘 중 gloss에 기본형 또는 확장형 감정어휘를 가지고 있는 확장형 2단계 1층위 감정어휘, gloss의 gloss에 기본형 또는 확장형 감정어휘가 사용된 확장형 2단계 2층위 감정어휘의 네 종류로 나뉜다. 그리고 확장형 감정어휘의 정도값은 기본형 감정어휘의 정도값을 기초로 문형의 가중치와 강조승수를 적용하여 얻었다. 실험 결과 AND, OR 문형은 내포된 어휘의 감정 정도값을 평균내는 가중치를, Multiply 문형은 정도 부사어의 종류에 따라 1.2~1.5의 가중치를 갖는 것으로 파악되었다. 또한 NOT 문형은 사용된 어휘의 감정 정도를 일정 정도로 낮추어 역전시키는 것으로 추정된다. 또한 확장형 어휘에 적용되는 강조승수는 1층위에서 2, 2층위에서 3을 갖는 것으로 예상된다.

Abstract AI-Helper 아이콘AI-Helper

Efforts to identify user's recognition which exists in the big data are being conducted actively. They try to measure scores of people's view about products, movies and social issues by analyzing statements raised on Internet bulletin boards or SNS. So this study deals with the problem of determinin...

Keyword

질의응답

핵심어 질문 논문에서 추출한 답변
SentiWordNet의 정확도가 떨어지는 일차적인 이유는 무엇인가? SentiWordNet의 정확도가 떨어지는 일차 적인 이유는 정도값 계산의 근거 자료로 사용된 glosses가 WordNet의 것이기 때문이다. WordNet은 어휘 사이의 관계를 형성하는 데주목적이 있는 것이어서 일반 사전처럼 자세한 해설을 하지 않는다.
NOT 연산자가 쓰였을 때의 감정 정도값이 그대로 유지되지는 않는 예시는 무엇인가? 그러나 NOT 연산자가 쓰였을 때의 감정 정도값이 그대로 유지되지는 않을 것이다. 어떤 사람이 불쾌하거나 언짢을 때 직접 ‘불쾌 하다’ 또는 ‘언짢다’라는 표현을 쓰지 않고 간접적 방법인 기쁨 감정의 어휘를 부정시켜서 표현하는 이유는 분노의 감정 정도가 그만큼 큰 것은 아니기 때문이다. 엄밀히는 ‘기쁜 것은 아니다’라는 의미를 가질 뿐이다. 다른 예로, ‘나쁘지 않다’는 것은 ‘나쁘다’라는 정도가 갖는 만큼 ‘좋다’는 것이 아니라, ‘보통이다’ 정도의 의미를 가진다.
감정어휘 선정에서 우선 고려되어야 하는 것은 무엇인가? 감정어휘를 선정함에 있어 우선 고려되어야 하는 것은 언어학적 기준을 모두 충족시키는 감정어휘의 수는 제한적이라는 점이다. 따라서 실제에서 사용하기 위해서는 조건을 잘 충족시키는 전형적인 감정어휘, 즉 기본형 감정어휘를 기초로 어휘의 목록을 확장할 필요가 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (26)

  1. Abbasi, A., Chen, H., Thome, S., and Fu, T., "Affect Analysis of Web forums and Blogs Using Correlation Ensembles," IEEE Transactions on Knowledge and Data Engineering, Vol. 20, No. 9, pp. 1168-1180, 2008. 

  2. Baccianella, S., Esuli, A., and Sebastiani, F., "SentiWordNet 3.0 : An Enhanced Lexical Resource for Sentiment Analysis and Opinion Mining," In Proceedings of the 7th Conference on International Language Resources and Evaluation(LREC'10), pp. 2200-2204, 2010. 

  3. Biswas, S., Yoo, J. H., and Jung, C. Y., "A Study on Priorities of the Components of Big Data Information Security Service by AHP," Journal of Society for e-Business Studies, Vol. 18, No. 4, pp. 301-314, 2013. 

  4. Choi, S. J., "The Type and Character of Feeling Verb," EoMunNonJip, Vol. 58, pp. 127-159, 2008. 

  5. Choi, S. J., "The level of Feeling Verb : in the case of Anger words," Lingua Humanitatis, Vol. 11, No. 2, pp. 273-295, 2009. 

  6. Collins Cobuild Advanced Learner's English Dictionary, 6th Edition, Harper Collins Publishers, 2009. 

  7. Dehkharghani, R., Yanikoglu, B. D., and Tapucu, Y., "Adaptation and Use of Subjectivity Lexicons for Domain Dependent Sentiment Classification," IEEE 12th International Conference on Data Mining Workshops(ICDMW), pp. 669-673, 2012. 

  8. Esuli, A. and Sebastiani, F., "Determining the Semantic Orientation of Terms through Gloss Classification," In Proceedings of 14th ACM International conference on Information and knowledge management, pp. 617-624, 2005. 

  9. Esuli, A. and Sebastiani, F., "Determining Term Subjectivity and Term Orientation for Opinion Mining," In Proceedings of EACL-06, 11th Conference of the European Chapter of the Association for Computational Linguistics, pp. 193-200, 2006. 

  10. Esuli, A. and Sebastiani, F., "SentiWord-Net : A Publicly Available Lexical Resource for Opinion Mining," In Proceedings of the 5th Conference on Language Resources and Evaluation(LREC'06), pp. 417-422, 2006. 

  11. Esuli, A. and Sebastiani, F., "Random-Walk Models of Term Semantics : An Application to Opinion-Related Properties," In Proceedings of the 3rd language Technology Conference(LTI '07), pp. 221-225, 2007. 

  12. Gim, E. Y., "A Study on the Korean Emotion Verbs," PhD thesis, Chonnam National University, 2004. 

  13. Hamouda, A. and Rohaim, M., "Reviews Classification Using SentiWordNet Lexicon," The Online Journal on Computer Science and information Technology(OJCSIT), Vol. 2, No. 1, pp. 120-123, 2011. 

  14. Hatzivassiloglou, V. and Katheleen R. M., "Predicting the Semantic Orientation of Adjectives," In Proceedings of ACL-97, 35th Annual Meeting of the Association for Computational Linguistics, pp. 174-181, 1997. 

  15. Hwang, J. W. and Ko, Y. J., "A Korean Sentence and Document Sentiment Classification System Using Sentiment Features," Journal of KISS : computing practices, Vol. 14, No. 3, pp. 336-340, 2008. 

  16. Kamps, J., Marx, M., Mokken, R. J., and Rijke, M. D., "Using WordNet to Measure Semantic Orientation of Adjectives," In Proceedings of LREC-04, 4th International Conference on Language Resources and Evaluation, Vol. IV, pp. 1115-1118, 2004. 

  17. Lyons, W., Emotion, Cambridge UniversityPress, London, 1980. 

  18. Ohana, B. and Tierney, B., "Sentiment Classification of Reviews Using Senti-WordNet," Proceedings of the 9th IT&T Conference, 2009. 

  19. Rao, D., Lewis, S., and Reichenbach, C., "Automatic Opinion Poloarity Classification of Movie Reviews," Colorado Research in Linguistics, Vol. 17, No. 1, 2004. 

  20. Roh, J. H., Kim, H. J., and Chang, J. Y., "Improving Hypertext Classification Systems through WordNet-based Feature Abstraction," Journal of Society for e-Business Studies, Vol. 18, No. 2, pp. 95-110, 2013. 

  21. Rohracher, H., Einfuhrung in die psychologie, Urban und Schwarzenberg, Munchen, Berlin, Wien, 1976(윤흥섭 역. 심리학개론, 성원사, 1990). 

  22. Shaver, P., Schwarth, J., Kirson, D., and O'Connor, C., "Emotion Knowledge : Further Exploration of a Prototype Approach," Journal of Personality and Social Psychology, Vol. 52, No. 6, pp. 1061-1086, 1987. 

  23. Su, Q., Xiang, Kun., Wang, H., Sun, B., and Yu, S., "Using Pointwise Mutual Information to Identify Implicit Features in Customer Reviews," International Conference on the Computer Processing of Oriental Languages, pp. 22-30, 2006. 

  24. Turney, P. D. and Littman, M. T., "Measuring Praise and Criticism : Inference of Semantic Orientation from Association," ACM Transactions on Information Systems, Vol. 21, No. 4, pp. 315-346, 2003. 

  25. Yeon, J., Shim, J., and Lee, S. G., "Outlier Detection Techniques for Biased Opinion Discovery," Journal of Society for e-Business Studies, Vol. 18, No. 4, pp. 315-326, 2013. 

  26. Yoon, A. S. and Kwon, H. C., "Compononet Analysis for Constructing an Emotion Ontology," Korean Journal of Cognitive Science, Vol. 21, No. 1, pp. 157-175, 2010. 

저자의 다른 논문 :

LOADING...

활용도 분석정보

상세보기
다운로드
내보내기

활용도 Top5 논문

해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

이 논문과 함께 이용한 콘텐츠

유발과제정보 저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로