$\require{mediawiki-texvc}$
  • 검색어에 아래의 연산자를 사용하시면 더 정확한 검색결과를 얻을 수 있습니다.
  • 검색연산자
검색연산자 기능 검색시 예
() 우선순위가 가장 높은 연산자 예1) (나노 (기계 | machine))
공백 두 개의 검색어(식)을 모두 포함하고 있는 문서 검색 예1) (나노 기계)
예2) 나노 장영실
| 두 개의 검색어(식) 중 하나 이상 포함하고 있는 문서 검색 예1) (줄기세포 | 면역)
예2) 줄기세포 | 장영실
! NOT 이후에 있는 검색어가 포함된 문서는 제외 예1) (황금 !백금)
예2) !image
* 검색어의 *란에 0개 이상의 임의의 문자가 포함된 문서 검색 예) semi*
"" 따옴표 내의 구문과 완전히 일치하는 문서만 검색 예) "Transform and Quantization"
쳇봇 이모티콘
안녕하세요!
ScienceON 챗봇입니다.
궁금한 것은 저에게 물어봐주세요.

논문 상세정보

지도적 잠재의미색인(LSI)기법을 이용한 의견 문서 자동 분류에 관한 실험적 연구

An Experimental Study on Opinion Classification Using Supervised Latent Semantic Indexing(LSI)

초록

본 연구에서는 의견이나 감정을 담고 있는 의견 문서들의 자동 분류 성능을 향상시키기 위하여 개념색인의 하나인 잠재의미색인 기법을 사용한 분류 실험을 수행하였다. 실험을 위해 수집한 1,000개의 의견 문서는 500개씩의 긍정 문서와 부정 문서를 포함한다. 의견 문서 텍스트의 형태소 분석을 통해 명사 형태의 내용어 집합과 용언, 부사, 어기로 구성되는 의견어 집합을 생성하였다. 각기 다른 자질 집합들을 대상으로 의견 문서를 분류한 결과 용어색인에서는 의견어 집합, 잠재의미색인에서는 내용어와 의견어를 통합한 집합, 지도적 잠재의미색인에서는 내용어 집합이 가장 좋은 성능을 보였다. 전체적으로 의견 문서의 자동 분류에서 용어색인 보다는 잠재의미색인 기법의 분류 성능이 더 좋았으며, 특히 지도적 잠재의미색인 기법을 사용할 경우 최고의 분류 성능을 보였다.

Abstract

The aim of this study is to apply latent semantic indexing(LSI) techniques for efficient automatic classification of opinionated documents. For the experiments, we collected 1,000 opinionated documents such as reviews and news, with 500 among them labelled as positive documents and the remaining 500 as negative. In this study, sets of content words and sentiment words were extracted using a POS tagger in order to identify the optimal feature set in opinion classification. Findings addressed that it was more effective to employ LSI techniques than using a term indexing method in sentiment classification. The best performance was achieved by a supervised LSI technique.

저자의 다른 논문

참고문헌 (15)

  1. 정영미. 2005. 정보검색연구. 서울: 구미무역 출판부 
  2. 황재원, 고영중. 2008. 감정 분류를 위한 한국어 감정 자질 추출 기법과 감정 자질의 유용 성 평가. 인지과학, 19(4): 499-517 
  3. Chakraborti, S., R. Lothian, N. Wiratunga, and S. Watt. 2006. 'Sprinkling: supervised Latent Semantic Indexing.' Lecture Notes in Computer Science, 3936: 510-514 
  4. Chaovalit, P. and L. Zhou. 2005. 'Movie Review Mining: a comparison between supervised and unsupervised classification approaches.' Proc. of the 38th Annual Hawaii International Conference on System Sciences, 2005 
  5. Dave, K., S. Lawrence, and D. M. Pennock. 2003. 'Mining the peanut gallery: Opinion extraction and semantic classification of product reviews.' Proc. of the 12th International Conference on World Wide Web, 519-528 
  6. Ding, C. H. Q. 1999. 'A similarity-based probability model for Latent Semantic Indexing.' Proc. of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 59-65 
  7. Liu, Bing. 2007. Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data. Springer 
  8. Pang, Bo., and L. Lee. 2004. 'A sentimental education: Sentiment analysis using subjectivity summarization based on minimum cuts.' Pro. of the 42nd Annual Meeting of the Association for Computational Linguistics, Barcelona, Spain, 271-278 
  9. Turney, P. 2002. 'Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews.' Proc. of the 40th annual meeting of the Association for Computational Linguistics, 417-424 
  10. Wilson, T., J. Wiebe, and R. Hwa. 2004. 'Just how mad are you? Finding strong and weak opinion clauses.' Proc. of the 2004 National Conference on Association for the Advancement of Artificial Intelligence, 761-767 
  11. Yang, Y. and J. O. Pedersen. 1997. 'A comparative study on feature selection in text categorization.' Proc. of the 14th International Conference on Machine Learning, 412-420 
  12. Yu, H. and V. Hatzivassiloglou. 2003. 'Towards answering opinion questions: Separating facts from opinions and identifying the polarity of opinion sentences.' Proc. of the 8th Conference on Empirical Methods in Natural Language Processing, 129-136 
  13. Cui, H., V. Mittal, and M. Datar. 2006. 'Comparative experiments on sentiment classification for online product reviews.' Proc. of the 21st National Conference on Artificial Intelligenc,. 1265- 1270 
  14. Dumais, S. T. 1993. 'LSI meets TREC: A status report.' Proc. of the 1st Text REtrieval Conference(TREC-1), 137- 152 
  15. Pang, Bo., Lillian Lee, and Shivakumar Vaithyanathan. 2002. 'Thumbs up? Sentiment classification using machine learning techniques.' Proc. of the ACL-02 Conference on Empirical Methods in Natural Language Processing, 79-86 

이 논문을 인용한 문헌 (3)

  1. Kim, Jung-Ho ; Kim, Myung-Kyu ; Cha, Myung-Hoon ; In, Joo-Ho ; Chae, Soo-Hoan 2010. "Optimal supervised LSA method using selective feature dimension reduction" 감성과학 = Korean Journal of the science of Emotion & sensibility, 13(1): 47~60 
  2. Han, Kyoung-Soo 2010. "Experimental Study for Effective Combination of Opinion Features" 정보관리학회지 = Journal of the Korean society for information management, 27(3): 227~239 
  3. Song, Sung-Jeon ; Chung, Young-Mee 2012. "A Study on Improving the Performance of Document Classification Using the Context of Terms" 정보관리학회지 = Journal of the Korean society for information management, 29(2): 205~224 

원문보기

원문 PDF 다운로드

  • ScienceON :
  • KCI :

원문 URL 링크

원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다. (원문복사서비스 안내 바로 가기)

상세조회 0건 원문조회 0건

DOI 인용 스타일