$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

상품평의 언어적 분석을 통한 상품 평가 요약 시스템
Product Evaluation Summarization Through Linguistic Analysis of Product Reviews 원문보기

정보처리학회논문지. The KIPS transactions. Part B. Part B, v.17B no.1, 2010년, pp.93 - 98  

이우철 ((주)유승토탈솔류션) ,  이현아 (금오공과대학교 컴퓨터공학부) ,  이공주 (충남대학교 전기정보통신공학부)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 폭발적으로 증가하고 있는 상품평을 효과적으로 활용하기 위해 언어적 분석을 통하여 상품 평가를 요약하는 시스템을 제안한다. 시스템에서는 스커트 상품 분류의 경우 '디자인'과 '재질'과 같이, 상품을 평가하는 기준이 되는 항목에 대한 상품평의 부정과 긍정의 극성 여부를 판별하여 그래프 형태로 요약하여 제시한다. 본 논문에서는 작은 시드 어휘와 문맥에 기반한 자동 확장 방법을 사용하여 평가 항목 별 평가 어휘 극성 사전을 구축하여 평가 항목에 대한 상품평의 극성을 판정한다. 제안한 방식은 여러 온라인 쇼핑몰의 실제 상품평에 대한 실험에서 극성 사전 추출에서 평균 69.8%의 정확율과 문장별 극성 식별에서 평균 81.8%의 정확율을 보였다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we introduce a system that summarizes product evaluation through linguistic analysis to effectively utilize explosively increasing product reviews. Our system analyzes polarities of product reviews by product features, based on which customers evaluate each product like 'design' and '...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 근래 폭발적으로 증가하고 있는 상품평을 효과적으로 활용하기 위한 상품평 요약 시스템을 제안하였다. 웹 문서 검색을 통한 평가 항목 추출과 작은 크기의 시드 사전에 기반한 극성 사전 자동 확장을 통해 한국어 상품평 요약 연구가 가지는 지식 구축의 어려움을 해소하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
한국어 상품평을 자동으로 요약하기 위한 시스템의 각 단계는 어떠한가? 시스템에서는 평가 항목, 즉 상품의 다양한 특성별로 상품평을 긍정과 부정 중 어느 극성(polarity)인지 판별하여 사용자가 원하는 정보를 알아보기 쉽게 제시한다. 시스템은 1) 상품평을 수집하여 정제한 뒤, 2) 상품평 내 어휘 정보와 웹 검색을 활용하여 평가 항목을 추출하고, 3) 언어처리기법을 이용하여 평가 항목별 평가 어휘와 평가 어휘의 극성을 자동으로 추출하여, 4) 평가 항목별 극성을 그래프 형태로 요약하여 출력한다. 각 단계는 상품평과 웹 검색 결과를 활용하여 모두 자동으로 처리된다.
WordNet을 이용한 방법의 특징은? 기계학습을 이용한 방법[3, 4]에서는 별점이나 추천과 비추천 값을 가지는 상품평을 학습 데이터로 사용하여 극성을 예측하고 있으나, 별점 데이터의 신뢰도가 떨어지는 국내 쇼핑몰의 상품평에는 적용하기 어렵다. WordNet을 이용한 방법[7, 8]에서는 WordNet의 유의어, 반의어 관계를 이용하여 형용사의 극성을 판별하는데, 이 방식은 평가 항목에 따라 극성이 달라지는 형용사에 대한 처리가 불가능하다. 예를 들어 디지털카메라의 경우 ‘작다’가 크기에 대한 평가 어휘라면 긍정적인 표현이지만 액정에 대한 평가 어휘라면 부정적인 표현이다. 또한, 한국어에서는 WordNet과 같은 언어 자원을 실용적으로 사용하기 어렵기 때문에 이 방식은 한국어 상품평 처리에 그대로 적용하기 힘들다. PMI를 이용한 방식[2]에서는 평가 어휘가 될 수 있는 형용사 또는 부사를 추출하고, PMI를 이용하여 각 단어의 의미극성은 판단하며, 자연언어처리기술을 결합한 방식에는 구 수준에서 문맥상 극성 식별을 시도한 연구[9]와 사전의 용어 주해를 이용한 연구[10], 형용사와 접속사 간 연결 정보를 이용한 연구[11] 등이 있다.
감성 분류에 관한 연구는 어떻게 변화하였나? 텍스트를 분석하여 의견을 추출하고, 추출된 의견에 긍정과 부정 극성을 부여하여 구조화하는 연구는 오피니언 마이닝(Opinion Mining) 또는 문서 감성 분류(Document Sentiment Classification)로 대표된다. 감성 분류의 초기 연구는 문서 수준[2-4]이나 문장 수준[5, 6]에서의 접근이 대부분이었으나, 근래에는 의견 추출 대상의 다양한 특징별로 극성을 판별하는 특징 기반 요약(Feature Based Summarization)에 대한 연구가 활발하게 진행되고 있다. 상품평에서의 의견 추출에서는 세부적인 상품 특징 - 예를 들어, 스커트의 경우 ‘사이즈’, 디지털카메라의 경우 ‘액정’ - 에 대한 기존 구매자의 평가가 구매 예정자의 구매 결정에 중요한 판단 요소가 될 수 있어 특징 기반 요약이 필요하다.
질의응답 정보가 도움이 되었나요?

참고문헌 (17)

  1. 한국인터넷진흥원, “웹 2.0시대의 네티즌 인터넷 이용 현황 - 참여와 공유의 인터넷,” http://www.nida.or.kr/doc/issue_sum.pdf, 2006. 

  2. Turney, “Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews,” In Proc. of the ACL, pp.417-424, 2002. 

  3. Pang, L. Lee, and S. Vaithyanathan, “Thumbs up? Sentiment classification using machine learning techniques,” In Proc. of EMNLP, pp.79-86, 2002. 

  4. Kushal Dave, Steve Lawrence, David M. Pennock, “Mining the peanut gallery : opinion extraction and semantic classification of product reviews,” In Proc. of the WWW, pp.519-528, 2003. 

  5. Yu and V. Hatzivassiloglou, “Towards answering opinion questions: Separating facts from opinions and identifying the polarity of opinion sentences,” In Proc. of EMNLP, pp. 129-136, 2003. 

  6. Esuli, A. and Sebastiani, F., “Determining term subjectivity and term orientation for opinion mining,” In Proc. of the EACL, pp.193-200, 2006. 

  7. Hu, M. and Liu, B. “Mining and summarizing customer reviews,” In Proc. of the 10th ACM SIGKDD Conf., pp.168-177, 2004. 

  8. Bing Liu, Minqing Hu and Junsheng Cheng. “Opinion Observer: Analyzing and comparing opinions on the web,” In Proc. of WWW, pp.342-351, 2005. 

  9. Wilson, T., Wiebe, J., and Hoffmann, P, “Recognizing contextual polarity in phrase-level sentiment analysis,” In Proc. of the Conference on HLT and EMNLP, pp.347-354, 2005. 

  10. Esuli, A. and Sebastiani, F. “Determining term subjectivity and term orientation for opinion mining,” In Proc. of the EACL. pp.193-200, 2006. 

  11. Hatzivassiloglou, V. and McKeown, K. R, “Predicting the semantic orientation of adjectives,” In Proc. of the EACL, pp.174-181, 1997. 

  12. 명재석, 이동주, 이상구, “반자동으로 구축된 의미 사전을 이용한 한국어 상품평 분석 시스템,” 정보과학회논문지 : 소프트웨어 및 응용, 제 35권 제 6호(2008. 6), pp.392-403, 2008. 

  13. 황재원, “한국어 문서 감정 분류를 위한 감정 자질 추출 및 가중치 강화 기법에 관한 연구,” 동아대학교, 석사학위논문, 2008. 

  14. 이우철, 이현아, 이공주, “효율적인 상품평 분석을 위한 어휘통계 정보 기반 평가 항목 추출 시스템,” 정보처리학회논문지 제16-B권 제 6호, 2009. 

  15. Naver Lab, 자동 띄어쓰기, http://s.lab.naver.com/autospacing/ 

  16. 강승식, HAM, “한국어 형태소 분석기와 한국어 분석 모듈,” 국민대학교 자연언어 정보검색연구실, http://nlp.kookmin.ac.kr. 

  17. 온라인 가격비교 사이트 BB.co.kr, http://www.bb.co.kr. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로