$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

반자동으로 구축된 의미 사전을 이용한 한국어 상품평 분석 시스템

A Korean Product Review Analysis System Using a Semi-Automatically Constructed Semantic Dictionary

정보과학회논문지. Journal of KIISE. 소프트웨어 및 응용, v.35 no.6, 2008년, pp.392 - 403  

명재석 (서울대학교 컴퓨터공학부) ,  이동주 (서울대학교 컴퓨터공학부) ,  이상구 (서울대학교 컴퓨터공학부)

초록
AI-Helper 아이콘AI-Helper

사용자가 작성한 리뷰는 다양한 활용성을 갖는 가치 있는 데이타이다. 특히 온라인 쇼핑몰에서의 상품평은 사용자의 구매 결정에 직접적인 영향을 미치는 중요한 정보이다. 본 논문에서는 실제 쇼핑몰 사이트에 있는 상품평을 분석하여 각 상품의 특징과 이에 대한 사용자의 의견을 요약하고 상품의 순위를 산정하는 상품평 분석 시스템을 설계하고 구현하였다. 상품평을 분석하는 과정에서는 자연언어처리 기법과 의미 사전을 사용한다. 의미 사전에는 상품의 특징을 표현하는 어휘와 각 어휘들의 극성(Polarity) 정보들을 반자동화된 도구들을 활용하여 정의할 수 있도록 구현하였다. 이에 더하여 문맥에 따라 다른 의미를 갖는 어휘를 의미 사전에서 정의하고 활용하는 방법에 대해서도 논의하였다. 실험은 2개 상품 분류의 20개 상품, 1796개의 실제 상품평을 수집하여 상품의 순위를 측정하고 주요 요소를 분석하는 방식으로 진행하였다. 그 중 2개 상품에 대한 63개의 상품평에 대하여 분석의 정확률재현율을 측정하였으며, 평균 88.94%의 정확률, 47.92%의 재현율을 나타내었다.

Abstract AI-Helper 아이콘AI-Helper

User reviews are valuable information that can be used for various purposes. In particular, the product reviews on online shopping sites are important information which can directly affect the purchasing decision of the customers. In this paper, we present our design and implementation of a system f...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 연구에서도 마찬가지로 수식 거리를 이용하여 적절한 지배소를 결정하는 방법을 사용하였다. 그러나 각 어휘에 수식 거리를 할당하는 방법 대 산에 의존 규칙 자체에 수식 거리를 포함하도록 설계하여 특정 어휘에 대한 수식 거리 정보가 없을 경우에도 규칙을 통하여 적절한 지배소를 선택하고자 노력하였다. 예제 문장에 대하여 생성된 구문 분석 트리는 다음과 같다.
  • 그 결과를 분석한다. 또한 분석한 결과에 따라 주가 적으로 생각해 볼 수 있는 요소를 알아보고, 이러한 요소를 고려하여 시스템 설계 시에 어떠한 점을 주의해야 하는지에 대해 논의한다.
  • 특히 상품에 대한 리뷰는 상품 자체가 가지고 있는 특징이 뚜렷하고 사용자의 선호 여부가 명확하게 드러나기 때문에 Opinion Mining의 좋은 연구 대상이 되고 있다. 본 시스템은 상품평을 분석하는 목적을 가지고 있으며 설계 과정에서 다음과 같은 특징에 중점을 두었다.
  • 실정이다. 본 연구는 한국어에서 사용자의 의견을 추출하는 시스템에 대해서 논의하고 있으며, 특히 사용자의 의견이 많이 나타나 있고 다양한 응용 시스템을 생각할 수 있는 상품평 데이 타에 대하여 Opinion Mining 시스템을 설계하고 구현하였다.
  • 본 연구에서는 반자동화된 도구들을 통하여 의미 사전을 구축하고, 이를 자연언어처리 기법과 함께 실제 상품평에 적용하는 상품평 분석 시스템을 구축하였다. 또한 구현 시스템의 효율성을 검증하기 위하여 의견 추줍- 에서의 정확률과 재현율을 측정하였으며 시스템의 처리 결과를 순위 시스템에 적용하였다, 본 논문에서는 이믄다음과 같은 순서로 기술하였다.
  • 본 연구에서는 이러한 문제점을 해결하기 위해서 상품 분류에 따라 S-P 쌍에 대한 극성 정보와 의미 강도를 덮어 쓸 수 있도록 구현하였다. 상품 분류에 따라 덮어 쓸 의미 사전이 없을 경우에는 기본 값을 적용한다.
  • 특히 영어, 일본어 등에 대한 연구가 많이 존재하였으나 아직 한글에 대한 상품평 툰석은 활발히 이루어지지 않고 있다. 이에 따라 본 논문에서는 한국어로 작성된 상품평에 대하여 사용자의 의견을 추출하고, 추출된 정보를 활용하여 상품의 순위를 산정하는 상품평 분석 시스템을 설계하고 구현하였다. 좀 더 세부적으로는 상품의 특징에 대하여 사용자의 선호 여부를 확인할 수 있는 부분들올 추출하고 이를 요약함으로써, 사용자로 하여금 전체 상품평을 다 보지 않고도 상품평들이 가진 의미를 알 수 있도록 하는 것이 첫 번째 목표이며, 사용자가 작성한 상품평으로부터 추출한 선호 정도를 수치화 함으로써 집단 지성을 활용한 순위 시스템을 구현하는 것이 두 번째 목표이다.
  • 이에 따라 본 논문에서는 한국어로 작성된 상품평에 대하여 사용자의 의견을 추출하고, 추출된 정보를 활용하여 상품의 순위를 산정하는 상품평 분석 시스템을 설계하고 구현하였다. 좀 더 세부적으로는 상품의 특징에 대하여 사용자의 선호 여부를 확인할 수 있는 부분들올 추출하고 이를 요약함으로써, 사용자로 하여금 전체 상품평을 다 보지 않고도 상품평들이 가진 의미를 알 수 있도록 하는 것이 첫 번째 목표이며, 사용자가 작성한 상품평으로부터 추출한 선호 정도를 수치화 함으로써 집단 지성을 활용한 순위 시스템을 구현하는 것이 두 번째 목표이다.

가설 설정

  • . 상품 분류(Product Category) : 각 상품 품목들은 상품 분류에 귀속된다. 예를 들어, '캐논 EOS 350D'와같은 상품은 '디지털 카메라'라는 상품 분류에 속한다.
  • . 주제어 범주(Subject Category) : 상품의 특성을 기술하는 정보들은 특정한 범주에 속할 수 있다. 예를 들어, '크기, , '무게'등은 '규격'이라는 범주에 포함되어있다고 볼 수 있다.
본문요약 정보가 도움이 되었나요?

참고문헌 (19)

  1. Turney, P. D., 'Thumbs up or thumbs down? Semantic orientation applied to unsupervised classification of reviews,' Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics (ACL'02), Philadelphia, Pennsylvania, pp. 417-424. (NRC #44946), 2002 

  2. Bo Pang, Lillian Lee, Shivakumar Vaithyanathan, 'Thumbs up? Sentiment classification using machine learning techniques,' Proceedings of the ACL-02 conference on Empirical methods in natural language processing - Volumn 10, 2002 

  3. Theresa Wilson, Janyce Wiebe, Paul Hoffmann, 'Recognizing Contextual Polarity in Phrase-Level Sentiment Analysis,' HLT/EMNLP, pp. 347-354, 2005 

  4. Kushal Dave, Steve Lawrence, David M. Pennock, 'Mining the peanut gallery : opinion extraction and semantic classification of product reviews,' Proceedings of the 12th international conference on World Wide Web, pp. 519-528, 2003 

  5. Bing Liu, Minqing Hu and Junsheng Cheng, 'Opinion Observer: Analyzing and Comparing Opinions on the Web,' Proceedings of the 14th international World Wide Web conference, pp. 342-451, 2005 

  6. Christopher Scaffidi, Kevin Bierhoff, Eric Chang, Mikhal Felker, Herman Ng, Chun Jin, 'Red Opal: product-feature scoring from reviews,' Proceedings of the 8th ACM Conference on Electronic Commerce, pp. 182-191, 2007 

  7. Hiroshi Kanayama, Tetsuya Nasukawa, Hideo Watanabe, 'Deeper sentiment analysis using machine translation technology,' Proceedings of the 20th International Conference on Computational Linguistics, 2004 

  8. Jeonghee Yi, Wayne Niblack, 'Sentiment Mining in WebFountain,' Proceedings of the 21st International Conference on Data Engineering, pp. 1073-1083, 2005 

  9. Ana-Maria Popescu, Oren Etzioni, 'Extracting Product Features and Opinions from Reviews,' HLT/EMNLP, pp. 339-346, 2005 

  10. Martin J. R., White P. R., The Language of Evaluation: Appraisal in English, Palgrave Macmillan, 2005 

  11. Hatzivassiloglou V., Mackeown K., 'Predicting the Semantic Orientation of Adjectives,' Proceedings of the 8th conference on European chapter of the Association for Computational Linguistics, pp. 174-181, 1997 

  12. Esuli A., Sebastiani F., 'SentiWordNet: A Publicly Available Lexical Resource for Opinion Mining,' In Proceedings of LREC-06, 5th Conference of Language Resources and Evaluation, pp. 417-422, 2006 

  13. 심광섭, 양재형, '인접 조건 검사에 의한 초고속 한글 형태소 분석기', 정보과학회논문지: 소프트웨어 및 응용 제31권 제1호, pp. 89-99, 2004 

  14. 양승현, 김영섬, '부분 어절의 기분석에 기반한 고속 한국어 형태소 분석 방법', 정보과학회논문지: 소프트웨어 및 응용 제27권 제3호, pp. 290-301, 2000 

  15. 강승식, '한글 문장의 자동 띄어쓰기를 위한 어절 블록 양방향 알고리즘', 정보과학회논문지: 소프트웨어 및 응용 제27권 제4호, pp. 441-447, 2000 

  16. 나동렬, '한국어 파싱에 대한 고찰', 정보과학회지 제12권 제8호, pp. 33-46, 1994 

  17. 홍영국, 이종혁, 이근배, '의존문법에 기반을 둔 한국어 구문 분석기', 한국정보과학회 1993년도 봄 학술발표논문집 제20권 제1호, pp. 781-784, 1993 

  18. 우연문, 송영인, 박소영, 임해창, '지배가능 경로 문맥을 이용한 의존 구문 분석의 수식 거리 모델', 정보과학회논문지: 소프트웨어 및 응용 제34권 제2호, 2007 

  19. http://www.bb.co.kr 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트