$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

고객 감성 분석을 위한 학습 기반 토크나이저 비교 연구
Comparative Study of Tokenizer Based on Learning for Sentiment Analysis 원문보기

品質經營學會誌 = Journal of Korean society for quality management, v.48 no.3, 2020년, pp.421 - 431  

김원준 (성결대학교 산업경영공학과 AI경영기술연구소)

Abstract AI-Helper 아이콘AI-Helper

Purpose: The purpose of this study is to compare and analyze the tokenizer in natural language processing for customer satisfaction in sentiment analysis. Methods: In this study, a supervised learning-based tokenizer Mecab-Ko and an unsupervised learning-based tokenizer SentencePiece were used for c...

주제어

표/그림 (8)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • , 2009). 따라서, 심미적 경험, 감성적 만족도와 같은 주관적이고 추상적으로 표현되는 고객의 감성적 니즈를 충족시키기 위한 제품 개발에 초점을 맞추고 있다. 고객이 추구하는 감성 품질을 정량적으로 해석하기 위해서 감성 분석이라는 개념이 제품 개발에 도입되었다.
  • 이 중, 내용이 중복되거나 상품평이 이모티콘과 같은 문자 이외의 형태로 이뤄졌거나 상품에 대한 별점이 없거나 별점만 있는 것, 단어수가 2개 미만인 것 등을 정제하여 최종적으로 133,535건의 상품평을 추출하였다. 또한, 본 연구에서는 웹에서 사용되는 다양한 형태의 줄임말, 은어, 비문과 같은 것들이 사용된 리뷰에서 고객의 감성을 보다 정확히 분류할 수 있는지에 대한 가능성을 파악하고자 했기 때문에 자연어 처리의 일반적인 전처리 과정을 생략했다.
  • 이를 통해, 고객에게 제공되는 제품 및 서비스 품질에 대한 정보와 피드백을 정확하게 파악함으로써 기업의 의사 결정에 도움을 줄 것으로 기대된다. 본 연구는 국내 가격 비교 사이트에서의 제품 리뷰 데이터를 기반으로 고객의 감성을 분류할 때 신경망 기반 텍스트 처리를 위해 설계된 서브워드 토크나이저인 SentencePiece와 형태소 분석 토크나이저인 Mecab-Ko의 성능을 비교 및 분석하였다. 본 연구를 통하여 비지도 학습 토크나이저인 SentencePiece가 한국어 상품 리뷰 데이터를 활용한 감성 분석 연구에 적합하다는 것을 확인하였다.
  • 기술적 평준화에 의한 기업간 경쟁이 격화되고 있는 상황에서 고객이 제품이나 서비스를 이용할 때 발생하는 다양한 형태의 경험을 파악하고 이러한 경험들을 통합하여 감성 품질을 체계적으로 관리하는 것은 기업 경영의 핵심 가치 중 하나로 주목받고 있다. 본 연구는 최근 제품 및 서비스 사용 경험의 교류가 활발히 일어나는 웹에서 고객의 경험을 명확히 분류할 수 있는 평가 방법을 제안하는 것을 목표로, 자연어 처리를 통한 고객의 감성 분류의 고도화를 위해 학습 기반의 토크나이저의 성능을 비교 평가하고 분류 성능을 최적화할 수 있는 알고리즘을 제안하고자 한다. 특히, 비언어적 표현, 줄임말, 은어 및 신조어 등이 혼재되어 있는 온라인 상품 리뷰의 특성을 고려하여 다른 나라 언어에 적용되어 활용된 비지도 학습 기반의 토크나이저인 SentencePiece가 한국어에서도 통용될 수 있는지에 대한 여부를 확인하고자 한다.
  • 본 연구에서는 학습 모델을 통해 계산된 분류 성능을 검증하기 위해서 모델 검증을 수행하였다. 특정 데이터 셋을 대상으로 개발된 훈련 모델이 다른 데이터 셋을 정확하게 분류하지 못할 수도 있기 때문에 제안된 모델에 대한 교차 검증(cross validation)이 필수적으로 요구된다.
  • 본 연구에서는 한국어 토큰화의 성능을 비교 및 평가하기 위해서 두 가지 종류의 토큰화 방법: 한국어 형태소 분석 엔진인 Mecab-Ko와 SentencePiece 방법을 비교하였다. Mecab-Ko는 한국어 문장을 토큰화하기 위해 널리 사용되는 형태소 분석기 중 하나이며, SentencePiece는 신경망 기계 번역을 위해 개발된 새로운 토큰화 방법으로(Kudo and Richardson, 2018), 데이터 중심적 접근 기반 비지도 방식 텍스트 토크나이저이다.
  • 본 연구의 목적은 웹에서 발현 및 교류되는 고객 감성 경험의 분류 고도화를 위한 방법을 제안하여 기업 혹은 관련 이해 관계자에게 감성 품질에 대한 정보를 명확하게 제공하는 것이다. 이를 통해, 고객에게 제공되는 제품 및 서비스 품질에 대한 정보와 피드백을 정확하게 파악함으로써 기업의 의사 결정에 도움을 줄 것으로 기대된다.
  • 본 연구는 최근 제품 및 서비스 사용 경험의 교류가 활발히 일어나는 웹에서 고객의 경험을 명확히 분류할 수 있는 평가 방법을 제안하는 것을 목표로, 자연어 처리를 통한 고객의 감성 분류의 고도화를 위해 학습 기반의 토크나이저의 성능을 비교 평가하고 분류 성능을 최적화할 수 있는 알고리즘을 제안하고자 한다. 특히, 비언어적 표현, 줄임말, 은어 및 신조어 등이 혼재되어 있는 온라인 상품 리뷰의 특성을 고려하여 다른 나라 언어에 적용되어 활용된 비지도 학습 기반의 토크나이저인 SentencePiece가 한국어에서도 통용될 수 있는지에 대한 여부를 확인하고자 한다. 비교 평가를 위해서 한국어 토크나이저로 실효성이 입증된 지도 학습 기반의 토크나이저인 Mecab-Ko가 선정되었으며, 평가 데이터로는 TV 온라인 상품 리뷰를 활용하였다.
본문요약 정보가 도움이 되었나요?

참고문헌 (24)

  1. Balbi, S., Misuraca, M., and Scepi, G. 2018. Combining Different Evaluation Systems on Social Media for Measuring User Satisfaction. Information Processing & Management 54(4):674-685. 

  2. Bataa, E., and Wu, J. 2019. An Investigation of Transfer Learning-based Sentiment Analysis in Japanese. arXiv Preprint arXiv:1905.09642. 

  3. Berard, A., Calapodescu, I., Dymetman, M., Roux, C., Meunier, J. L., and Nikoulina, V. 2019. Machine Translation of Restaurant Reviews: New Corpus for Domain Adaptation and Robustness. arXiv Preprint arXiv:1910.14589. 

  4. Collobert, R., Weston, J., Bottou, L., Karlen, M., Kavukcuoglu, K., and Kuksa, P. 2011. Natural Language Processing (almost) from Scratch. Journal of Machine Llearning Research 12:2493-2537. 

  5. Decker, R., and Trusov, M. 2010. Estimating Aggregate Consumer Preferences from Online Product Reviews. International Journal of Research in Marketing 27(4):293-307. 

  6. Fang, X., and Zhan, J. 2015. Sentiment Analysis Using Product Review Data. Journal of Big Data 2(1):5. 

  7. Gruen, T. W., Osmonbekov, T., and Czaplewski, A. J. 2006. eWOM: The Impact of Customer-to-customer Online Know-how Exchange on Customer Value and Loyalty. Journal of Business Research 59(4):449-456. 

  8. Henson, B., Barnes, C., Livesey, R., Childs, T., and Ewart, K. 2006. Affective Consumer Requirements: A Case Study of Moisturizer Packaging. Concurrent Engineering 14(3):187-196. 

  9. Jiang, S., and Qi, J. 2016. Cognitive Detection of Multiple Discrete Emotions from Chinese Oonline Reviews. In 2016 IEEE First International Conference on Data Science in Cyberspace (DSC) 137-142. 

  10. Kaminski, B., Jakubczyk, M., and Szufel, P. 2018. A Framework for Sensitivity Analysis of Decision Trees. Central European Journal of Operations Research 26(1):135-159. 

  11. Kim, J. Y., Kim, H. J., & Kim, C. M. (2009). The Influence of Service Elements on Customers' Emotion and Loyalty-Focused on Specialty Coffee Shop Customers. Culinary Science and Hospitality Research, 15(1), 271-286. 

  12. Kudo, T., and Richardson, J. 2018. Sentencepiece: A Simple and Language Independent Subword Tokenizer and Detokenizer for Neural Text Processing. arXiv Preprint arXiv:1808.06226. 

  13. Kuwano, S., Namba, S., Takehira, O., and Fastl, H. 2009. Subjective Impression of Copy Machine Noises: An Examination of Physical Metrics for the Evaluation of Sound quality. In Proc. Inter-Noise 2009 Ottawa, Canada. 

  14. Lim, J. S., and Kim, J. M. 2014. An Empirical Comparison of Machine Learning Models for Classifying Emotions in Korean Twitter. Journal of Korea Multimedia Society 17(2):232-239. 

  15. Litvin, S. W., Goldsmith, R. E., and Pan, B. 2008. Electronic Word-of-mouth in Hospitality and Tourism Management. Tourism Management 29(3):458-468. 

  16. Liu, B. 2012. Sentiment Analysis and Opinion Mining. Synthesis Lectures on Human Language Technologies 5(1):1-167. 

  17. Liu, H., He, J., Wang, T., Song, W., and Du, X. 2013. Combining User Preferences and User Opinions for Accurate Recommendation. Electronic Commerce Research and Applications 12(1):14-23. 

  18. Liu, Y., Jin, J., Ji, P., Harding, J. A., and Fung, R. Y. 2013. Identifying Helpful Online Reviews: a Product Designer's Perspective. Computer-Aided Design 45(2):180-194. 

  19. Montefinese, M., Ambrosini, E., Fairfield, B., and Mammarella, N. 2014. The Adaptation of the Affective Norms for English Words (ANEW) for Italian. Behavior Research Methods 46(3):887-903. 

  20. Rose, S., Hair, N., and Clark, M. 2011. Online Customer Experience: A Review of the Bbusiness-to-consumer Oonline Purchase Context. International Journal of Management Reviews 13(1):24-39. 

  21. Su, J., Yu, S., and Luo, D. 2020. Enhancing Aspect-Based Sentiment Analysis With Capsule Network. IEEE ACCESS 8:100551-100561. 

  22. Taniguchi, Y., Konomi, S. I., and Goda, Y. 2019. Examining Language-agnostic Methods of Automatic Coding in the Community of Inquiry Framework. In 16th International Conference on Cognition and Exploratory Learning in Digital Age IADIS Press 19-26. 

  23. Wang, H., Lu, Y., and Zhai, C. 2010. Latent Aspect Rating Analysis on Review Text Data: a Rating Regression Approach. In Proceedings of the 16th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining 783-792. 

  24. Yang, L., Li, Y., Wang, J., and Sherratt, R. S. 2020. Sentiment Analysis for E-commerce Product Reviews in Chinese Based on Sentiment Lexicon and Deep Learning. IEEE Access 8:23522-23530. 

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로