$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 양방향 LSTM을 적용한 단어의미 중의성 해소 감정분석
Emotion Analysis Using a Bidirectional LSTM for Word Sense Disambiguation 원문보기

The journal of Bigdata = 한국빅데이터학회지, v.5 no.1, 2020년, pp.197 - 208  

기호연 (이화여자대학교 일반대학원 빅데이터분석학 협동과정) ,  신경식 (이화여자대학교 일반대학원 빅데이터분석학 협동과정)

초록
AI-Helper 아이콘AI-Helper

어휘적 중의성이란 동음이의어, 다의어와 같이 단어를 2개 이상의 의미로 해석할 수 있는 경우를 의미하며, 감정을 나타내는 어휘에서도 어휘적 중의성을 띄는 경우가 다수 존재한다. 이러한 어휘들은 인간의 심리를 투영한다는 점에서 구체적이고, 풍부한 맥락을 전달하는 특징이 있다. 본 연구에서는 양방향 LSTM을 적용하여 중의성을 해소한 감정 분류 모델을 제안한다. 주변 문맥의 정보를 충분히 반영한다면, 어휘적 중의성 문제를 해결하고, 문장이 나타내려는 감정을 하나로 압축할 수 있다는 가정을 기반으로 한다. 양방향 LSTM은 문맥 정보를 필요로 하는 자연어 처리 연구 분야에서 자주 활용되는 알고리즘으로 본 연구에서도 문맥을 학습하기 위해 활용하고자 한다. GloVe 임베딩을 본 연구 모델의 임베딩 층으로 사용했으며, LSTM, RNN 알고리즘을 적용한 모델과 비교하여 본 연구 모델의 성능을 확인하였다. 이러한 프레임워크SNS 사용자들의 감정을 소비 욕구로 연결시킬 수 있는 마케팅 등 다양한 분야에 기여할 수 있을 것이다.

Abstract AI-Helper 아이콘AI-Helper

Lexical ambiguity means that a word can be interpreted as two or more meanings, such as homonym and polysemy, and there are many cases of word sense ambiguation in words expressing emotions. In terms of projecting human psychology, these words convey specific and rich contexts, resulting in lexical ...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 이러한 프로토타입 접근법은 사회적 상호 작용을 포함한 다양한 실제 상황에서 감정 관련 정보가 처리되는 방식을 결정하는 데 유용하다. 그렇기 때문에 본 연구에서는 감정 클래스로 Shaver의 연구[8]에서 제시한 6가지 기본적인 감정을 채택하고자 한다.
  • 따라서, 본 연구에서는 어휘의 중의성을 해소 하는 감정 분석을 수행하기 위해 양방향 LSTM에 기반한 새로운 감정 분류 모형을 제안한다. 실제로 문맥 정보를 충분히 활용하여 어휘적 중의성을 해소해 감정 분류 성능을 높일 수 있는지 가설을 세운 후 실험을 진행하고자 한다.
  • 본 연구에서 SNS 이용률 증가에 따른 사용자의 감정을 이해하기 위해 감정 분석 시스템을 제시하였다. 여기에 감정 어휘의 중의성을 해소할 수 있도록 문맥적 정보를 이용하려는 자연어 처리 분야에서 주로 쓰이는 양방향 LSTM을 적용하여 모델을 설계하였다.
  • 본 연구에서는 감정 어휘의 중의성을 해소하여 감정을 분류하기 위해 GloVe 임베딩 층과 양방향 LSTM을 조합한 GloB-LSTM 연구 모델을 제안 하였으며, LSTM, RNN을 사용했을 때보다 맥락 정보를 더 반영함으로써 분류 성능을 높일 수 있는지 살펴보았다. GloVe 임베딩 층을 적용한 각 알고리즘 간의 비교 실험을 진행했고, 배치 사이즈에 따라 각각의 정확도를 구하였다<표 5>.
  • GloVe는 2014년 스탠포드 대학(Stanford University)에서 개발한 카운트 기반의 비지도 학습 방법론으로, 전체 말뭉치 내 단어 간 동시 등장 확률을 사용해 차원을 축소하는 등 기존의 Bo-W, TF-IDF, LSA 및 Word2Vec을 보완한다. 본 연구에서는 제한적인 데이터 수의 한계를 극복하고 도메인에 상관없이 사람들이 SNS에 쓴 텍스트로부터 감정을 추출하기 위해 GloVe를 사용하고자 한다. 본 논문의 연구 모형인 양방향 LSTM과 결합해 자질을 학습시키고, 풍부한 의미 정보를 제공 받을 것이다.
  • 따라서, 본 연구에서는 어휘의 중의성을 해소 하는 감정 분석을 수행하기 위해 양방향 LSTM에 기반한 새로운 감정 분류 모형을 제안한다. 실제로 문맥 정보를 충분히 활용하여 어휘적 중의성을 해소해 감정 분류 성능을 높일 수 있는지 가설을 세운 후 실험을 진행하고자 한다. 크라우드 소싱 플랫폼 2곳에서 공개한 감정 레이블이 부착된 텍스트 데이터를 사용해 학습 데이터를 구축했으며, 이후, 양방향 LSTM으로 과거, 미래의 모든 정보를 반영하되, 전역적인 단어의 의미 정보를 활용하는 GloVe 임베딩을 적용하여 감정 분석을 시행하였다.

가설 설정

  • 여기에 감정 어휘의 중의성을 해소할 수 있도록 문맥적 정보를 이용하려는 자연어 처리 분야에서 주로 쓰이는 양방향 LSTM을 적용하여 모델을 설계하였다. 본 논문은 어휘적중의성을 문맥을 통해 해소한다면, 문맥의 풍부한 의미적, 맥락적 정보를 반영한 것으로 각 문장이 나타내는 감정이 하나로 통일된다는 가설을 세우고 실험을 진행하였다. 이를 검증하기 위해 연구 모델로 양방향 LSTM을 설정했으며, GloVe 임베딩 층을 양방향 LSTM 모델의 임베딩 층으로 사용하거나 ReLU 활성화 함수 등을 추가하는 등의 하이퍼튜닝을 실시해 모델의 성능에 기여하는지 살폈다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
어휘적 중의성이란? 어휘적 중의성이란 동음이의어, 다의어와 같이 단어를 2개 이상의 의미로 해석할 수 있는 경우를 의미하며, 감정을 나타내는 어휘에서도 어휘적 중의성을 띄는 경우가 다수 존재한다. 이러한 어휘들은 인간의 심리를 투영한다는 점에서 구체적이고, 풍부한 맥락을 전달하는 특징이 있다.
감정은 어떤 상태인가? 감정은 기쁨, 슬픔 등과 같은 인간이 느끼는 심리적 상태로 감정 어휘는 자신의 심리를 투영시킨다는 점에서 구체적이며, 풍부한 맥락을 전달한다. 감정은 추론, 의사 결정 및 상호 작용과 같은 합리적인 작업을 포함해 전반적으로 인간의 행동에 영향을 미치는 중요한 요소이다.
어휘적 중의성 어휘들의 특징은? 어휘적 중의성이란 동음이의어, 다의어와 같이 단어를 2개 이상의 의미로 해석할 수 있는 경우를 의미하며, 감정을 나타내는 어휘에서도 어휘적 중의성을 띄는 경우가 다수 존재한다. 이러한 어휘들은 인간의 심리를 투영한다는 점에서 구체적이고, 풍부한 맥락을 전달하는 특징이 있다. 본 연구에서는 양방향 LSTM을 적용하여 중의성을 해소한 감정 분류 모델을 제안한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (24)

  1. 김해룡, 안광호, 마케팅을 결정하는 소비 감정의 힘: 감정을 팔아라, 서울:원앤원북스, 2019. 

  2. 도재학, "국어 문장의 중의성에 대하여: 언표 및 발화 문장에 따른 유형 분류를 중심으로", 아시아문화연구, 제46권, pp.39-72, 2018. 

  3. M. Munezero, "Are they different? Affect feeling emotion sentiment and opinion detection in text," IEEE Trans, Affective Comput. Vol.5, No.2, pp.101-111, 2014. 

  4. A. Yadollahi, "Current State of Text Sentiment Analysis from Opinion to Emotion Mining," ACM Computing Surveys, Vol.50, No.2, pp.1-33, 2017. 

  5. P. Ekman, "Emotion in the human face: Guidelines for research and an integration of findings," New York, Permagon, 1972. 

  6. R. Plutchik, "Emotion: Theory, Research and Experience," Academic Press, New York, NY, 1986. 

  7. H. Lovheim, "A new three-dimensional model for emotions and monoamine neurotransmitters," Med Hypotheses, Vol.78, No.2, pp.341-348, 2012. 

  8. P. Shaver, "Emotion knowledge: Further exploration of a prototype approach," J. Pers. Soc. Psychol, Vol.52, No.6, 1061, 1987. 

  9. M, Lesk, "Automatic Sense Disambiguation Using Machine Readable Dictionaries: How to Tell a Pine Cone from an Ice Cream Cone," Proceedings of the 1986 SIGDOC Conference, pp.24-26, 1986. 

  10. Lee, "Supervised Word Sense Disambiguation with Support Vector Machines and Multiple Knowledge Sources," Proceedings of Senseval-3: Third International Workshop on the Evaluation of Systems for the Semantic Analysis of Text, pp.137-140, 2004. 

  11. A. Le, "High WSD Accuracy Using Naive Bayesian Classifier with Rich Features," PACLIC 18, Vol.18, pp.105-14, 2004. 

  12. A. Yepes, "Word embeddings and recurrent neural networks based on Long-Short Term Memory nodes in supervised biomedical word sense disambiguation," Journal of biomedical informatics, Vol.73, pp.137-147, 2017. 

  13. D. Yarowsky, "UNSUPERVISED WORD SENSE DISAMBIGUATION RIVALING SUPERVISED METHODS," In ACL 95, pp.189-196, 1995. 

  14. C. Niu, "Context Clustering for Word Sense Disambiguation Based on Modeling Pairwise Context Similarities," In: SENSEVAL- 3: Third International Workshop on the Evaluation of Systems for the Semantic Analysis of Text, pp.187-190, 2004. 

  15. A. Graves, A., and Schmidhuber, J. (2005). "Framewise Phoneme Classification with Bidirectional LSTM and Other Neural Network Architectures," Neural Networks, Vol.18 No.5-6, pp.602-610, 2005. 

  16. 진승희, "온톨로지 지식 기반 특성치를 활용한 Bidirectional LSTM-CRF 모델의 시퀀스 태깅 성능 향상에 관한 연구", 지능정보연구, 제24권, 제1호, pp.253-267, 2018. 

  17. V. Makarenkov, "Choosing the right word: Using bidirectional LSTM tagger for writing support systems," Engineering Applications of Artificial Intelligence, Vol.84, pp.1-10, 2019. 

  18. A. Pesaranghader, "One Single Deep Bidirectional LSTM Network for Word Sense Disambiguation of Text Data," Springer Advances in Artificial Intelligence: 31st Canadian Conference on Artificial Intelligence Canada, pp.96-107, 2018. 

  19. J. Min, "A Study on Word Sense Disambiguation Using Bidirectional Recurrent Neural Network for Korean Language," Journal of the Korea Society of Computer and Information, Vol.22, No.4, pp.41-49, 2017. 

  20. C, Zhang, "Biomedical word sense disambiguation with bidirectional long short-term memory and attention-based neural networks," BMC Bioinformatics, Vol.20, No.502, 2019. 

  21. Z, Li, "Context Embedding Based on Bi-LSTM in Semi-Supervised Biomedical Word Sense Disambiguation," IEEE Access, Vol.7, pp.72928-72935, 2019. 

  22. P. Jeffrey, "Glove: Global vectors for word representation," Proceedings of the Empiricial Methods in Natural Language Processing, 2014. 

  23. S. Mike, "Bidirectional recurrent neural networks," Signal Processing, IEEE Transactions on, Vol.45, No.11, pp.2673-2681, 1997. 

  24. V. Nair, "Rectified Linear Units Improve Restricted Boltzmann Machines," In Proceedings of the 27th International Conference on Machine Learning, pp.807-814, 2010. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로