감정 단어 사전 및 기계 학습을 이용한 유아의 대화 문장 감정 분석 모델 개발 Development of an Emotional Analysis Model based on Conversational Sentences of Children Using Emotional Word Dictionary and Machine Learning원문보기
본 논문에서는 유아의 대화 문장을 대상으로 기계학습 및 감정 단어 사전을 이용한 감정 분석 모델을 제시한다. 감정 분석을 위한 기계 학습 알고리즘으로는 SVM(Support Vector Machine), RF(Random Forests), GLMNET(Lasso and Elastic Net Generalized Linear Models), MAXENT(...
본 논문에서는 유아의 대화 문장을 대상으로 기계학습 및 감정 단어 사전을 이용한 감정 분석 모델을 제시한다. 감정 분석을 위한 기계 학습 알고리즘으로는 SVM(Support Vector Machine), RF(Random Forests), GLMNET(Lasso and Elastic Net Generalized Linear Models), MAXENT(Maximum Entropy), sLDA(Supervised Latent Dirichlet Allocation)를 함께 사용했고 유아들이 자주 사용하는 감정 표현과 관련된 단어를 기반으로 감정 단어 사전을 구축하였다. 제안하는 연구에서는 유아들의 대화 문장에 담겨있는 감정을 긍정적인 의미와 부정적인 의미로 분석하는 것을 목표로 하고 특히 한국어의 문법적인 특성을 고려한 부정어 처리와 분석의 정답률 향상을 위한 방법에 대하여 중점적으로 연구를 진행하였다. 제안 모델의 성능 검증을 위해서 국립 국어원에서 제공하는 말뭉치 데이터를 통해 유아의 일상 대화 문장 1,500개를 수집하였다. 긍정 단어 188개, 부정 단어 269개를 포함하는 유아들이 사용하는 감정 단어 사전을 직접 구축하였고 기계 학습을 통해 감정 분석 실험을 진행하였다. 부정어를 포함하는 문장과 일반 문장을 분류하여 각 문장에 맞는 기계 학습 알고리즘을 사용하고 그 분석 결과로부터 감정 정도를 산출하고 정확도 향상을 위한 수치 계산 방법을 적용하였다. 실험 결과 일반 문장에서는 전처리 전 정답률이 61.26%에서 전처리 후 88.49% 성능을 보였고 부정어 포함 문장에서는 전처리 전 82.08%에서 전처리 후 88.0% 성능으로 향상된 결과를 도출하였다. 제안하는 연구에서는 데이터 수집에 대한 편향성을 고려하여 제시하는 분석 모델의 절차 수행 전, 후 성능 비교에 더 우위를 두고 진행하였으며 이러한 의미에서 제안한 연구 절차에 대한 활용 가능성에 대해 검증하였다.
본 논문에서는 유아의 대화 문장을 대상으로 기계학습 및 감정 단어 사전을 이용한 감정 분석 모델을 제시한다. 감정 분석을 위한 기계 학습 알고리즘으로는 SVM(Support Vector Machine), RF(Random Forests), GLMNET(Lasso and Elastic Net Generalized Linear Models), MAXENT(Maximum Entropy), sLDA(Supervised Latent Dirichlet Allocation)를 함께 사용했고 유아들이 자주 사용하는 감정 표현과 관련된 단어를 기반으로 감정 단어 사전을 구축하였다. 제안하는 연구에서는 유아들의 대화 문장에 담겨있는 감정을 긍정적인 의미와 부정적인 의미로 분석하는 것을 목표로 하고 특히 한국어의 문법적인 특성을 고려한 부정어 처리와 분석의 정답률 향상을 위한 방법에 대하여 중점적으로 연구를 진행하였다. 제안 모델의 성능 검증을 위해서 국립 국어원에서 제공하는 말뭉치 데이터를 통해 유아의 일상 대화 문장 1,500개를 수집하였다. 긍정 단어 188개, 부정 단어 269개를 포함하는 유아들이 사용하는 감정 단어 사전을 직접 구축하였고 기계 학습을 통해 감정 분석 실험을 진행하였다. 부정어를 포함하는 문장과 일반 문장을 분류하여 각 문장에 맞는 기계 학습 알고리즘을 사용하고 그 분석 결과로부터 감정 정도를 산출하고 정확도 향상을 위한 수치 계산 방법을 적용하였다. 실험 결과 일반 문장에서는 전처리 전 정답률이 61.26%에서 전처리 후 88.49% 성능을 보였고 부정어 포함 문장에서는 전처리 전 82.08%에서 전처리 후 88.0% 성능으로 향상된 결과를 도출하였다. 제안하는 연구에서는 데이터 수집에 대한 편향성을 고려하여 제시하는 분석 모델의 절차 수행 전, 후 성능 비교에 더 우위를 두고 진행하였으며 이러한 의미에서 제안한 연구 절차에 대한 활용 가능성에 대해 검증하였다.
This paper proposes an emotional analysis model using machine learning and an emotional dictionary for children's conversational sentences. The machine learning algorithms used in this study for emotional analysis are SVM(Support Vector Machine), RF(Random Forests), GLMNET(Lasso and Elastic Net Gene...
This paper proposes an emotional analysis model using machine learning and an emotional dictionary for children's conversational sentences. The machine learning algorithms used in this study for emotional analysis are SVM(Support Vector Machine), RF(Random Forests), GLMNET(Lasso and Elastic Net Generalized Linear Models), MAXENT(Maximum Entropy), sLDA(Supervised Latent Dirichlet Allocation), and the lexicon of sentiments is constructed from words frequently used by children to express sentiments. This study aims to categorize the emotions found in children's conversation into positive and negative connotations. Especially, the research focused on processing negatives taking into account the grammatical characteristics of the Korean language and researching methods to improve the percentage of correct answers the emotional analysis. To verify the performance of the sentimental analysis model, 1,500 sentences were collected from corpus data provided by the National Institute of Korean Language, a lexicon of sentiments that contains 188 positive emotion words and 269 negative emotion words was constructed, and sentimental analysis was carried out using machine learning. The experiment was carried out for sentences containing negatives and for general sentences, where the emotional degree was computed from the analysis results using a machine learning algorithm appropriate for each sentence, and numerical calculation methods were applied to improve the percentage of correct answers. The experimental results showed that preprocessing improved the percentage of correct answers from 61.26% to 88.49% for general sentences, and from 82.08% to 88.00% for sentences containing negatives. Taking into consideration the bias present in the data collection, this study placed a heavier emphasis on the performance comparison between analysis of raw and preprocessed data, and in that sense, verified the applicability of the emotional analysis model.
This paper proposes an emotional analysis model using machine learning and an emotional dictionary for children's conversational sentences. The machine learning algorithms used in this study for emotional analysis are SVM(Support Vector Machine), RF(Random Forests), GLMNET(Lasso and Elastic Net Generalized Linear Models), MAXENT(Maximum Entropy), sLDA(Supervised Latent Dirichlet Allocation), and the lexicon of sentiments is constructed from words frequently used by children to express sentiments. This study aims to categorize the emotions found in children's conversation into positive and negative connotations. Especially, the research focused on processing negatives taking into account the grammatical characteristics of the Korean language and researching methods to improve the percentage of correct answers the emotional analysis. To verify the performance of the sentimental analysis model, 1,500 sentences were collected from corpus data provided by the National Institute of Korean Language, a lexicon of sentiments that contains 188 positive emotion words and 269 negative emotion words was constructed, and sentimental analysis was carried out using machine learning. The experiment was carried out for sentences containing negatives and for general sentences, where the emotional degree was computed from the analysis results using a machine learning algorithm appropriate for each sentence, and numerical calculation methods were applied to improve the percentage of correct answers. The experimental results showed that preprocessing improved the percentage of correct answers from 61.26% to 88.49% for general sentences, and from 82.08% to 88.00% for sentences containing negatives. Taking into consideration the bias present in the data collection, this study placed a heavier emphasis on the performance comparison between analysis of raw and preprocessed data, and in that sense, verified the applicability of the emotional analysis model.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.