$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

SNS대상의 지능형 자연어 수집, 처리 시스템 구현을 통한 한국형 감성사전 구축에 관한 연구
Research on Designing Korean Emotional Dictionary using Intelligent Natural Language Crawling System in SNS 원문보기

정보시스템연구 = The Journal of information systems, v.29 no.3, 2020년, pp.237 - 251  

이종화 (동의대학교 e비즈니스학과)

Abstract AI-Helper 아이콘AI-Helper

Purpose The research was studied the hierarchical Hangul emotion index by organizing all the emotions which SNS users are thinking. As a preliminary study by the researcher, the English-based Plutchick (1980)'s emotional standard was reinterpreted in Korean, and a hashtag with implicit meaning on SN...

주제어

표/그림 (7)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • Plutchick(1980)의 감정세트를 기준으로 감정 단어들의 가중치를 추출하여 한글로 재해석하고 SNS상의 함축적 의미가 있는 감정 단어를 활용하고자 한다. 다차원감성 사전 구축과 입체적 감성 분류를 위하여 1) 7가지 감성 세트 구성을 위한 감성 시드(Seed)를 선정하고, 2) 각 감성 시드에서 파생된 SNS 해시태그를 수집하여 감성 단어사전을 구축, 3) 같은 감성 내 단어들의 우선순위를 구분하기 위하여 TF-IDF(Term Frequency Inverse Document Frequency)를 이용한 가중치 추출, 4) NMF(Non-negative Matrix Factorization) 알고리즘을 통한 감성 단어의 특성치를 이용한 감성 차원 축소를 적용하고자한다. 또한, 벡터간의 거리 측정은 특정 지점에서 두 벡터 간 벌어진 정도인 각도를 활용하여 유사도 측정을 진행하는 코사인 거리(Consine distance)로 감정 단어 지수를 개발하고자 한다.
  • 다차원감성 사전 구축과 입체적 감성 분류를 위하여 1) 7가지 감성 세트 구성을 위한 감성 시드(Seed)를 선정하고, 2) 각 감성 시드에서 파생된 SNS 해시태그를 수집하여 감성 단어사전을 구축, 3) 같은 감성 내 단어들의 우선순위를 구분하기 위하여 TF-IDF(Term Frequency Inverse Document Frequency)를 이용한 가중치 추출, 4) NMF(Non-negative Matrix Factorization) 알고리즘을 통한 감성 단어의 특성치를 이용한 감성 차원 축소를 적용하고자한다. 또한, 벡터간의 거리 측정은 특정 지점에서 두 벡터 간 벌어진 정도인 각도를 활용하여 유사도 측정을 진행하는 코사인 거리(Consine distance)로 감정 단어 지수를 개발하고자 한다.
  • 본 논문의 2장은 TF-IDF분석과 NMF 그리고, 코사인 유사도에 관하여 선행 연구를 진행하였다. 3장에서는 감정 단어 간 유사도 측정을 위한 프레임워크, 4장은 실현을 통한 7가지 감정 단어의 가중치를 공유하였으며 마지막 장에는 연구의 결론과 시사점 및 향후 연구를 제시하고자 한다.
  • 본 연구는 Plutchick(1980)의 감정 세트를 기준으로 감정 단어들의 가중치를 추출하여 한글 감정 세트 내의 감정 랭킹을 추출하며 감정 분석(sentiment analysis)의 신뢰도를 높이고자 한다.
  • 본 연구는 네티즌의 의견 속에서 감정어의 우선순위를 결정하고자 한다. 모든 문장에 빈번히 나타난 키워드를 제한하여 의미 있는 감정단어를 부각하기 위한 TF_IDF를 사용하였다.
  • 하지만 원하는 것만을 빨리 찾아주는 큐레이션(curation)이 없다면 빅데이터의 가치를 느끼진 못할 것이다. 본 연구는 방대한 댓글 속에서 감정을 찾아주는 큐레이션으로 감정 시드를 본 연구자의 기존 연구를 확장하여 감정 단어에 감정 색인(index)을 만들고자 하였다. 감정의 지표는 그 시대의 표현 방법에 따른 변화이다.
  • 본 연구의 감정 지수는 TF-IDF 과정을 통하여 행렬로 변환하여 NMF 알고리즘을 활용하여 각 문서의 특성을 추출한 후 베겉 거리 측정방법으로 코사인 거리 알고리즘으로 감정 세트 내 감정 단어의 유사도를 결정 하고자 한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
Document Frequency란? DF(Document Frequency)는 특정 단어가 나타나는 문서 수를 나타내는 가중치이다. 단어가 주체인 TF와는 다르게 문서가 주체가 되는 방법이며, (식2)를 이용하여 연구 문서에 해당 단어의 빈도를 확인할 수 있다(Salton and Buckley, 1988).
z세대란? 공간, 소통의 도구, 언어 그리고, 직업은 서로 다르지만 공통의 관심사만 있다면 언제든 소통할 수 있는 세대를 z세대라 한다(강주연 등, 2020). z세대는 네트워크 환경에 익숙하여 자료나 정보, 콘텐츠의 저장(save) 개념이 없다.
z세대가 네트워크 환경에 익숙하여 자료나 정보, 콘텐츠의 저장(save) 개념이 없는 이유는 무엇인가? z세대는 네트워크 환경에 익숙하여 자료나 정보, 콘텐츠의 저장(save) 개념이 없다. 즐기고 소통하는 모든 콘텐츠는 네트워크 환경의 클라우드(cloud) 공간에서 제공되며 대면하지 않은 언택트(untact)를 이미 그들은 즐기고 있기 때문이다. 온라인에서 관계를 맺어가는 z세대는 소셜 커뮤니티에서 팔로워, 구독자, 이웃 등의 친구를 찾고 관계를 유지하며 영상 및 화상 통화로 소통하는 것을 선호한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (25)

  1. 강주연, 이이든, 김지수, "텍스트 마이닝을 활용한 'Z 세대'관련 뉴스데이터 의미연결망 분석," 미래청소년학회지, 제17권, 2020, pp. 25-48. 

  2. 고흥석, 신중현, "디지털 네이티브 세대의 미디어 이용행태에 관한 탐색적 연구," 한국콘텐츠학회논문지, 제18권, 제3호, 2018, pp. 1-10. 

  3. 권종원, 송태승, "제조 혁신 위한 플랫폼 기반의 디지털 트랜스포메이션 추진 동향," 전자공학회지, 제46권, 제12호, 2019, pp. 34-46. 

  4. 김철원, 박선, "의미특징과 워드넷 기반의 의사 연관 피드백을 사용한 질의기반 문서요약," 한국정보통신학회논문지 제15권, 제7호, 2011, pp. 1517-1524. 

  5. 박선, 김경준, 김경호, 이성로 "의미특징 기반의 용어 가중치 재산정을 이용한 문서군집의 성능 향상," 한국정보통신학회논문지, 제17권, 제2호, 2013, pp. 347-354. 

  6. 이종화, "Python을 이용한 SNS 크롤링 시스템 구축," 한국산업정보학회논문지, 제23권, 제5호, 2018, pp. 61-76. 

  7. 이종화, 이문봉, 김종원, "TF-IDF 를 활용한 한글 자연어 처리 연구," 정보시스템연구 제28권, 제3호, 2019, pp. 105-121. 

  8. 이종화, 이윤재, 이현규, "SNS 의 해시태그를 이용한 감정 단어 수집 시스템 개발," 정보시스템연구, 제27권, 제2호, 2018, pp. 77-94. 

  9. 이종화, "SNS 해시태그를 이용한 감정 단어 일반화 연구," 인터넷전자상거래연구 제18궈, 제4호, 2018, pp. 53-63. 

  10. 이진수, "데이터 사이언스 기반의 디지털 트랜스포메이션," 방송과 미디어 제22권, 제4호, 2017, pp. 18-25. 

  11. Balahur, A., Hermida, J. M., and Montoyo, A., "Detecting implicit expressions of emotion in text: A comparative analysis," Decision Support Systems, Vol. 53, No. 4, 2012, pp. 742-753. 

  12. Cheng, F., Shen, J., Yu, Y., Li, W., Liu, G., Lee, P. W., and Tang, Y., "In silico prediction of Tetrahymena pyriformis toxicity for diverse industrial chemicals with substructure pattern recognition and machine learning methods," Chemosphere, Vol. 82, No. 11, 2011, pp. 1636-1643. 

  13. Christian, H., Agus, M. P., and Suhartono, D., "Single Document Automatic Text Summarization using Term Frequency-Inverse Document Frequency (TFIDF)," ComTech: Computer, Mathematics and Engineering Applications, Vol. 7, No. 4, 2016, pp. 285-294. 

  14. Danielsson, P. E., "Euclidean distance mapping," Computer Graphics and image processing, Vol. 14, No. 3, 1980, pp. 227-248. 

  15. Gunasekaran, S., "Computer vision technology for food quality assurance," Trends in Food Science & Technology, Vol. 7, No. 8, 1996, pp. 245-256. 

  16. Kaelbling, L. P., Littman, M. L., and Moore, A. W., "Reinforcement learning: A survey," Journal of artificial intelligence research, Vol. 4, 1996, pp. 237-285. 

  17. Plutchik, R., A general psychoevolutionary theory of emotion, In Theories of emotion, 1980. 

  18. Qaiser, S., and Ali, R., "Text mining: use of TF-IDF to examine the relevance of words to documents," International Journal of Computer Applications, Vol. 181, No. 1, 2018, pp. 25-29. 

  19. Salton, G., and Buckley, C., "Term-weighting approaches in automatic text retrieval," Information processing & management, Vol. 24, No. 5, 1988, pp. 513-523. 

  20. Seung, D., and Lee, L., "Algorithms for non-negative matrix factorization," Advances in neural information processing systems, Vol. 13, 2001, pp. 556-562. 

  21. Tata, S., and Patel, J. M., "Estimating the selectivity of tf-idf based cosine similarity predicates," ACM Sigmod Record, Vol. 36, No. 2, 2007, pp. 7-12. 

  22. Walker, M. A., Anand, P., Abbott, R., Tree, J. E. F., Martell, C., and King, J., "That is your evidence?: Classifying stance in online political debate," Decision Support Systems, Vol. 53, No. 4, 2012, pp. 719-729. 

  23. Witten, I. H., Frank, E., Hall, M. A., and Pal, C. J., Data Mining: Practical machine learning tools and techniques, Morgan Kaufmann, 2016. 

  24. Ye, C., Yung, N. H., and Wang, D., "A fuzzy controller with supervised learning assisted reinforcement learning algorithm for obstacle avoidance," IEEE Transactions on Systems, Vol. 33, No. 1, 2003, pp. 17-27. 

  25. Ye, J., "Improved cosine similarity measures of simplified neutrosophic sets for medical diagnoses," Artificial intelligence in medicine, Vol. 63, No. 3, 2015, pp. 171-179. 

관련 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로