$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

빅데이터 분석을 이용한 문단 내의 감정 예측
Emotion Prediction of Paragraph using Big Data Analysis 원문보기

디지털융복합연구 = Journal of digital convergence, v.14 no.11, 2016년, pp.267 - 273  

김진수 (안양대학교 교양대학)

초록
AI-Helper 아이콘AI-Helper

모바일의 확산과 더불어 정형화된 자료뿐만 아니라 다양한 형태의 비정형화된 자료로부터 정보가 생성되고 정보 전달 및 공유가 활발히 이루어지고 있다. 최근에는 다양한 SNS 매체들로부터 생산 및 배포되는 많은 자료들 중에서 유의미한 정보를 추출하는 기술로 빅데이터 기술을 많이 사용하며, 빅데이터 분석 기법 중 하나인 데이터 마이닝 기법을 사용한다. 특히, SNS로부터 수집된 방대하고 다양한 자료들을 이용하여 대중의 집단지성에 표출된 일반적인 감정을 분석하여 다양한 분야에 활용한다. 본 논문에서는 SNS를 통해 작성된 짧은 문단 내 함축된 키워드와 키워드들 간의 연관성을 이용하여 문단에 나타난 감정을 예측하고 사용자별 감정에 따른 적절한 답변이나 예측된 감정과 유사한 상품이나 영화 등 다양한 추천시스템에 사용될 수 있도록 형태소 분석과 변형된 n-gram방법을 혼합하여 효율적인 감정 예측 시스템을 제안한다. 제안된 시스템은 평균 82.25%의 재현율을 보여 기존의 시스템에 비해 더욱 향상된 성능을 보여 주었고, 형태소분석을 통해 의미 있는 키워드 추출에 도움이 될 것으로 기대한다.

Abstract AI-Helper 아이콘AI-Helper

Creation and Sharing of information which is structured data as well as various unstructured data. makes progress actively through the spread of mobile. Recently, Big Data extracts the semantic information from SNS and data mining is one of the big data technique. Especially, the general emotion ana...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 학습 문단에 출현하는 모든 키워드를 대상으로 사전을 구축하면 감정 분류에 영향을 미치지 않는 키워드들의 정보도 유지되지만 시스템의 공간복잡도와 시간복잡도 측면에서 비효율적이고 잘못된 분류의 원인이 된다. 따라서 본 논문에서는 각각의 문서에 나타난 감정 클래스 특징을 반영하기 위한 클래스 변수와 단어들 간의 규칙을 가중치로 하는 키워드를 추출하고 사전을 구성한다.
  • 본 논문에서는 개인들이 SNS를 이용하여 생산 및 배포되는 다양한 형태의 짧은 문단들에 함축된 키워드와 키워드들 간의 연관성을 이용하여 문장 내 감정 상태를 예측하고, 사용자의 감정에 따른 적절한 답변이나 추출한 감정과 유사한 상품, 음악, 영화 등을 추천하는데 사용될 수 있도록 형태소 분석과 n-gram 방식을 혼합한 효율적인 감정 예측 시스템을 제안한다.
  • 또한, 생산성이 매우 우수한 파이썬을 통해 언어 처리를 할 수 있다. 본 논문에서는 의미있는 키워드를 추출하기 위해 감정 분석에 유용한 의미를 가지는 명사, 동사 등을 추출하였고, 조사, 한정사 등은 전체 시스템의 부하를 줄이기 위해 배제하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
형태소 분석은 무엇인가? 형태소 분석은 형태소를 비롯하여, 어근, 접두사/접미사, 품사(POS, Part Of Speech) 등 다양한 언어적 속성의 구조를 파악하는 것이다. 1995년부터 한국어 정보처리를 위한 다양한 오픈 소스 형태소 분석기인 KTS, KoNLP, MeCab-ko, KoNLPy 등이 개발되었다.
빅 데이터의 분석 처리 기술에는 어떤것이 있는가? 빅데이터(Big Data)는 기존 데이터베이스 관리 도구의 역량을 넘어서는 대량의 정형 또는 비정형의 데이터 집합으로부터 가치를 추출하고 결과를 분석하는 기술이다[11,12]. 빅 데이터의 분석 처리 기술은 대부분 기존 통계학과 전산학에서 사용되던 데이터 마이닝, 기계학습, 자연언어처리, 패턴 인식 등이 있다. 빅데이터 기법 중 데이터 마이닝은 연관규칙, 순차패턴, 분류, 클러스터링 등의 다양한 방법을 사용하여 많은 자료들 가운데 숨겨져 있는 유용한 상관관계를 발견하여, 미래에 실행 가능한 정보를 추출해 내고 의사 결정 등에 사용한다.
빅데이터 분석이 SNS에 활용되는 대표 사례는? 특히, SNS로 수집된 방대하고 다양한 자료들을 이용하여 대중의 집단지성에 표출된 일반적인 감정분석에 활용된다[1,2]. 예를 들어, 불특정의 개인들이 작성한 상품평, 상품이용 후기나 영화평 등에 나타나는 감정을 부정 혹은 긍정으로 분류하여 상품 및 영화에 대한 대중의 선호도를 분석하고, 분석된 선호도를 이용하여 개인화된 정보와 결합하여 사용자 성향에 맞는 다양한 추천시스템 분야에서 사용된다[3,4,5].
질의응답 정보가 도움이 되었나요?

참고문헌 (16)

  1. Sung-hyun Yun, Keun-ho Lee, Heui-seok Lim, Dae-ryong Kim, Jung-hoon Kim, "The Method of Digital Copyright Authentication for Contents of Collective Intelligence", Journal of the Korea Convergence Society, Vol. 6, No. 6, pp. 185-193, 2015. 

  2. Jung-Hoon Kim, Jun-Young Go, Keun-Ho Lee, "A Scheme of Social Engineering Attacks and Countermeasures Using Big Data based Conversion Voice Phishing", Journal of the Korea Convergence Society, Vol. 6, No. 1, pp. 85-91, 2015. 

  3. Dong-Yup Choi, Jin-Kyu Park, Tae-Jung Kim, "An Emotion Extraction Method from SMS Text for the Emotion Expression Robot", Journal of Korea Intellectual Patent Society, Vol.18, No. 44, pp.5-8, 2016. 

  4. Young-Seok Yoo, Bang-Yong, Sohn, "Music Listening Behavior analysis of Twitter User and A Comparative Study of Domestic Music Ranking", Journal of Digital Convergence, Vol.14, No.5, pp.309-316, 2016. 

  5. Eun-Jin Jung, Joo-Chang Kim, Joo-Chang Kim, Kyungyong Chung, "Social Network based Sensibility Design Recommendation using {User - Associative Design} Matrix", Journal of Digital Convergence, Vol.14, No.8, pp.313-318, 2016. 

  6. Michael W Morris, Dacher Keltner. "How Emotions Work: the Social Functions of Emotional Expression in Negotiatios", Research in Organizational Behavior, 22, pp.1-50, 2000. 

  7. Robert E. Thayer, "The Biopsychology of Mood and Arousal", Oxford University Press, 1989. 

  8. HeeSam Shin, The Society Of Korean Semantics, Korean Semantics 15, pp. 207-225, 2004. 

  9. http://konlpy.org/ko/v0.4.4/ 

  10. Bernhard E Boser, Isabelle M Guyon, and Vladimir N Vapnik, "A Training Algorithm for Optimal Margin Classifiers", Proc. The Fifth Annual Workshop on Computational Learning Theory, pp.144-152, 1992.. 

  11. John Gantz, David Reinsel, "Extracting Value from Chaos", IDC IVIEW June, p.6, 2011. 

  12. O'Reilly Radar Team, Planning for Big Data, O'Reilly, 2012. 

  13. http://en.wikipedia.org/wiki/N-gram 

  14. Jin-Su Kim, "Emotion Prediction of Document using Paragraph Analysis", Journal of Digital Convergence, Vol. 12, No. 12, pp.249-255, 2014. 

  15. http://kin.naver.com/openkr/list.nhn 

  16. Do,H. H., Melnik, S. & Rahm, E. 2002. Comparison of Schema Matching Evaluations. In Revised Papers from the NODe 2002 Web and Database-Related Workshops on Web, Web-Services, and Database Systems, Akmal B. Chaudhri, Mario Jeckle, Erhard Rahm, and Rainer Unland (Eds.). Springer-Verlag, London, UK, 221-237. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로