$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

토픽 모델링을 이용한 댓글 그래프 기반 소셜 마이닝 기법
A Reply Graph-based Social Mining Method with Topic Modeling 원문보기

한국지능시스템학회 논문지 = Journal of Korean institute of intelligent systems, v.24 no.6, 2014년, pp.640 - 645  

이상연 (충북대학교 컴퓨터과학과) ,  이건명 (충북대학교 컴퓨터과학과)

초록
AI-Helper 아이콘AI-Helper

인터넷 상에서 많은 사람들은 사용자 간의 의사소통과 정보 공유, 사회적 관계를 생성하기 위한 방법으로 소셜 네트워크 서비스를 이용한다. 그 중 대표적인 트위터는 하루에 수백만 건의 소셜 데이터가 발생하기 때문에 수집되고 있는 데이터의 양이 엄청나다. 이 방대한 양의 데이터로부터 의미 있는 정보를 추출하는 소셜 마이닝이 집중적으로 연구되고 있다. 트위터는 일반적으로 유용한 정보 혹은 공유하고자 하는 내용을 팔로잉-팔로워 관계를 이용해 쉽게 전달하고 리트윗할 수 있다. 소셜 미디어에서 트윗 데이터에 대한 토픽 모델링은 이슈를 추적하기 위한 좋은 도구이다. 짧은 텍스트 기반인 트윗 데이터의 제한점을 극복하기 위해, 사용자를 노드로 사용자간 댓글과 리트윗 메시지의 여부를 간선으로 하는 그래프 구조를 갖는 댓글 그래프의 개념을 소개한다. 토픽 모델링의 대표적인 방법인 LDA 토픽 모델이 짧은 텍스트 데이터에 대해 비효율적인 것을 보완하기 위한 방법으로, 이 논문에서는 짧은 문서의 수를 줄이고 마이닝 결과의 질을 향상시키기 위한 댓글 그래프를 사용하는 토픽 모델링 방법을 소개한다. 제안한 모델은 토픽 모델링 방법으로 LDA 모델을 사용하였으며, 7일간 수집한 트윗 데이터에 대한 실험 결과를 보인다.

Abstract AI-Helper 아이콘AI-Helper

Many people use social network services as to communicate, to share an information and to build social relationships between others on the Internet. Twitter is such a representative service, where millions of tweets are posted a day and a huge amount of data collection has been being accumulated. So...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 이 논문에서는 SNS기반 토픽 모델링을 보다 효율적으로 하기 위한 소셜 마이닝 기법을 소개하였다. 트렌드를 추출하는 방법은 이미 많이 소개되어 있지만 방대한 양의 데이터를 처리하기 위해서는 토픽 모델을 적용하기 전에 전처리 과정이 필요하다.
  • 기존에는 트렌드를 추출하기 위한 방법으로써 토픽 모델을 이용한 트렌드 추출 기법으로 짧은 텍스트 데이터인 소셜 데이터에 비효율적인 토픽 모델링을 했었다. 이 논문에서는 댓글 그래프를 기반으로 유사 사용자간 군집을 연결요소로 추출하고 문서의 단위를 군집으로 표현하여 보다 토픽 모델링에 적합한 데이터 마이닝 기법을 제안한다.
  • 이 논문에서는 두 군집이 병합할 때 유사 사용자를 중점으로 두기 때문에 A∩B로 병합을 하는 것을 제안한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
소셜 네트워크 서비스의 역할은 무엇인가? 소셜 네트워크 서비스(Social Network Service, SNS)는 온라인상에서 인맥을 새롭게 쌓거나, 기존 인맥과의 관계를 강화시킬 수 있는 서비스를 제공하고 개인의 관심, 취미, 사회적 위치 등 동질감이 있는 사람들 간에 커뮤니티를 만들어 준다. SNS 중 대표적인 서비스인 트위터는 트윗(tweet)과 리트윗(retweet)의 개념을 도입하여 공유하고자 하는 내용을 쉽게 전파할 수 있다.
리트윗의 특징은 무엇인가? SNS 중 대표적인 서비스인 트위터는 트윗(tweet)과 리트윗(retweet)의 개념을 도입하여 공유하고자 하는 내용을 쉽게 전파할 수 있다.[1] 특히 리트윗은 팔로잉-팔로워(following-follower)를 통해 특별한 조건 없이 쉽게 관계를 맺을 수 있기 때문에 공감과 공유의 전파 속도를 빠르게 한다. 이러한 이유로 트위터는 사회적 이슈의 출현과 변화를 충분히 반영을 한다.
소셜 마이닝 기법이 사용된 예는 무엇이 있는가? 소셜 마이닝은 소비자를 분석함으로써 판매 및 홍보로 사용되고 여론변화나 사회적 흐름과 트렌드를 찾기 위해 사용되는 마이닝 기법이다.[5] 그 예로 18대 대통령선거에서는 이 기법을 이용하여 SNS를 통한 전략으로 내세워 홍보하는 역할을 하였다.
질의응답 정보가 도움이 되었나요?

참고문헌 (11)

  1. H. Kwak, C. Lee, H. Park, S. Moon, "What is Twitter, a social network or a news media?," Proceedings of the 19th international conference on World Wide Web, pp. 591-600, 2010. 

  2. M. Song and M. C. Kim, "RT2M: Real-Time Twitter Trend Mining System," Proceedings of the IEEE 2013 International Conference on Social Intelligence and Technology, pp. 64-71, 2013. 

  3. W. X. Zhao, J. Jiang, J. Weng, J. He, E.-P. Lim, H. Yan, and X. Li, "Comparing Twitter and Traditional Media using topic models," Proceedings of the First Workshop on Social Media Analysis, pp.338-349, 2011. 

  4. D. M. Blei, A. Y. Ng, M. I. Jordan, "Latent dirichlet allocation," Journal of machine Learning research, Vol.3, pp.993-1022, 2003. 

  5. T. L. Griffiths, M. Steyvers, "Finding scientific topics," National academy of Sciences of the United States of America, Vol.101, Suppl.1, pp.5228-5235, 2004. 

  6. H. K. Peng, J. Zhu, D. Piao, R. Yan, "Retweet Modeling using Conditional Random Fields," Proceedings of the 11th IEEE International Conference on Data Mining Workshops, pp. 336-343, 2011. 

  7. T. Hofman, "Probabilistic Latent Semantic Analysis," Proceedings of UAI '99, 1999. 

  8. J. Weng, E. P. Lim, J. Jiang, "Twitterrank: Finding Topic-Sensitive Influential Twitterers," Proceedings of the third ACM WSDM, 2010. 

  9. L. Hong, B. D. Davison, "Empirical Study of Topic Modeling in Twitter," Proceedings of the SIGKDD Workshop on SMA, 2010. 

  10. D. M. Blei, "Introduction to Probabilistic Topic Models," Communications of the ACM, 2011. 

  11. F. LU, B. Shen, J. Lin, H. Zhang, "A Method of SNS Topic Models Extraction Based on Self-Adaptively LDA Modeling," Proceedings of 2013 Third International Conference on Intelligent System Design and Engineering Applications, IEEE Computer Society, pp.112-115, 2013. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로