[논문]TRIB: 블로그 댓글 분류 및 시각화 시스템

이윤정; 지정훈; 우균; 조환규

doi:10.3745/kipstd.2009.16d.5.817

초록
AI-Helper

최근 들어 블로그나 인터넷 게시판 등은 사람들의 정보 공유나 의견 교환의 중요한 매체가 되고 있으며, 많은 수의 블로그들이 사회적 문제들을 반영하고 있다. 온라인 커뮤니티에서 많은 사용자들은 댓글을 통해 인터넷 뉴스나 블로그 게시물에 대한 자신의 의견을 적극적으로 표현하고 있다. 블로그 사용이 활발해짐에 따라 수만개 이상의 댓글들이 등록되는 블로그들도 쉽게 찾을 수 있다. 대부분의 블로그나 인터넷 포털사이트의 경우 게시물이나 댓글들을 순차적인 목록 형태로 제공하므로 자신이 원하는 내용의 댓글을 검색하거나 전체 댓글에 대한 전반적인 파악이 힘들다. 본 논문에서는 게시물에 달린 많은 수의 댓글들을 분류하고, 이를 시각화 하는 시스템인 TRIB (Telescope for Responding comments for Internet Blog)를 제안한다. TRIB는 미리 정의된 사용자 정의 사전을 이용하여 댓글을 내용에 따라 분류하여 시각화한다. 또한, 사용자들의 관심과 흥미를 고려한 개인화 된 뷰를 제공한다. TRIB의 유용성을 보이기 위해서 1,000개 이상의 댓글을 가진 인터넷 게시물들을 대상으로 한 실험을 통해 TRIB 시스템의 댓글 분류와 시각화 성능을 보인다.

Abstract ▼ AI-Helper

In recent years, Weblog has become the most typical social media for citizens to share their opinions. And, many Weblogs reflect several social issues. There are many internet users who actively express their opinions for internet news or Weblog articles through the replying comments on online commu...

In recent years, Weblog has become the most typical social media for citizens to share their opinions. And, many Weblogs reflect several social issues. There are many internet users who actively express their opinions for internet news or Weblog articles through the replying comments on online community. Hence, we can easily find internet blogs including more than 10 thousand replying comments. It is hard to search and explore useful messages on weblogs since most of weblog systems show articles and their comments to the form of sequential list. In this paper, we propose a visualizing and clustering system called TRIB (Telescope for Responding comments for Internet Blog) for a large set of responding comments for a Weblog article. TRIB clusters and visualizes the replying comments considering their contents using pre-defined user dictionary. Also, TRIB provides various personalized views considering the interests of users. To show the usefulness of TRIB, we conducted some experiments, concerning the clustering and visualizing capabilities of TRIB, with articles that have more than 1,000 comments.

주제어

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

기존의 블로그 관련 시각화 연구들은 주로 블로그 공간이나 많은 양의 게시물을 하나의 화면에 보여주기 위한 연구에 치중에 있는 반면에 본 논문에서는 게시물에 달린 많은 수의 댓글들을 분류하고 이를 시각화하는 시스템인 TRIB를 제안하였다. TRIB는 내용을 기반으로 하여 댓글을 분류할수 있다.
따라서 본 논문에서는 인터넷 뉴스나 블로그 게시물에 달린 많은 수의 댓글들을 사용자 정의 사전을 통해 내용에 따라 분류하고 이를 시각화하는 시스템인 TRIB를 제안한다. TRIB에서는 화면 중심에 게시물을 배치하고 게시물의 내용과 연관 정도에 따라 사용자 정의 사전의 단어들을 그 주변에 배치한다.
본 논문에서의 실험은 TRIB의 사전에 따른 댓글 분류와 시각화 성능을 보이기 위해 실험을 수행하였다. 실험에 사용된 게시물과 댓글은 인터넷 포털 사이트 ‘다음’에서 운영하는 온라인 토론 게시판인 ‘아고라’에서 수집되었다.

제안 방법

BBC 2's White 시즌 중 토론을 조사하여 감정, 지역, 성별 등에 따라 댓글을 클러스터링하고 이를 시각화한다.
Harris[4] 등은 블로그 시각화 방법인 "We feel fine"이라는 시스템을 개발하였다. 일정 시간마다 전 세계에서 게시되는 블로그 게시물들을 수집하고 게시물에 포함된 감정 표현 문장들을 분석하여 행복(happy), 슬픔(sad), 우울(depressed)과 같은 감정 상태로 분류한다. (그림 1)은 “We feel fine” 시스템의 시각화 결과를 보여준다.

대상 데이터

본 논문에서 제안하는 TRIB는 블로그 게시물에 추가된 댓글을 시각화 대상으로 삼는다. Spectrum과 같은 다른 시각화 시스템들은 댓글을 대상으로 하고 있긴 하지만 내용을 기반으로 한 분류를 수행하고 있지 않다는 점에서 한계가 있다[12-14].
본 논문에서는 실험을 위해 2009년 1월 23일부터 2009년 1월 29일까지 일주일 동안 ‘아고라’에 게시되는 게시물을 수집하였다.
본 실험에서는 수집된 게시물 중에 정치, 연예, 일반 범주에 속한 게시물 중 댓글 수가 비슷한 게시물을 선택하였다. 실험 데이터는 <표 3>과 같다.
실험에 사용된 게시물과 댓글은 인터넷 포털 사이트 ‘다음’에서 운영하는 온라인 토론 게시판인 ‘아고라’에서 수집되었다.

성능/효과

TRIB를 통한 시각화 결과에서 우리는 흥미로운 사실을 발견하였다. 연예 관련 게시물의 경우 정치나 일반적인 게시물에 비해 id로 분류된 댓글들이 직선으로 나타나는 경우가 많은 것을 볼 수 있다.
Spectrum과 같은 다른 시각화 시스템들은 댓글을 대상으로 하고 있긴 하지만 내용을 기반으로 한 분류를 수행하고 있지 않다는 점에서 한계가 있다[12-14]. 본 논문에서 제시하는 TRIB는 댓글을 대상으로 시각화를 수행하면서도 댓글 내용을 기반으로 하여 댓글들을 분류하고 있다는 점에서 기존 시스템과 다른 새로운 방향으로 시각화를 수행한다고 할 수 있다.
<표 6>은 주제별 게시물과 사전의 적용에 따른 댓글 분류 정도를 정리한 것이다. 위의 실험을 통해 주제별 사용자 정의 사전의 사용으로 게시물의 댓글들이 내용에 따라 효율적으로 분류되고 시각화됨을 알 수 있다.

후속연구

향후 연구로서 악성 댓글을 차단하도록 TRIB를 확장하는 것을 생각해 볼 수 있다. 본 논문에서 제안한 댓글 시각화 시스템 TRIB는 내용에 따라 분류 및 시각화를 수행하고 있으므로 TRIB를 확장하면 악성 댓글을 차단할 수 있을 것으로 기대된다. 최근 광고성 댓글이나 비속어 등이 많이 포함된 댓글이 사회적으로 문제가 되고 있는데, 댓글 내용을 검색하여 비속어 등을 검출해 내고 이를 차단하도록 TRIB를 확장할 수 있을 것이다.
게시물의 경우는 태그 외에도 제목, 내용, 작성자 등과 같은 정보를 통해 검색이나 정렬이 가능하나 댓글의 경우는 내용에 따른 검색이나 댓글간의 연관성을 파악하는 것과 같은 2차적 데이터 처리는 제공되고 있지 않다. 앞서 언급된 것과 같이 온라인 커뮤니티에서 의견 수렴과 정보 공유의 도구로 댓글이 유용하게 활용되는 만큼 효율적인 댓글 검색과 댓글간의 연관관계를 파악할 수 있는 방법이 필요할 것이다.
향후 연구로서 악성 댓글을 차단하도록 TRIB를 확장하는 것을 생각해 볼 수 있다. 본 논문에서 제안한 댓글 시각화 시스템 TRIB는 내용에 따라 분류 및 시각화를 수행하고 있으므로 TRIB를 확장하면 악성 댓글을 차단할 수 있을 것으로 기대된다.

질의응답

핵심어	질문	논문에서 추출한 답변
	TRIB는 어떻게 구성되는가?	TRIB는 사전 배치 모듈, 댓글 분류 모듈 그리고 시각화 모듈과 같이 세 부분으로 구성된다. (그림 5)에서 S는 게시물을 나타내고, ck는 그 게시물에 달린 댓글 집합 C에 속한 k번째 댓글을 의미한다.
	We feel fine 시스템은 어떤 기능을 수행하는가?	Harris[4] 등은 블로그 시각화 방법인 "We feel fine"이라는 시스템을 개발하였다. 일정 시간마다 전 세계에서 게시되는 블로그 게시물들을 수집하고 게시물에 포함된 감정 표현 문장들을 분석하여 행복(happy), 슬픔(sad), 우울(depressed) 과 같은 감정 상태로 분류한다. (그림 1)은 “We feel fine”시스템의 시각화 결과를 보여준다.
	TRIB는 무엇인가?	TRIB는 인터넷 게시물에 달린 많은 양의 댓글을 사용자 정의 사전을 이용하여 내용에 따라 분류하고 이를 시각화하는 시스템이다. TRIB의 시스템 구성은 (그림 5)와 같다.

참고문헌 (15)

심재민, 조찬형, 양효진, 안인회, 나은아, “웹2.0 시대의 네티즌 인터넷 이용 현황”, 2006년 인터넷이슈심층조사 보고서, 한국인터넷진흥원, 2006.
김은미, 선유화, “댓글에 대한 노출이 뉴스 수용에 미치는 효과,” 한국언론학보, pp.33-64, 2006.
T. Nguyen and J.Zhang, "A novel visualization model for web search results," IEEE transaction on Visualization and Computer Graphics, Vol.12, No.5, pp.981-988, 2006.

상세보기
"We Feel Fine", http://www.wefeelfine.org
"BBC Spectrum", http://www.bbc.co.uk/white/spectrum.shtml
J. Indratmo and C. Gutwin, “Exploring blog archives with interactive visualization,” In Proceedings of the Working Conference on Advanced Visual Interfaces, pp.39-46, 2008.
Y. Takama, A. Matsumura, and T. Kajinami, “Visualization of News Distribution in Blog Space,” In Proceedings of the 2006 IEEE/WIC/ACM international conference on Web Intelligence and Intelligent Agent Technology, pp.413-416, 2006.
S. Fujimura, K. Fujimura, and H. Okuda, “Blogosonomy: Autotagging any text using bloggers' knowledge,” Proceedings of the IEEE/WIC/ACM International Conference on Web Intelligence, pp.205-212, 2007.
K. Fujumura, S. Fujimura, T. Matsubayash, T. Yamada, and H. Okuda, “ Topigraphy: visualization for large-scale tag clouds,” In WWW'08: Proceeding of the 17th international conference on World Wide Web, pp.1087-1088, 2008.
J. Kim, K. Candan, and J. Tatemura, “CDIP: Collection-Driven, yet Individuality-Preserving Automated Blog Tagging,” ICSC2007, pp.87-94, 2007.
O. Kaser and D. Lemire, “Tag-Cloud Drawing: Algorithms for Cloud Visualization,” WWW'07: 16th International World Wide Web Conference, 2007.
G. Mishne and M. de Rijke, “MoodViews: Tools for blog mood analysis,” In AAAI2006 Spring Symposium on Computational Approaches to Analysing Weblogs (AAAICAAW2006), pp., 2006.
C. Yang, K. Lin, and H. Chen, “Emotion Classification Using Web Blog Corpora,” In Proceedings of the IEEE/WIC/ACM International Conference on Web Intelligence, pp.275-278, 2007.
Y. Jung, Y. Choi, and S. Myaeng. “Determining Mood for a Blog by Combining Multiple Sources of Evidence,” In Proceedings of the IEEE/WIC/ACM International Conference on Web Intelligence, pp.271-274, 2007.
"Processing 1.0", http://www.processing.org

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

TRIB: 블로그 댓글 분류 및 시각화 시스템
TRIB : A Clustering and Visualization System for Responding Comments on Blogs 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약
AI-Helper

문제 정의

제안 방법

대상 데이터

성능/효과

후속연구

질의응답

참고문헌 (15)

이 논문을 인용한 문헌

저자의 다른 논문 :

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

TRIB: 블로그 댓글 분류 및 시각화 시스템 TRIB : A Clustering and Visualization System for Responding Comments on Blogs 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

제안 방법

대상 데이터

성능/효과

후속연구

질의응답

참고문헌 (15)

이 논문을 인용한 문헌

저자의 다른 논문 :

이윤정 (15) 지정훈 (7) 우균 (30) 조환규 (80)

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

TRIB: 블로그 댓글 분류 및 시각화 시스템
TRIB : A Clustering and Visualization System for Responding Comments on Blogs 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper