$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

블로그 공간에서의 링크 기반 클러스터링 방안
Link-Based Clustering in Blogosphere 원문보기

電子工學會論文誌. Journal of the Institute of Electronics Engineers of Korea. CI, 컴퓨터, v.46 no.3 = no.327, 2009년, pp.42 - 49  

송석순 (한양대학교 전자컴퓨터통신공학과) ,  윤석호 (한양대학교 전자컴퓨터통신공학과) ,  김상욱 (한양대학교 전자컴퓨터통신공학과)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 블로그 공간에 존재하는 블로거와 포스트들을 클러스터링하고자 한다. 먼저 블로그 공간의 블로거와 포스트들을 각각 하나의 타입으로, 블로거와 포스트 사이의 액션을 링크로 사상한다. 다음으로, 블로그 공간의 클러스터링을 위하여 블로그 환경에 가장 적합하고 효율적인 링크 기반 클러스터링 방법인 LinkClus를 선택한다. 정확한 클러스터링을 위하여 두 가지 방법을 제시한다. 첫 번째는 클러스터의 대상을 여러 주제에 관심을 가지는 블로거 대신 하나의 주제만을 나타내는 폴더로 한다. 두 번째는 노이즈의 발생 가능성을 높이는 링크가 아주 적은 블로거와 포스트를 클러스터링 과정에서 제외시킨다. 실험을 통하여 제안하는 방안을 이용한 클러스터링 결과가 내용적으로도 유사한지 검증한다.

Abstract AI-Helper 아이콘AI-Helper

This paper addresses clustering of blogs and posts in blogosphere. First, we model blogosphere as a social network where blogs and posts correspond to nodes and interactions on posts by blogs corresponds to links. Next, for clustering in blogosphere, we employ LinkClus, a link based algorithm that f...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 그러나 유사한 블로거들이 공통으로 액션을 취한 포스트들이기 때문에 내용적으로도 유사할 것임을 기대한다. 따라서 본 논문에서는 실험을 통하여 LinkClus로 클러스터링된 포스트들의 주제가 얼마나 동일한지 알아보고자 한다.
  • 블로거와 포스트들을 클러스터링하기 위하여 기존의 링크 기반 클러스터링 방법 중에서 Lin亦Chis가 블로그 공간에 가장 적합하다는 것을 보였다. 또한 LinkClus를 블로그 공간에 적용하는 방안을 논의했다. LinkClus는 서로 다른 타입의 객체를 객체와 객체사이에 존재하는 링크를 통하여 클러스터링한다.
  • 이는 해결하고자 하는 문제를 링크 기반 클러스터링 문제로 변환할 수 있다는 것을 의미한다. 본 논문에서는 링크 기반 클러스터링 방법을 이용하여 블로그 공간을 클러스터링하고자 한다.
  • 또한 액션을 기반으로 클러스터링한 포스트들은 유사한 블로거들이 공통으로 관심을 가지기 때문에 동일한 주제의 내용을 담고 있을 것으로 기대한다. 본 논문에서는 블로거와 포스트 사이의 액션을 이용하여 블로그 공간을 클러스링하고자 한다.
  • 본 논문에서는 블로그 공간에서의 링크 기반 클러스터링 방법에 대해 연구하였다. 블로거와 포스트들을 클러스터링하기 위하여 기존의 링크 기반 클러스터링 방법 중에서 Lin亦Chis가 블로그 공간에 가장 적합하다는 것을 보였다.
  • 또한 정확도 측면에서도 LinkClus가 모든 객체들 간의 유사도를 계산하기 때문에 ReCoM보다 더 정확한 결과를 보인다. 본 논문에서는 정확도가 높고 성능이 가장 우수하며 블로그 공간의 구조에 가장 적합한 LinkClus 를 선택하여 블로그 공간의 블로거들과 포스트들을 클러스터링하고자 한다.
  • 분류해놓은 폴더가 존재한다. 본 논문에서는 정확한 클러스터링을 위하여 블로거-포스트 관계가 아닌 폴더-포스트 관계를 이용하고자 한다. 그림 5은 하나의 블로거를 여러 개의 폴더로 세분화한 예이다.

가설 설정

  • 그러나 이러한 경우는 두 블로거의 링크가 적기 때문에 높게 계산된 유사도를 신뢰할 수가 없다. 따라서 본 논문에서는 링크가 k 이하인 블로거와 포스트를 노이즈로 간주하여 클러스터링 과정에서 제외시킨다. 본 논문에서는 링크가 1이 하인 블로거와 포스트를 노이즈로 간주한다.
본문요약 정보가 도움이 되었나요?

참고문헌 (17)

  1. J. Han and M. Kamber, Data Mining: Concepts and Techniques, Morgan Kaufmann, 2006 

  2. S. Gardner, Buzz Marketing With Blogs for Dummies, John Wiley & Sons Inc, 2005 

  3. X. Yin, J. Han, and P. Yu, 'LinkClus: Efficient Clustering via Heterogeneous Semantic Links,' In Proc. Int'l. Conf. on Very Large Data Bases, pp. 427-438, 2006 

  4. H. Small, 'Co-citation in the Scientific Literature: A new Measure of the Relationship between Two Documents,' Journal of the American Society for Information Science, Vol. 24, No. 4, pp. 265-269, 1973 

  5. M. Kessler, 'Bibliographic Coupling Between Scientific Papers,' Journal of the American Documentation, Vol. 14, No. 1, pp. 10-25, 1963 

  6. G. Jeh and J. Widom, 'SimRank: A Measure of Structural-Context Similarity,' In Proc. Int'l. Conf. on Special Interest Group on Knowledge Discovery and Data, pp. 538-543, 2002 

  7. J. Wang et al., 'ReCoM: Reinforcement Clustering of Multi-type Interrelated Data Objects,' In Proc. Int'l. Conf. on Special Interest Group on Information Retrieval, pp. 274-281, 2003 

  8. NHN(주), http://blog.naver.com, 2009. 

  9. Wikipedia, blog, http://en.wikipedia.org/wiki/Blog, 2009 

  10. S. Herring et al., Conversations in the Blogosphere: An Analysis 'From the Bottom Up,' In Proc. of the 38th Annual Hawaii Int'l. Conf. on System Scicences, pp. 107b, 2005 

  11. Y. Lin, 'Blog Community Discovery and Evolution based on Mutual Awareness Expansion,' In Proc. Int'l. Conf. on Web Intelligence, pp. 48-56, 2007 

  12. K. Fujimura, T. Inoue, and M. Sugisaki, 'The Eigenrumor Algorithm for Ranking Blogs,' In Proc. Int'l. Conf. on World Wide Web, 2005 

  13. D. Gruhl et al., 'Information Diffusion Through Blogspace' In Proc. Int'l. Conf. on World Wide Web, pp. 491-501, 2004 

  14. A. Chin and M. Chignell, 'A Social Hypertext Model for Finding Community in Blogs', In Proc. Int'l. Conf. on Hypertext and Hypermedia, pp. 11-22, 2006 

  15. J. Wang and J. Han, 'CLOSET+: Searching for the Best Strategies for Mining Frequent Closed Itemsets,' In Proc. Int'l. Conf. on Special Interest Group on Knowledge Discovery and Data, pp. 236-245, 2003 

  16. N. Pasquier et al., 'Discovering Frequent Closed Itemsets for Association Rules,' In Proc. Int'l. Conf. on Database Theory, pp. 398-416, 1999 

  17. R. Kumar et al., 'Trawling the Web for Emerging Cyber-Communities,' In Proc. Int'l. Conf. on World Wide Web, pp. 1481-1493, 1999 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로