$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

연관 태그의 군집화를 위한 클러스터링 기법 비교 연구
A Comparative Study on Clustering Methods for Grouping Related Tags 원문보기

한국문헌정보학회지 = Journal of the Korean Society for Library and Information Science, v.43 no.3, 2009년, pp.399 - 416  

한승희 (서울여자대학교 사회과학대학 문헌정보학과)

초록
AI-Helper 아이콘AI-Helper

본 연구에서는 태그 공간에서 정보의 효율적 탐색을 위해 이용자에게 제공될 수 있는 연관 태그 클러스터의 생성을 위해 다양한 유사계수와 클러스터링 기법을 적용한 후 그 결과를 평가하고 비교 분석함으로써 연관 태그의 클러스터링에 가장 적합한 클러스터링 알고리즘을 확인하고자 하였다. Delicious에서 임의의 태그 10개를 대상으로 각각 300개의 문서에서 추출한 연관 태그를 대상으로 태그쌍 간의 연관성을 측정한 후 계층적 기법비계층적 기법을 적용하여 생성된 클러스터를 대상으로 클러스터 적합도를 측정한 결과, 일반적으로 용어 클러스터링에서 널리 활용되는 것으로 알려진 워드 기법이 코사인 유사계수와 결합했을 때 거의 모든 실험 대상에 대해 유사한 경향을 보이면서 가장 우수한 성능을 나타내는 것으로 나타났다. 연관 태그 클러스터는 정보관리 측면에서 유사한 합목적성을 갖는 태그끼리 군집을 이루면서 용어의 중의성을 해소함으로써 태그 공간에서의 이용자의 정보 탐색에 유용하게 활용될 것이다.

Abstract AI-Helper 아이콘AI-Helper

In this study, clustering methods with related tags were discussed for improving search and exploration in the tag space. The experiments were performed on 10 Delicious tags and the strongly-related tags extracted by each 300 documents, and hierarchical and non-hierarchical clustering methods were c...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 그러므로 이 연구에서는 앞에서 언급한 가정을 근거로 이 실험에서는 주제적으로 연관성 있는 태그들을 군집화하는 클러스터링 기법의 효과를 측정하기 위해서 다양한 조건에서 생성된 클러스터링 결과를 대상으로 연구자가 직접 클러스터 적합도를 측정하였으며, 그 공식은 다음과 같다(한승희 2004).
  • 본 연구에서는 태그 공간에서의 효율적인 정보 탐색을 위해 연관 태그를 이용자에게 효과적으로 제공하기 위한 방법중 클러스터링 기법을 제안하고, 연관 태그의 클러스터 생성에 가장 적합한 기법을 확인하기 위해 다양한 클러스터링 기법을 적용한 후, 그 결과를 평가하여 비교·분석하고자 하였다.
  • 이 연구에서는, 태그 공간에서의 효율적인 정보 탐색을 위해 연관 태그를 이용자에게 효과적으로 제공하기 위한 방법 중 클러스터링 기법을 제안하고, 연관 태그의 클러스터 생성에 가장 적합한 기법을 확인하기 위해 다양한 클러스터링 기법을 적용한 후, 그 결과를 평가하여 비교·분석하고자 한다.
  • 태그 검색이 갖고 있는 문제점을 해결하기 위해 일부의 서비스에서 연관 태그(related tags)를 이용자에게 제공함으로써 태그 공간에서의 탐색의 효율성을 높이고자 하였다. 예를 들어, Delicious에서는 <그림 1>과 같이 특정 태그와 연관이 있는 태그들을 이용자에게 제공함으로써 이용자가 연관된 개념에 대해서도 정보를 탐색할 수 있도록 돕고 있다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
대표적인 이용자 참여형 웹 2.0에는 무엇이 있는가? 0 환경으로 진화하면서 이용자의 참여와 협력이 웹의 진화와 생성에 가장 중요한 역할을 하고 있는데, 이러한 이용자 참여형 웹 2.0의 형태 중 가장 대표적인 것이 바로 태그 메커니즘에 의한 협력적 태깅(collaborative tagging)이라고 할 수 있다. Flickr(http://flickr.
계층적 기법에는 무엇이 있는가? 계층적 기법은 객체가 처리되는 순서에 영향을 받지 않기 때문에 비계층적 기법과는 달리 클러스터링 결과가 안정적인 반면 비계층적 클러스터링 기법에 비해 처리시간이 길고 계산복잡도가 높다(Tombros 2002). 계층적 기법에 속하는 것으로는 완전연결 기법(complete linkage method), 단일연결 기법(single linkage method), 집단평균 기법(group average linkage method), 워드 기법(Ward's method) 등이 있다(Voorhees 1985).
클러스터링 기법 중 비계층적 기법의 단점은 무엇인가? 비계층적 기법은 미리 정해진 k개의 센트로이드를 중심으로 센트로이드와 객체와의 거리를 최소화할 때까지 n개의 객체를 k개의 상호배타적인 클러스터로 나누는 방식으로, 시간과 비용을 최소화할 수 있고 계산복잡도가 낮다는 장점을 가지고 있다. 그러나 클러스터링 결과가 k개의 센트로이드 선택에 따라 많은 영향을 받는다는 단점이 있다. 비계층적 기법에 속하는 알고리즘으로는 k-means 기법, 싱글패스(single pass) 기법 등이 있다(Willet 1988).
질의응답 정보가 도움이 되었나요?

참고문헌 (33)

  1. 박병재, 우종우. 2008. 연관 태그의 군집 알고리즘의 설계 및 구현. "한국IT서비스학회지", 7(4):199-208. 

  2. 유사라. 1999. "정보학연구와 분석방법론". 서울: 나남출판. 

  3. 이순규, 김정훈, 이지형. 2008. 트랙백을 이용한 연관태그 클러스터링. "한국지능시스템학회 추계학술대회 학술발표논문집", 18(2): 125-128. 

  4. 이시화, 이만형, 황대훈. Web2.0 환경에서의 효율적인 이미지 검색을 위한 태그 클러스터링 시스템의 설계 및 구현. "멀티미디어학회 논문지", 11(8): 169-178. 

  5. 이재윤. 2007. 분포 유사도를 이용한 문헌클러스터링의 성능향상에 대한 연구. "정보관리학회지",24(4): 267-283. 

  6. 이재윤, 정도헌. 2008. 폭소노미 태그 사용 패턴 분석 통제어휘 및 비통제어휘와의 비교. "제15회 한국정보관리학회 학술대회 논문집", 21-26. 

  7. 이정미. 2007. 폭소노미의 개념적 접근과 웹 정보 서비스에의 적용. "한국비블리아학회지", 18(2):141-159. 

  8. 정영미. 2005. "정보검색연구". 서울: 구미무역(주)출판부. 

  9. 정충영, 최이규. 2009. "SPSSWIN을 이용한 통계분석". 제5판. 서울: 무역경영사. 

  10. 한승희. 2004. "클러스터링 기법을 이용한 개별문서의 지식구조 자동 생성에 관한 연구". 박사학위논문, 연세대학교 대학원 문헌정보학과. 

  11. Begelman, Grigory, Keller, Phillip, and Smadja, Frank. 2006. Automated tag clustering: Improving search and exploration in the tag space. [online]. [cited 2009.7.13]. . 

  12. Candan, K. Selcuk, Caroz, Di, Luigi, and Sapino, Luisa, Maria. 2008. “Creating tag hierarchies for effective navigation in social media." In Proceeding of the 2008 ACM Workshop on Search in Social Media, 75-82. 

  13. Dagan, Ido, Lee, Lillian, and Pereira, Fernando. 1999. “Similarity-based models of cooccurrence probabilities." Machine Learning, 34(1-3): 43-69. 

  14. Delicious. [online]. . 

  15. Ding, Y., Chowdhury, G. G., and Foo, S. 2001. “Bibliometric cartography of information retrieval research by using co-word analysis." Information Processing and Management, 37: 817-842. 

  16. Fichter, Darlene 2006. “Intranet applications for tagging and folksonomies." Online, 30(3): 43-45. 

  17. Hammond, Tony, Hannay, Timo, Lund, Ben, and Scott, Joanna. 2005. “Social bookmarking tools(I)." D-Lib Magazine, 11(4). [online]. [cited 2009.8.7]. . 

  18. Jardine, N., and Sibson, R. 1968. “The construction of hierarchic and non-hierarchic classifications." The Computer Journal, 11(2): 177-184. 

  19. Lee, Lillan. 1999. “Measures of distributional similarity." In Proceedings of 37th Annual Meeting of the Association for Computational Linguistics, 25-32. 

  20. Mathes, Adam. 2004. Folksonomies ? Cooperative Classification and Communication Through Shared Metadata. [online]. [cited 2008.7.31]. . 

  21. Milligan, G. W., Soon, S. C., and Sokol, L. M. 1983. “The effect of cluster size, dimensionality and the number of clusters on recovery of true cluster structure." IEEE Transactions on Patterns Analysis and Machine Intelligence, 5(1): 40-47. 

  22. Schrammel, Johann, Leitner, Michael, and Tscheligi, Manfred. 2009. “Semantically structured tag clouds: An empirical evaluation of clustered presentation approaches." In Proceedings of the 27th international conference on Human factors in computing systems, 2037-2040. 

  23. Shepitsen, Andriy, Janathan, Gemmell, Bamshad, Mobasher, and Robin, Burke. 2008. “Personalized recommendation in social tagging systems using hierarchical clustering." In Proceedings of the 2008 ACM conference on Recommender systems, 259-266. 

  24. Simpson, Edwin. 2008. Clustering Tags in Enterprise and Web Folksonomies. [online]. [cited 2009.7.13]. . 

  25. Sneath, P. H. A., and Sokal, R. R. 1973. Numerical Taxonomy. SF: Freeman. 

  26. Strehl, Alexander, Joydeep, Ghosh, and Raymond, Mooney. 2000. “Impact of similarity measures on web-page clustering." In Proceedings of the 17th National Conference on Artificial Intelligence: Workshop of Artificial Intelligence for Web Search(AAAI 2000), 58-64. 

  27. Tombros, Anastasios. 2002. The Effects of Query-based Hierarchical Clustering of Documents for Information Retrieval. Ph.D. diss., Department of Computer Science, Cornell University. 

  28. Voorhees, Ellen M. 1985. “The cluster hypothesis revisited." In Proceedings of the 8th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 188-196. 

  29. Ward, Joe H. 1963. “Hierarchical grouping to optimize an objective function." Journal of the American Statistical Association, 58: 236-244. 

  30. Weeds, J. E. 2003. Measures and Applications of Lexical Distributional Similarity. Ph. D. diss., University of Sussex. 

  31. Willet, Peter. 1988. “Recent trends in hierarchic document clustering: a critical review." Information Processing and Management, 24(5): 577-597. 

  32. Xu, Rui, and Wunsch II, Donald C. 2009. Clustering. NJ: IEEE Press. 

  33. Yi, Kwan. 2009. “Mining semantically similar tags from delicious." Journal of the Korean Society for Information Science, 26(2): 127-147. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로