최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기정보관리학회지 = Journal of the Korean society for information management, v.24 no.4 = no.66, 2007년, pp.267 - 283
In this study, measures of distributional similarity such as KL-divergence are applied to cluster documents instead of traditional cosine measure, which is the most prevalent vector similarity measure for document clustering. Three variations of KL-divergence are investigated; Jansen-Shannon diverge...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
문헌 클러스터링은 어떤 기법인가? | 문헌 클러스터링은각 문헌을표현하는자질 들을 비교하여 문헌간 유사성을 측정한 다음 비슷한 내용의 문헌들을동일한 집단에 속하도록 군집화하는 기법이다(정영미 2005). 최근까지 다양한 클러스터링 기법이 제안되어왔지만, 생성된 클러스터의 품질 면에서는 계층적 클러스터링모형이가장 뛰어난 것으로 알려져 있다. | |
클러스터링 모형의 단계는 어떻게 구성되는가? | 최근까지 다양한 클러스터링 기법이 제안되어왔지만, 생성된 클러스터의 품질 면에서는 계층적 클러스터링모형이가장 뛰어난 것으로 알려져 있다. 클러스터링 모형은 대상 항목의 선정, 분류자질의 빈도행렬 작성, 유사계수의 적용, 클러스터 생성 기법의 적용 등 여러 단계로 구성된다. 각 단계마다 다양한 경우의 수가 있으므로 클러스터링결과도적용한 모형에 따라서 달라지게 된다(정영미, 이재윤2 0 0 1 ) . | |
클러스터링 모형의 각 단계마다 다양한 경우의 수가 있으므로 클러스터링 결과도 적용한 모형에 따라 어떻게 되는가? | 클러스터링 모형은 대상 항목의 선정, 분류자질의 빈도행렬 작성, 유사계수의 적용, 클러스터 생성 기법의 적용 등 여러 단계로 구성된다. 각 단계마다 다양한 경우의 수가 있으므로 클러스터링결과도적용한 모형에 따라서 달라지게 된다(정영미, 이재윤2 0 0 1 ) . |
정영미. 2005. 정보검색연구. 서울: 구미무역(주) 출판부
Griffith, A., L. A. Robinson, and P. Willett. 1984. ' Hierarchic agglomerative clustering methods for automatic document classification.' Journal of Documentation, 40(3): 175- 205
Griffiths, A., H. C. Luckhurst, and P. Willett. 1986. 'Using inter document similarity information in document retrieval systems.' Journal of the American Society for Information Science, 37(1):3-11
Kullback, Solomon. 1968. Information Theory and Statistics, 2nd ed. New York: Dover Books
Lee, Lillian. 1999. 'Measures of distributional similarity.' Proceedings of the 37th Annual
Lee, Lillian. 2001'. On the effectiveness of the skew diverg ence for statistical language analysis.' Proceedings of the Eighth International Workshop on Artificial Intelligence and Statistics (AISTATS-2001), 65-72
Lee, Lillian, and Fernando Pereira. 1999.' Distrbiutional similarity models: Clustering vs. nearest neighbors.'Proceedings of the 37th Annual Meeting of the Association for Computational Linguistics, 33-40
Lin, Dekang. 1998'. Automati cretrieval and clustering of similar words,' Proceedings of the COLINGACL '98, 768-773
Lin, Jianhua. 1991'. Divergence measuers based on the Shannon entropy.' IEEE Transactions on Information Theory, 37(1): 145-151
Pereira, Fernando, Naftali Tishby, and Lillain Lee. 1993'. Distrbiutional clustering of English words.' Proceedings of the 31st Annual Meeting of the ACL, 183-190
Salton, Gerard, and Michael J. McGill. 1983. Introduction to Modern Information Retrieval. New York: McGraw Hill
Theodoridis, S., and K. Koutroumbas. 2003. Pattern Recognition. 2nd ed. Oxford, UK:Elsever
Weeds, J. E. 2003. Measures and Applications of Lexical Distributional Similarity. Ph. D. diss., University of Sussex
White, H. D., and B. C. Griffith. 1981. Author cocitation: aliterature measure of intellectual structure.' Journal of the American Society for Information Science, 32: 163- 171
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.