최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기한국산업정보학회논문지 = Journal of the Korea Industrial Information Systems Research, v.17 no.2, 2012년, pp.57 - 64
이정송 (전북대학교 컴퓨터공학부) , 박순철 (전북대학교 컴퓨터공학부)
In this paper, the multi-objective genetic algorithm is proposed for the document clustering which is important in the text mining field. The most important function in the document clustering algorithm is to group the similar documents in a corpus. So far, the k-means clustering and genetic algorit...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
클러스터링이란? | 클러스터링이란 대량의 데이터들을 의미 있는 그룹으로 분류하는 것을 의미한다. 클러스터링에서 문서 클러스터링은 정보 검색 분야에 중요한 부분을 차지하고 있다. | |
가장 일반적인 문서 클러스터링 알고리즘에는 무엇이 있나? | 문서 클러스터링은 사용자가 원하는 정보를 포함하고 있는 문서를 탐색하는데 소비되는 시간을 절약하며 검색 효율성을 높일 수가 있다[2]. 가장 일반적인 문서 클러스터링 알고리즘에는 k-means 클러스터링[3]과 유전자 알고리즘(Genetic Al gorithm)[4] 등이 있다. | |
k-means 클러스터링의 단점은? | k-means 클러스터링은 클러스터링 문제를 해결하는 가장 간단한 알고리즘 중 하나로 구현의 용이성과 우수한 시간 효율성으로 문서 클러스터링에 많이 적용되고 있다. 하지만 초기 클러스터 중심에 따라 성능차가 커진다는 문제점을 가지고 있다. |
W. B. Croft, D. Metzler and T. Strohman, Search Engines Information Retrieval in Practice, Addison Wesley, 2009.
정영미, 정보 검색 연구, 구미무역, 2005.
J. B. MacQueen, "Some Methods for classification and Analysis of Multivariate Observation", Proc. 5th Berkeley Symp, vol. 1, pp. 281-297, 1967.
W. Song and S.C Park, "Genetic algorithm for text clustering based on latent semantic indexing", Computers & Mathematics with Applications, vol. 57, pp.1901-1907, 2009.
A. Osyczka, Multicriteria Optimization for Engineering Design, New York Academic Press, 1985.
Censor. Y, "Pareto Optimality in Multiobjective Problems", Applied Mathematics & Optimization, vol. 4, pp. 41-59, 1977.
김갑환, 조정복, 고창성, 네트워크 모델과 다목적 GA, 한산, 2010.
K. Deb, A. Pratap, S. Agarwal, and T. Meyarivan, "A Fast Elitist Multiobjective Genetic algorithm: NSGA-II", IEEE Transaction on Evolutionary Computation, vol. 6, no. 2, pp. 182-197, 2002.
박순규, 이수복, 이원철, "다목적 최적화를 위한 Goal-Pareto 기반의 NSGA-II 알고리즘", 한국통신학회논문지, 제32권, 11호, pp. 1079-1085, 2007.
최임천, 최경웅, 박순철, "An Automatic Semantic Term-Network Constriction System", Computer Science and its Applications, pp. 48-51, 2009
T. Calinski, and J. Harabasz, "A Dendrite Method for Cluster Analysis", Communications in Statistics, vol. 3, no. 1, 1974.
D. L. Davies and D. W. Bouldin, "A Cluster Separation measure", IEEE transactions on Pattern analysis and Machine Intelligene, vol. 1, no. 2, 1979.
문병로, 쉽게 배우는 유전 알고리즘-진화적 접근법, 한빛미디어, 2008.
D. Fragoudis, D. Meretakis, and S. Likothanassi, "Best terms: an efficient feature-selection algorithm for text categorization", Knowledge and Information, vol. 8, pp. 16-33, 2005.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.