최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기디지털융복합연구 = Journal of digital convergence, v.12 no.12, 2014년, pp.293 - 301
In this paper, we propose a new measure based on the confidence of Bayesian posterior probability so as to reduce unimportant information in the clustering process. Because the performance of clustering is up to selecting the important degree of attributes within the databases, the concept of inform...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
데이터마이닝이란 무엇인가? | 데이터마이닝은 방대한 양의 데이터에 존재하는 관계, 패턴, 규칙과 같은 정보를 찾아내어 이를 기반으로 한 모형화(modeling)를 통하여 의사결정에 관계하는 정보로 일련의 변환과정이라고 말할 수 있다. 이는 임의의 의사결정을 위한 정보추출 과정으로써 추출된 정보는 많은 양의 데이터를 설명하는 역할을 하고 있으며 예측적 모델링과 탐색적 모델링에서 여러 가지 방법으로 사용되어 진다. | |
범주형 데이터를 처리하기 위한 알고리즘으로 제안된 것은 무엇인가? | 반면에 범주형의 데이터는 다치논리(multi-valued logic)를 가지기 때문에 속성간의 거리가 존재하지 않기 때문에 범주형 데이터를 처리하기 위한 알고리즘으로는 Expectation-Maximization, K-means 와 Fuzzy c-means 알고리즘이 제안되었다. 또한, 클러스터 해석을 기반으로 하는 알고리즘으로 MMR(min-min robustness), STIRR(sieving through iterated relational reinforcement)과 Rock(robust clustering using links) 등이 제안되었지만[4], 클러스터간의 경계가 확실하지 않기 때문에 불확실성(uncertainty)을 처리하는 데에는 어려움이 있다. | |
데이터마이닝은 어디에 사용되는가? | 데이터마이닝은 방대한 양의 데이터에 존재하는 관계, 패턴, 규칙과 같은 정보를 찾아내어 이를 기반으로 한 모형화(modeling)를 통하여 의사결정에 관계하는 정보로 일련의 변환과정이라고 말할 수 있다. 이는 임의의 의사결정을 위한 정보추출 과정으로써 추출된 정보는 많은 양의 데이터를 설명하는 역할을 하고 있으며 예측적 모델링과 탐색적 모델링에서 여러 가지 방법으로 사용되어 진다. 특히 탐색적 모델링에서는 의사결정나무(decioin tree), 회귀분석(regression analysis), 인공신경망(artificial intelligence) 과 클러스터링(clustering) 등이 있다[1]. |
Dempster A P., Laird N M., Rubin D B., Maximum likelihood from incomplete data via the EM algirithm, Journal of the Royal Statistical Society, Vol. 39, No. 1, pp. 1-38, 1977
Gibson D., Kleindeberg J., Raghvan P., Clustering categorical data: An approach based on dynamical systems, The Very Large Data Bases Journal, vol. 8, no. 3-4, pp. 222-236, 2000
Jiang D., Tang C., Zhang A., Cluster analysis for gene expression data: A survey, IEEE Transactions on Knowledge and Data Engineering, vol. 16, no. 11, pp. 1370-1386, 2004
Herawan T., Ghazali R., Yanto I., Deris M., Rough set approach for cateforical data clustering, International Journal of Database Theory and Application, vol. 3, no. 1, pp. 33-52, 2010
Kim D., Lee K., Lee D., Fussy clustering of categorical data using fuzzy centroids, Pattern Recognition Letters, vol. 25, no. 11, pp. 1263-1271, 2004
Parmar D., Wu T., Blackhurst J., MMR: An algorithm for clustering categorical data using rough set throry, Data and Knowledge Engineering, vol. 63, pp. 879-893, 2007
Sun, L., Xu, J., Xue, Z. and Zhang, L., Rough entropy-based feature selection and its application, Journal of Information and Computational Science, pp. 1525-1532, 2011
Anjana K., Study on Naive Bayesian classifier and its relaton to information gain, International Journal on Recent and Innovation Trends in Computing and Communication, vol. 2, pp. 601-603, 2014
Pawlak, Z. Rough set Theory and Its Applications to Data Analysis, Cyberdynamics and Systems: An International Journal, pp. 661-688, 1998
Tripathy B. K., Ghosh A., A SDR: An algorithm for clustering categorical data using rough set theory, Private communication at the International IEEE Conference held in Kerala, 2011
Tripathy B. K., Ghosh A., A SSDR: An algorithm for clustering categorical data using rough set theory, Advances in Applied Science Research, vol. 2, no. 3, pp. 320-324, 2011
Hassanein W. A., Elmelegy A. A., Clustering algorithm for categorical data using concepts of significance and dependence of attributes, European Scientific Jouranl, vol. 10, no. 3, pp. 381-400, 2014
Fuyuan C., Jiye L., Deyu L., Chuangyin D., A dissimility measure for the k-Modes clustering algorithm, Knowledge-Based Systems Journal, vol. 26, pp. 120-127, 2012
Tian B. Kulikowski C.A., Leiguang G., Bin Y., Lan H., Chunguang Z., Chinese Journal of Electronics, vol. 21, no. 3, pp. 460-465, 2012
Mete Ciilngirturk A., Ergut O., Hierarchical clustering with simple matching and joint entropy dissimility measure, Journal of Modern Applied Statiscal Methods, vol. 13, no. 1, pp. 329-338, 2013
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.