$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

AutoEncoder와 FCM을 이용한 불완전한 데이터의 군집화
Clustering of Incomplete Data Using Autoencoder and fuzzy c-Means Algorithm 원문보기

한국통신학회논문지. The Journal of Korea Information and Communications Society. 통신이론 및 시스템, v.29 no.5C, 2004년, pp.700 - 705  

박동철 (명지대학교 정보공학과) ,  장병근 (명지대학교 정보공학과)

초록
AI-Helper 아이콘AI-Helper

Autoencoder와 Fuzzy c-Means 알고리즘을 이용하여, 불완전한 데이터의 군집화를 위한 알고리즘이 본 논문에서 제안되었다. 본 논문에서 제안된 Optimal Completion Autoencoder Fuzzy c-Means (OCAEFCM)은 손상되어 불완전한 데이터의 최적 복원과 데이터의 군집화를 위해 Autoencoder Neural Network (AENN) 과 Gradient-based FCM (GBFCM)을 이용하였다. OCAEFCM 의 성능평가를 위해 IRIS 데이터와 금융기관에서 취득한 실제 데이터를 사용하였다 기존의 Optimal Completion Strategy FCM (OCSFCM)과 비교했을 때, 제안된 OCAEFCM 이 OCSFCM 보다 18%-20%의 성능 향상을 보여준다.

Abstract AI-Helper 아이콘AI-Helper

Clustering of incomplete data using the Autoencoder and the Fuzzy c-Means(PCM) is proposed in this paper. The Proposed algorithm, called Optimal Completion Autoencoder Fuzzy c-Means(OCAEFCM), utilizes the Autoencoder Neural Network (AENN) and the Gradiant-based FCM (GBFCM) for optimal completion of ...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 이러한 불완전한 데이터에서 손실된 데이터의 값을 추정하고 군집화 시키는 것에 대한 연구가 1962년부터 시작되었으며, Jainm과 Dub 瞬에 의해 정리되었다[1-3]. Hathaway와 Bezdeke Fuzzy C-Means (FCM) 의 변형된 형태인 Optimal Completion Strategy FCM (OCSFCM)을 제안하고 불완전한 데이터의 손실된 값들을 추정하는 방법에 대해 연구하였다[4]. 그러나, 이 OCSFCMe 완전한 원본 데이터에 대한 군집 중심값의 정보를 초기에 필요로 하기 때문에, 실제 원본 데이터를 알지 못한다면 불완전한 데이터를 군집화 시킬 수 없다.
  • 그러나, 이 OCSFCMe 완전한 원본 데이터에 대한 군집 중심값의 정보를 초기에 필요로 하기 때문에, 실제 원본 데이터를 알지 못한다면 불완전한 데이터를 군집화 시킬 수 없다. 따라서, 본 논문에서는 원본 데이터를 모르는 상황에서 불완전한 데이터를 군집화 시키는 방법에 대해 제안한다. 본 논문에서 제안되는 알고리즘은 Autoencoder Neural Network (AENN) 을 사용하여 불완전한 데이터의 손실부분을 추정하고 그 결과를 Gradient-Based FCM (GBFCM) 에 인가하여 군집화를 수행한다.
  • 본 논문에서는 GBFCM의 군집화 과정과 학습된 AENN를 이용한 손실된 데이터 추정/복원 과정을 조합하여 불완전한 데이터를 군집화 시키는 알고리즘을 제안한다. AENN의 학습된 가중치를 이용하여 손실된 데이터를 추정/복원한 후에 GBFCM의 군집화 과정을 통해 군집 중심값을 구하는데, 이것은 완전히 AENN의 추정/복원 과정이 종료된 후에만 데이터의 군집화를 수행할 수 있다.
  • 이는 실제로 완전한 원본 데이터에 대한 군집 중심값의 정보를 알지 못하는 상황에서는 불가능하기 때문에, 본 논문에서는 AENN의 학습을 통해 손실된 데이터를 원본 데이터로 추정/복원시키는 방법을 제안한다[9].
  • 않는다. 이러한 OCSFCM의 문제점을 해결하기 위하여, AENN 과 FCM 알고리즘을 이용하여, 불완전한 데이터의 군집화를 위한 알고리즘이 본 논문에서 제안되었다. 본 논문에서 제안된 OCAEFCMe AENN의 불완전한 데이터 복원 능력과 GBFCM의 군집화 능력을 적절히 이용하였다.

가설 설정

  • , "의 값을 최소화시키기 위한 조건에 손실된 특징값들을 변수로 하는 새로운 조건을 더하여 목적 함수 Jm을 최소화시킴으로서 최종적으로 손실된 부분을 원본의 값으로 추정/복원시킨다. 즉, OCSFCMe 먼저 전체 데이터가 손실된 데이터가 없다는 것을 가정하고 전체 데이터에 FCM을 사용하여 각 군집의 중심값을 구한다. 구해진 군집의 중심값을 이용하여, 불완전한 데이터의 손실된 특징값을 초기화시키고 반복적으로 FCM을 이용해 손실된 데이터 X 貞 j번째 특징값 X 航을 다음의 식으로 구하는 과정을 추가하여 손실된 데이터를 복원시키고 최적화된 데이터의 군집 중심값을 구하는 것이다{4].
본문요약 정보가 도움이 되었나요?

저자의 다른 논문 :

관련 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로