FCM 클러스터링 알고리즘은 대표적인 분할기반 군집화 알고리즘이며 다양한 분야에서 성공적으로 적용되어 왔다. 그러나 FCM 클러스터링 알고리즘은 잡음 및 지역 데이터에 대한 높은 민감도, 직관적인 결과와 상이한 결과 도출 가능성이 높은 문제, 초기 원형과 클러스터 개수 설정 문제 등이 존재한다. 본 논문에서는 FCM 알고리즘의 결과를 해당 속성의 데이터 축에 사상하여 퍼지구간을 결정하고, 결정된 퍼지구간을 FDT에 적용함으로써 FCM 알고리즘이 가지는 문제 중 잡음 및 데이터에 대한 높은 민감도, 직관적인 결과와 상이한 결과 도출 가능성이 높은 문제를 개선하는 시스템을 제안한다. 또한 실제 교통데이터와 강수량 데이터를 이용한 실험을 통하여 제안 모델과 FCM 클러스터링 알고리즘을 비교한다. 실험 결과를 통해 제안 모델은 잡음 및 데이터에 대한 민감도를 완화시킴으로써 보다 안정적인 결과를 제공하며, FCM 클러스터링 알고리즘을 적용한 시스템보다 직관적인 결과와의 일치율을 높여줌을 알 수 있다.
FCM 클러스터링 알고리즘은 대표적인 분할기반 군집화 알고리즘이며 다양한 분야에서 성공적으로 적용되어 왔다. 그러나 FCM 클러스터링 알고리즘은 잡음 및 지역 데이터에 대한 높은 민감도, 직관적인 결과와 상이한 결과 도출 가능성이 높은 문제, 초기 원형과 클러스터 개수 설정 문제 등이 존재한다. 본 논문에서는 FCM 알고리즘의 결과를 해당 속성의 데이터 축에 사상하여 퍼지구간을 결정하고, 결정된 퍼지구간을 FDT에 적용함으로써 FCM 알고리즘이 가지는 문제 중 잡음 및 데이터에 대한 높은 민감도, 직관적인 결과와 상이한 결과 도출 가능성이 높은 문제를 개선하는 시스템을 제안한다. 또한 실제 교통데이터와 강수량 데이터를 이용한 실험을 통하여 제안 모델과 FCM 클러스터링 알고리즘을 비교한다. 실험 결과를 통해 제안 모델은 잡음 및 데이터에 대한 민감도를 완화시킴으로써 보다 안정적인 결과를 제공하며, FCM 클러스터링 알고리즘을 적용한 시스템보다 직관적인 결과와의 일치율을 높여줌을 알 수 있다.
FCM (Fuzzy C-Means) clustering algorithm, a typical split-based clustering algorithm, has been successfully applied to the various fields. Nonetheless, the FCM clustering algorithm has some problems, such as high sensitivity to noise and local data, the different clustering result from the intuitive...
FCM (Fuzzy C-Means) clustering algorithm, a typical split-based clustering algorithm, has been successfully applied to the various fields. Nonetheless, the FCM clustering algorithm has some problems, such as high sensitivity to noise and local data, the different clustering result from the intuitive grasp, and the setting of initial round and the number of clusters. To address these problems, in this paper, we determine fuzzy numbers which project the FCM clustering result on the axis with the specific attribute. And we propose a model that the fuzzy numbers apply to FDT (Fuzzy Decision Tree). This model improves the two problems of FCM clustering algorithm such as elevated sensitivity to data, and the difference of the clustering result from the intuitional decision. And also, this paper compares the effect of the proposed model and the result of FCM clustering algorithm through the experiment using real traffic and rainfall data. The experimental results indicate that the proposed model provides more reliable results by the sensitivity relief for data. And we can see that it has improved on the concordance of FCM clustering result with the intuitive expectation.
FCM (Fuzzy C-Means) clustering algorithm, a typical split-based clustering algorithm, has been successfully applied to the various fields. Nonetheless, the FCM clustering algorithm has some problems, such as high sensitivity to noise and local data, the different clustering result from the intuitive grasp, and the setting of initial round and the number of clusters. To address these problems, in this paper, we determine fuzzy numbers which project the FCM clustering result on the axis with the specific attribute. And we propose a model that the fuzzy numbers apply to FDT (Fuzzy Decision Tree). This model improves the two problems of FCM clustering algorithm such as elevated sensitivity to data, and the difference of the clustering result from the intuitional decision. And also, this paper compares the effect of the proposed model and the result of FCM clustering algorithm through the experiment using real traffic and rainfall data. The experimental results indicate that the proposed model provides more reliable results by the sensitivity relief for data. And we can see that it has improved on the concordance of FCM clustering result with the intuitive expectation.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 FCM 클러스터링 알고리즘을 이용하여 입력 데이터로부터 퍼지구간을 계산하고, 계산된 퍼지구간을 FDT에 적용하여 도출된 최종 분류결과를 이용하는 상황인식 정보서비스 모델을 제안하였다. 제안모델의 특징과 성능을 확인하기 위하여 실제 측정 데이터를 이용한 교통상황 예측 시스템을 구현하고, 구현된 시스템을 통하여 기존의 FCM 클러스터링만을 사용한 모델과 제안모델의 비교결과를 제시한다.
본 논문에서는 FCM 클러스터링 알고리즘을 이용하여 입력 데이터로부터 퍼지구간을 계산하고, 계산된 퍼지구간을 FDT에 적용하여 도출된 최종 분류결과를 적용한 상황인식 정보서비스 모델을 제안하였다. 제안모델의 특징과 성능을 확인하기 위하여 교통 상황 예측 시스템을 구현하고, 구현된 시스템을 통하여 기존의 FCM 클러스터링만을 사용한 모델과 제안 모델의 비교결과를 제시하였으며, 실험결과를 통해서 제안 모델이 FCM 클러스터링이 가지는 문제점인 잡음 및 지역 데이터에 대한 민감도 문제와 계산된 소속도가 직관적인 값과 일치하지 않는 경우가 발생하는 문제를 개선해 줌을 확인할 수 있었다.
이에 본 논문에서는 FCM 알고리즘의 결과를 해당 속성의 데이터 축에 사상하여 퍼지구간을 결정하고, 결정된 퍼지구간을 FDT(Fuzzy Decision Tree)에 적용함으로써 FCM 알고리즘이 가지는 문제 중 잡음 및 지역 데이터에 대한 높은 민감도, 직관적인 결과와 상이한 결과 도출 가능성이 높은 문제를 개선하는 시스템을 제안한다.
또한 FCM 클러스터링 알고리즘은 간단하고 효과적인 클러스터링 방법이지만, 구해진 소속도가 직관적인 값과 일치하지 않는 경우가 있으며[5,6], 잡음이 많은 환경에서는 정확한 소속도를 구할 수 없다는 문제점을 가진다[16]. 이에 본 논문에서는 FCM 클러스터링 알고리즘을 통하여 도출된 클러스터 영역을 특징 축으로 사상하여 퍼지구간을 결정하고, 결정된 퍼지구간을 FDT에 적용하여 데이터를 분류하는 방법을 제안한다.
제안 방법
20일간의 전체 데이터 중에서 70%인 14일은 강우기록이 있는 날이며, 30%인 6일은 강우기록이 없는 날이다. 20-Fold Cross Validation 방법을 통해 훈련을 종료한 후, 훈련에 사용된 1920건의 데이터 이외의 기간에 측정된 강우기록이 있는 날과 없는 날의 2일간의 데이터 192건을 사용하여, 강수 발생의 시점과 그 시점을 전후하여 분류된 LOS의 결과에 어떤 변화가 일어나는지를 확인하였다. 그림 3은 구현된 프로그램에서 FCM 클러스터링과 제안모델의 분류실험 화면을 보여준다.
강수량 데이터는 기상청에서 제공한 해당지역의 실제 측정 데이터를 사용하였으며, 기상청의 데이터는 1시간 단위로 제공되므로 교통량 데이터 4건당 1건으로 동일하게 적용하였다. 각 데이터의 단위는 교통량은 15분간 해당 구간을 지나간 차량의 대수, 통행시간은 해당 구간을 지나가는데 소요된 시간(분), 그리고 강수량은 시간 당 강수량(mm)를 사용하였으며, 실험 데이터는 각 데이터를 0~1 사이의 값으로 정규화 시켜서 사용하였다. 강수량의 정규화는 2004년 5월 개정된 기상법시행령(대통령령 제19555호)과 예보업무규정(기상청훈령 제 486호)에 의해 규정된 호우경보 기준인 1시간 강수량 12.
각 데이터의 단위는 교통량은 15분간 해당 구간을 지나간 차량의 대수, 통행시간은 해당 구간을 지나가는데 소요된 시간(분), 그리고 강수량은 시간 당 강수량(mm)를 사용하였으며, 실험 데이터는 각 데이터를 0~1 사이의 값으로 정규화 시켜서 사용하였다. 강수량의 정규화는 2004년 5월 개정된 기상법시행령(대통령령 제19555호)과 예보업무규정(기상청훈령 제 486호)에 의해 규정된 호우경보 기준인 1시간 강수량 12.5mm를 1로 설정하고 정규화를 수행하였다.
실험 데이터는 2011년 6월~7월 사이의 20일에 대하여 측정된 대전지역 교통량, 통행시간 및 강수량 데이터(3개 항목, 1,920건)를 사용하였고, 강수량에 대한 차량운행 속도 및 교통량의 변화를 이용하여 도로교통 서비스 수준을 평가하는 LOS를 계산하였다. 교통량과 통행시간데이터는 1일에 96건으로 15분 주기로 측정하였다. 강수량 데이터는 기상청에서 제공한 해당지역의 실제 측정 데이터를 사용하였으며, 기상청의 데이터는 1시간 단위로 제공되므로 교통량 데이터 4건당 1건으로 동일하게 적용하였다.
표 5는 FCM 클러스터링과 제안모델을 사용하여 실험한 결과를 각각 보여주고 있다. 그러나 이 표에서는 전체 비교 데이터가 아닌 주요 변화를 나타내는 일부 데이터를 제시하였으며 일련번호는 측정당일의 0시부터 24시까지를 15분 단위로 구분하여 2일간 총 192번까지 부여하였다. 통행시간/교통량 데이터는 차량 1대와 관계된 통행시간을 보여준다.
본 실험에서는 제안모델에 입력되는 상황정보로서 특정 구간에서의 교통량, 차량통행시간, 강수량을 이용하였다. 또한 강수량의 변화에 따른 LOS(Level Of Service)[17]를 제시하고, 제안모델이 제시하는 결과와 기존의 FCM 클러스터링 모델이 제시하는 결과를 비교한다.
표 4에서 LOS의 평가지표는 고속도로에서의 이상적인 조건일 때를 기준으로 측정된 것이므로 일반도로에서의 결과와는 정확하게 맞지 않으며, 평가 기준으로서의 의미를 가진다. 본 논문에서는 제안모델의 결과로 도출되는 클러스터링 등급을 설명의 편의를 위해서 LOS의 평가지표에 대응시켜서 사용하며, 등급 명은 LOS로 통일하여 사용하기로 한다. 즉 표 4에서 보듯이 LOS의 A~F등급은 제안모델의 1~6등급에 대응한다.
본 실험에서는 제안모델에 입력되는 상황정보로서 특정 구간에서의 교통량, 차량통행시간, 강수량을 이용하였다. 또한 강수량의 변화에 따른 LOS(Level Of Service)[17]를 제시하고, 제안모델이 제시하는 결과와 기존의 FCM 클러스터링 모델이 제시하는 결과를 비교한다.
상황인식 정보서비스 모델은 USN(Ubiquitous Sensor Network)의 센싱 데이터 및 측정 가능한 상황정보의 수집 및 전송을 수행하는 입력부인 Input Interface, 입력된 정보를 이용하여 분류결과를 도출하는 Context-Aware Engine, 도출된 분류결과와 기존의 제어 규칙들을 결합, 참조하여 시스템 제어 규칙을 선택, 수행하는 Control Rule Manager, 모델을 통하여 생성된 규칙과 정보를 외부 시스템으로 제공하기 위한 Output Interface로 구성된다. 상황인식 엔진에서는 Input Interface를 통하여 입력된 USN 데이터와 측정된 상황정보를 제안 모델을 이용하여 분류하고 퍼지 구간을 생성한다. 그림 2는 제안모델을 이용한 상황인식 서비스 모델의 구조를 보여준다.
본 논문에서는 FCM 클러스터링 알고리즘을 이용하여 입력 데이터로부터 퍼지구간을 계산하고, 계산된 퍼지구간을 FDT에 적용하여 도출된 최종 분류결과를 이용하는 상황인식 정보서비스 모델을 제안하였다. 제안모델의 특징과 성능을 확인하기 위하여 실제 측정 데이터를 이용한 교통상황 예측 시스템을 구현하고, 구현된 시스템을 통하여 기존의 FCM 클러스터링만을 사용한 모델과 제안모델의 비교결과를 제시한다.
대상 데이터
교통량과 통행시간데이터는 1일에 96건으로 15분 주기로 측정하였다. 강수량 데이터는 기상청에서 제공한 해당지역의 실제 측정 데이터를 사용하였으며, 기상청의 데이터는 1시간 단위로 제공되므로 교통량 데이터 4건당 1건으로 동일하게 적용하였다. 각 데이터의 단위는 교통량은 15분간 해당 구간을 지나간 차량의 대수, 통행시간은 해당 구간을 지나가는데 소요된 시간(분), 그리고 강수량은 시간 당 강수량(mm)를 사용하였으며, 실험 데이터는 각 데이터를 0~1 사이의 값으로 정규화 시켜서 사용하였다.
실험 데이터는 2011년 6월~7월 사이의 20일에 대하여 측정된 대전지역 교통량, 통행시간 및 강수량 데이터(3개 항목, 1,920건)를 사용하였고, 강수량에 대한 차량운행 속도 및 교통량의 변화를 이용하여 도로교통 서비스 수준을 평가하는 LOS를 계산하였다. 교통량과 통행시간데이터는 1일에 96건으로 15분 주기로 측정하였다.
이론/모형
실험은 전체 데이터 1920건(20일분)을 1일 단위로 나누어 총 20개의 서브셋으로 결정하고, 19개의 서브셋은 훈련데이터로, 그리고 1개의 서브셋은 실험데이터로 적용하여 총 20번간의 교차 실험을 수행하여 그 평균값을 계산하여 검증하는 20-Fold Cross Validation 방법을 적용하였다. 20일간의 전체 데이터 중에서 70%인 14일은 강우기록이 있는 날이며, 30%인 6일은 강우기록이 없는 날이다.
성능/효과
통행시간/교통량 데이터는 차량 1대와 관계된 통행시간을 보여준다. FCM 클러스터링의 결과와 제안모델의 LOS 등급은 소통이 원활할수록 1에 가까워지고 정체가 심화될수록 증가하며 최대 값은 6이다.
① FCM 클러스터링은 3번의 방향성 불일치 판정을 보였으며, 입력데이터에 대하여 직관적으로 알 수 있는 판정과 다른 결론을 도출한 데 반해, 제안 모델은 올바른 결과를 제시함에 따라 보다 안정적인 예측 결과를 도출함을 보여주었다.
② FCM 클러스터링은 입력데이터에 대하여 7번의 LOS 등급 변경을 기록하였으나, 제안 모델은 2번의 LOS 등급 변경을 기록함에 따라 제안 모델이 FCM 클러스터링에 비하여 지역적인 데이터에 대한 민감도가 완화되었음을 보여주고 있다. 즉 제안 모델은 잡음 또는 데이터의 미세한 변화에 대하여 영향을 적게 받는다는 것을 확인할 수 있었다.
마찬가지로 (82→83)에서는 통행시간은 증가하였으나 LOS는 감소한 것으로 나타남을 알 수 있다(불일치). 그러나 제안모델에서는 통행시간의 증감에 대하여 LOS 불일치가 나타나지 않음을 확인할 수 있다.
또한 표 5, 표 6의 결과 비교에서 FCM 클러스터링의 분류결과는 동일한 구간에서 총 7번의 LOS 변경이 발생하였으나 제안 모델에서는 2번의 LOS 변경이 발생하였음을 확인할 수 있는데, 이는 입력 데이터에 대하여 FCM 클러스터링 보다 제안 모델의 반응 민감도가 낮다는 것을 보여준다. 또한 제안 모델은 입력 데이터에 대한 민감도는 FCM 클러스터링 알고리즘보다 낮지만 전체적으로 안정된 형태의 결과를 보이고 있으며 올바른 결과에 더욱 가까운 결과를 제시하고 있음을 알 수 있다. 실험결과를 통해 제안모델은 FCM 클러스터링이 가지는 문제점인 잡음 및 지역 데이터에 대한 민감도 문제와 계산된 소속도가 직관적인 값과 일치하지 않는 경우가 발생하는 문제를 개선해 줌을 확인할 수 있다.
또한 표 5, 표 6의 결과 비교에서 FCM 클러스터링의 분류결과는 동일한 구간에서 총 7번의 LOS 변경이 발생하였으나 제안 모델에서는 2번의 LOS 변경이 발생하였음을 확인할 수 있는데, 이는 입력 데이터에 대하여 FCM 클러스터링 보다 제안 모델의 반응 민감도가 낮다는 것을 보여준다. 또한 제안 모델은 입력 데이터에 대한 민감도는 FCM 클러스터링 알고리즘보다 낮지만 전체적으로 안정된 형태의 결과를 보이고 있으며 올바른 결과에 더욱 가까운 결과를 제시하고 있음을 알 수 있다.
이 모델은 입력단의 영역을 변경함으로써 다양한 응용프로그램을 구성할 수 있는 프레임 워크 개념의 구조이다. 본 논문에서는 5절에서 교통 상황 예측 시스템에 응용하고 있지만 헬스케어나 제조분야 등 다양한 영역으로 적용 가능하며 또한 프레임워크의 기본 API는 재사용할 수 있다. 실제로 연구 과제 수행 중 본 논문에서 제안한 상황인식 정보 서비스 모델을 응용하여 제조업체의 POP-MES 방식의 제조장비 상태 정보를 상황정보로 입력받아 장비 피로도 및 위험도 분석에 활용하였으며 API의 70% 가량을 재활용 할 수 있었다.
본 논문에서는 5절에서 교통 상황 예측 시스템에 응용하고 있지만 헬스케어나 제조분야 등 다양한 영역으로 적용 가능하며 또한 프레임워크의 기본 API는 재사용할 수 있다. 실제로 연구 과제 수행 중 본 논문에서 제안한 상황인식 정보 서비스 모델을 응용하여 제조업체의 POP-MES 방식의 제조장비 상태 정보를 상황정보로 입력받아 장비 피로도 및 위험도 분석에 활용하였으며 API의 70% 가량을 재활용 할 수 있었다.
또한 제안 모델은 입력 데이터에 대한 민감도는 FCM 클러스터링 알고리즘보다 낮지만 전체적으로 안정된 형태의 결과를 보이고 있으며 올바른 결과에 더욱 가까운 결과를 제시하고 있음을 알 수 있다. 실험결과를 통해 제안모델은 FCM 클러스터링이 가지는 문제점인 잡음 및 지역 데이터에 대한 민감도 문제와 계산된 소속도가 직관적인 값과 일치하지 않는 경우가 발생하는 문제를 개선해 줌을 확인할 수 있다.
본 논문에서는 FCM 클러스터링 알고리즘을 이용하여 입력 데이터로부터 퍼지구간을 계산하고, 계산된 퍼지구간을 FDT에 적용하여 도출된 최종 분류결과를 적용한 상황인식 정보서비스 모델을 제안하였다. 제안모델의 특징과 성능을 확인하기 위하여 교통 상황 예측 시스템을 구현하고, 구현된 시스템을 통하여 기존의 FCM 클러스터링만을 사용한 모델과 제안 모델의 비교결과를 제시하였으며, 실험결과를 통해서 제안 모델이 FCM 클러스터링이 가지는 문제점인 잡음 및 지역 데이터에 대한 민감도 문제와 계산된 소속도가 직관적인 값과 일치하지 않는 경우가 발생하는 문제를 개선해 줌을 확인할 수 있었다.
② FCM 클러스터링은 입력데이터에 대하여 7번의 LOS 등급 변경을 기록하였으나, 제안 모델은 2번의 LOS 등급 변경을 기록함에 따라 제안 모델이 FCM 클러스터링에 비하여 지역적인 데이터에 대한 민감도가 완화되었음을 보여주고 있다. 즉 제안 모델은 잡음 또는 데이터의 미세한 변화에 대하여 영향을 적게 받는다는 것을 확인할 수 있었다.
표 4에서 제시한 LOS의 평가지표에는 강수량의 영향이 고려되지 않았으므로 평가지표의 분류내용이 실험결과와 정확히 일치하지 않지만, 통행시간의 증감과 LOS 변화의 방향성을 비교했을 때 『불일치』 판정인 경우는 잘못된 분류결과라고 판단할 수 있다. 즉 통행시간이 증가하면 LOS도 증가하고 통행 시간이 감소하면 LOS도 감소하여야 하는데 표 6을 보면 FCM 클러스터링 분류 결과는 총 3번의 방향성 『불일치』 상태가 나타나고 있지만, 제안모델에서는 2번의 등급변화 모두 방향성의 『일치』 상태를 확인할 수 있다. 표 6을 기준으로 판단할 때 FCM 클러스터링의 결과는 직관적인 판단과 일치하지 않는 경우가 존재함을 확인할 수 있으며, 제안모델의 경우 FCM 클러스터링의 결과보다 개선되었음을 알 수 있다.
표 4에서 제시한 LOS의 평가지표에는 강수량의 영향이 고려되지 않았으므로 평가지표의 분류내용이 실험결과와 정확히 일치하지 않지만, 통행시간의 증감과 LOS 변화의 방향성을 비교했을 때 『불일치』 판정인 경우는 잘못된 분류결과라고 판단할 수 있다. 즉 통행시간이 증가하면 LOS도 증가하고 통행 시간이 감소하면 LOS도 감소하여야 하는데 표 6을 보면 FCM 클러스터링 분류 결과는 총 3번의 방향성 『불일치』 상태가 나타나고 있지만, 제안모델에서는 2번의 등급변화 모두 방향성의 『일치』 상태를 확인할 수 있다.
표 5에서 제시한 데이터에서는 FCM 클러스터링의 결과에서 5번의 LOS 등급의 변화가 발생하였고, 제안 모델에서는 2번의 LOS 등급 변화가 발생하였다. 표 6은 FCM 클러스터링 결과의 LOS 등급 변화와 제안모델의 LOS 등급 변화를 보여준다.
즉 통행시간이 증가하면 LOS도 증가하고 통행 시간이 감소하면 LOS도 감소하여야 하는데 표 6을 보면 FCM 클러스터링 분류 결과는 총 3번의 방향성 『불일치』 상태가 나타나고 있지만, 제안모델에서는 2번의 등급변화 모두 방향성의 『일치』 상태를 확인할 수 있다. 표 6을 기준으로 판단할 때 FCM 클러스터링의 결과는 직관적인 판단과 일치하지 않는 경우가 존재함을 확인할 수 있으며, 제안모델의 경우 FCM 클러스터링의 결과보다 개선되었음을 알 수 있다.
후속연구
본 실험에서는 실제로 측정한 1,920개의 훈련용 데이터를 사용하였으며, 향후 보다 다양한 실험데이터를 적용할 경우 제안 모델에 대한 더욱 정확한 성능 평가가 이루어질 것으로 기대된다.
향후 연구에서는 사용자 및 상황 별로 상이한 특징을 가진 데이터의 적용이 가능한 차별화된 성능을 제공하는 시스템을 연구할 것이며, 기존의 FCM 클러스터링과 퍼지 제어 시스템이 가지는 한계를 개선할 수 있는 모델을 연구할 계획이다.
질의응답
핵심어
질문
논문에서 추출한 답변
클러스터링은 무엇인가?
클러스터링은 주어진 데이터를 미리 정해진 클래스와 비교하여 가장 근접한 클래스로 분류하는 기법이며 패턴인식, 의사결정, 데이터 분석 등에서 가장 핵심적인 작업의 하나이다. FCM 클러스터링 알고리즘은 데이터 점을 소속정도에 의해서 분류하는 퍼지 분할 기법을 사용한 데이터 분류 알고리즘이다.
상황인식 컴퓨팅을 최초로 논의한 사람은 누구인가?
상황인식 컴퓨팅이란 유비쿼터스 환경에서 임의의 애플리케이션이 사용자의 다양한 환경 요소에 대한 상황 정보(Contextual Information)를 감지하여, 사용자가 이를 이용할 수 있도록 해 주는 컴퓨팅 패러다임이다. 상황인식 컴퓨팅은 1994년 Schilit와 Theimer에 의하여 최초로 논의되었으며, Schilit와 Theimer는 상황(Context)이란 사용 장소나 주변의 사람, 사물의 집합 또는 시간이 지나면서 발생하는 변화 등을 일컫는다고 정의하였다[13]. 또한 Dey는 상황이란 엔티티의 상태를 특징지을 수 있는 모든 정보를 말하며, 여기서 엔티티란 사람, 또는 사용자와 애플리케이션 간의 의사소통에 관계되는 사물을 말한다고 정의하고 있다[14].
대표적인 군집화 알고리즘인 FCM 클러스터링 알고리즘이 가진 문제점은 무엇인가?
FCM(Fuzzy C-Means) 클러스터링 알고리즘은 1970년대에 제안된 대표적인 군집화 알고리즘이며 현재까지 다양한 분야에서 성공적으로 적용되어 왔다. 그러나 FCM 클러스터링 알고리즘은 잡음 및 지역 데이터에 대한 민감도가 높고[1-4], 계산된 소속도가 직관적인 결과와 상이한 경우가 많으며[5,6], 초기원형과 클러스터 개수 설정 문제[7,8] 등이 존재한다.
참고문헌 (17)
R.N. Dave, "Characterization and Detection of Noise in Clustering," Pattern Recognition Letters, Vol. 12, No. 11. pp. 657-664, 1991.
Y. Namkoong, G. Heo, and Y.W. Woo, "An Extension of Possibilistic Fuzzy C-Means with Regularization," Proc. of the 2010 IEEE Int'l Conf. on Fuzzy Systems, pp. 1-6, 2010.
Jacek Leski, "Towards a Robust Fuzzy Clustering," Fuzzy Sets and Systems, Vol. 137, No. 2, pp. 215-233, 2003.
Hesam Izakian and Ajith Abraham, "Fuzzy C-Means and Fuzzy Swarm for Fuzzy Clustering Problem," Expert Systems with Applications, Vol. 38, No. 3, pp. 1835-1838, 2011
김태현, 박동철, 정태경, 이윤식, 민수영, "직관적 퍼지 C-평균 모델을 이용한 자기 공명 영상분할," 전기전자학회논문지, 제15권, 제3호, pp. 191-197, 2011.
Dong-Chul Park, "Intuitive Fuzzy C-Means Algorithm," IEEE International Symposium on Signal Processing and Information Technology, pp. 83-88, 2009.
M. Garey, D. Johnson, and H. Witsenhausen, "The Complexity of the Generalized Lloyd- Max Problem," IEEE Transactions on Information Theory, Vol. 28, No. 2, pp. 255-256, 1982.
이우향, 이건명, "특징공간을 사선 분할하는 퍼지 결정트리 유도," 정보과학회논문지 : 소프트웨어 및 응용, 제29권, 제3호, pp. 156-166, 2002.
이건명, "퍼지 데이타에 대한 퍼지 결정트리 기반 분류규칙 마이닝," 정보과학회논문지 : 소프트웨어 및 응용, 제28권, 제1호, pp. 64-72, 2001.
B. Schilit, N. Adams, and R. Want, "Context- Aware Computing Applications," Proc. of the 1st International Workshop on Mobile Computing Systems and Applications, pp. 85-90, 1994.
A.K. Dey, Providing Architectural Support for Building Context-Aware Applications, Doctoral Dissertation of Georgia Institute of Technology, 2000.
양석환, 정목동, "상황인식 보안 서비스를 이용한 개선된 접근제어," 멀티미디어학회논문지, 제13권, 제1호, pp. 133-142, 2010.
허경용, 남궁영환, 김성훈, "Regularization을 이용한 Possibilistic Fuzzy C-means의 확장," 한국컴퓨터정보학회논문지, 제15권, 제1호, pp. 43- 50, 2010.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.