시스템의 동작특성을 표현하는 퍼지 규칙들은 퍼지 클러스터링 기법에 매우 의존적이다. 만약, 클러스터링 기법의 분류 능력이 개선된다면, 그들에 의해 생성되는 퍼지 규칙과 식별되는 파라미터들이 보다 정밀해 질 수 있으므로 시스템의 성능이 개선될 수 있다. 따라서 본 논문에서는 분류능력이 강화된 새로운 계층 구조클러스터링 알고리즘을 제안한다. 제안된 클러스터링 기법은 데이터 사이의 통계적 특성과 상관성을 고려하여 보다 정확하게 데이터들을 분류할 수 있도록 2개의 클러스터의 구조를 갖는다. 또한, 본 논문은 차분 데이터를 이용하여 원형 데이터의 패턴이나 규칙들이 명확하게 반영될 수 있도록 하며, 각각의 차분 데이터들의 다양한 특성을 고려할 수 있도록 다중 퍼지 시스템을 구현한다. 마지막으로, 제안된 기법들의 유효성을 다양한 비선형 시계열 데이터들의 예측을 통해 검증한다.
시스템의 동작특성을 표현하는 퍼지 규칙들은 퍼지 클러스터링 기법에 매우 의존적이다. 만약, 클러스터링 기법의 분류 능력이 개선된다면, 그들에 의해 생성되는 퍼지 규칙과 식별되는 파라미터들이 보다 정밀해 질 수 있으므로 시스템의 성능이 개선될 수 있다. 따라서 본 논문에서는 분류능력이 강화된 새로운 계층 구조 클러스터링 알고리즘을 제안한다. 제안된 클러스터링 기법은 데이터 사이의 통계적 특성과 상관성을 고려하여 보다 정확하게 데이터들을 분류할 수 있도록 2개의 클러스터의 구조를 갖는다. 또한, 본 논문은 차분 데이터를 이용하여 원형 데이터의 패턴이나 규칙들이 명확하게 반영될 수 있도록 하며, 각각의 차분 데이터들의 다양한 특성을 고려할 수 있도록 다중 퍼지 시스템을 구현한다. 마지막으로, 제안된 기법들의 유효성을 다양한 비선형 시계열 데이터들의 예측을 통해 검증한다.
Fuzzy rules, which represent the behavior of their system, are sensitive to fuzzy clustering techniques. If the classification abilities of such clustering techniques are improved, their systems can work for the purpose more accurately because the capabilities of the fuzzy rules and parameters are e...
Fuzzy rules, which represent the behavior of their system, are sensitive to fuzzy clustering techniques. If the classification abilities of such clustering techniques are improved, their systems can work for the purpose more accurately because the capabilities of the fuzzy rules and parameters are enhanced by the clustering techniques. Thus, this paper proposes a new hierarchically structured clustering algorithm that can enhance the classification abilities. The proposed clustering technique consists of two clusters based on correlationship and statistical characteristics between data, which can perform classification more accurately. In addition, this paper uses difference data sets to reflect the patterns and regularities of the original data clearly, and constructs multiple fuzzy systems to consider various characteristics of the differences suitably. To verify effectiveness of the proposed techniques, this paper applies the constructed fuzzy systems to the field of time series prediction, and performs prediction for nonlinear time series examples.
Fuzzy rules, which represent the behavior of their system, are sensitive to fuzzy clustering techniques. If the classification abilities of such clustering techniques are improved, their systems can work for the purpose more accurately because the capabilities of the fuzzy rules and parameters are enhanced by the clustering techniques. Thus, this paper proposes a new hierarchically structured clustering algorithm that can enhance the classification abilities. The proposed clustering technique consists of two clusters based on correlationship and statistical characteristics between data, which can perform classification more accurately. In addition, this paper uses difference data sets to reflect the patterns and regularities of the original data clearly, and constructs multiple fuzzy systems to consider various characteristics of the differences suitably. To verify effectiveness of the proposed techniques, this paper applies the constructed fuzzy systems to the field of time series prediction, and performs prediction for nonlinear time series examples.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
하지만, 강한 비선형성을 갖는 데이터들을 효과적으로 분류하고, 그들의 특성을 충분히 고려할 수 있는 시스템을 설계할 경우, 시스템의 구조적 복잡성이 초래되며, 이는 퍼지 시스템의 모델링 분야에 많은 제약점들을 야기 시킨다. 따라서 본 논문에서는 비선형 데이터를 처리하는 퍼지 시스템의 모델링에 있어, 구조적 복잡성을 피하면서 효과적인 클러스터링 기법을 제안하며, 이에 따라 생성되는 퍼지 규칙과 추정되는 파라미터들의 적합성을 개선함으로써 우수한 성능의 퍼지 시스템을 모델링하는 기법을 제안하였다. 또한, 비선형 데이터를 보다 명확히 시스템에 반영시키기 위해 데이터의 원형이 아닌 그들의 차분 데이터를 활용하는 기법을 제안하였다.
기존의 다중모델을 이용한 논문[5-6]들은 우수한 예측성능을 보였지만, 3개의 입력데이터와 5개의 퍼지집합으로 인한 많은 수의 퍼지 규칙이 생성되었고, 이로 인해 규칙의 생성이나 파라미터 추정과정의 복잡성이 야기 되었다. 본 논문에서는 최소의 퍼지 규칙을 생성하면서도 효율적으로 시스템을 설계하기 위해 계층 구조 클러스터링 알고리즘을 제시하며 이를 통해 적은 수의 퍼지규칙 생성만으로 우수한 예측이 가능할 수 있도록 하였다. 본 논문에 제시된 클러스터링 기법은 상위 층의 클러스터들과 하위 층의 퍼지 집합으로 구성된다.
제안 방법
본 논문에서는 계층적 분류구조를 가지는 다중 퍼지 시스템의 설계 방법을 다루었으며, 설계된 시스템을 시계열 예측 분야에 적용하였다. 1차적으로 원형 데이터의 특성을 충분히 고려할 수 있는 시스템의 설계를 위해 원형데이터의 차분 데이터를 사용하였고 이를 이용하여 다중 퍼지 시스템을 설계하여 다양한 패턴이나 규칙성을 최대한 고려할 수 있도록 하였다. 또한, 구현되는 시스템들이 보다 데이터의 특성을 잘 반영하며 동작할 수 있도록 하기 위해 계층 구조 클러스터링 알고리즘을 적용하였다.
이렇게 상관 클러스터링에 의해 각각의 상위 클러스터에 데이터가 분류되면, 분류된 데이터 쌍들은 다시 k-means 클러스터링에 의해 하위 퍼지 집합으로 분할된다. 각각의 상위 클러스터 내의 데이터 중 최소값과 최대값 사이를 퍼지분할의 전체 영역으로 정의하고 kmeans 클러스터링 방법을 적용하여 그림 2와 같이 NA ,PO로 분할하였으며, 멤버쉽 함수로는 사다리꼴 맴버쉽 함수를 사용하였다. 또한, 그림 2와 같이 각각의 입력데이터 dm(i)t가 퍼지 집합에 소속되는 정도는 다음과 같이 정의 된다.
따라서 일부의 차분 데이터를 추출하여 사용하여야 하지만 추출된 차분데이터들이 다른 차분 데이터들 보다 원형 데이터의 특성을 잘 반영할 수 있는지는 경험에 기반 될 수밖에 없다. 따라서 이러한 문제의 해결 방법으로 본 논문에서는 데이터의 전처리 과정을 통해 일부의 최적 차분 데이터들만을 추출할 수 있도록 하여 사용하였으며, 각각의 차분 데이터들의 특성을 적절히 반영하기 위해 다중 퍼지 시스템을 구현하였다. 또한, 서론에서도 언급되었듯이 각각의 퍼지 시스템에는 계층구조 클러스터링 알고리즘을 적용하여 TSK 퍼지 모델의 전반부 규칙과 후반부 파라미터가 데이터에 최적화 될 수 있도록 하였다.
제안된 퍼지 시스템은 먼저 통계적 특성이 원형 데이터 보단 안정된 차분 데이터들을 생성하고 [4-6] 상관 분석을 통해 원형 데이터의 특성을 잘 드러낼 수 있는 차분 데이터 후보군을 선별하게 된다. 또한, TSK 퍼지 모델을 이용하여 차분들의 특성을 최대한 고려할 수 있도록 다중 퍼지 예측 시스템을 구현하고, 선별된 차분 데이터들을 그들에 상응하는 다중 퍼지 시스템의 각각의 입력으로 사용하였다. 다중 퍼지 시스템 내에서 퍼지 규칙생성을 위한 퍼지 분할에는 계층 구조 클러스터링 알고리즘(HSCA : Hierarchically structured clustering algorithm)을 적용하여 시스템의 정밀성을 높일 수 있도록 하였다.
1차적으로 원형 데이터의 특성을 충분히 고려할 수 있는 시스템의 설계를 위해 원형데이터의 차분 데이터를 사용하였고 이를 이용하여 다중 퍼지 시스템을 설계하여 다양한 패턴이나 규칙성을 최대한 고려할 수 있도록 하였다. 또한, 구현되는 시스템들이 보다 데이터의 특성을 잘 반영하며 동작할 수 있도록 하기 위해 계층 구조 클러스터링 알고리즘을 적용하였다. 계층 구조 클러스터링 알고리즘은 각각의 퍼지 시스템의 규칙기반의 형태를 보다 데이터의 특성에 적합하게 생성되도록 하여 시스템의 성능에 중요한 요소인 퍼지 규칙의 수를 최소화 하면서도 우수한 성능을 보이는 시스템 설계를 가능하게 하였으며, 시계열 예측에 대한 시뮬레이션 결과 비선형 데이터의 이면에 내재된 다양한 특성들을 잘 반영할 수 있어 충분히 좋은 결과를 나타내었다.
따라서 본 논문에서는 비선형 데이터를 처리하는 퍼지 시스템의 모델링에 있어, 구조적 복잡성을 피하면서 효과적인 클러스터링 기법을 제안하며, 이에 따라 생성되는 퍼지 규칙과 추정되는 파라미터들의 적합성을 개선함으로써 우수한 성능의 퍼지 시스템을 모델링하는 기법을 제안하였다. 또한, 비선형 데이터를 보다 명확히 시스템에 반영시키기 위해 데이터의 원형이 아닌 그들의 차분 데이터를 활용하는 기법을 제안하였다. 제안된 퍼지 시스템은 먼저 통계적 특성이 원형 데이터 보단 안정된 차분 데이터들을 생성하고 [4-6] 상관 분석을 통해 원형 데이터의 특성을 잘 드러낼 수 있는 차분 데이터 후보군을 선별하게 된다.
따라서 이러한 문제의 해결 방법으로 본 논문에서는 데이터의 전처리 과정을 통해 일부의 최적 차분 데이터들만을 추출할 수 있도록 하여 사용하였으며, 각각의 차분 데이터들의 특성을 적절히 반영하기 위해 다중 퍼지 시스템을 구현하였다. 또한, 서론에서도 언급되었듯이 각각의 퍼지 시스템에는 계층구조 클러스터링 알고리즘을 적용하여 TSK 퍼지 모델의 전반부 규칙과 후반부 파라미터가 데이터에 최적화 될 수 있도록 하였다. 아래의 그림 1은 제안된 시스템의 전체 순서도를 보여 준다.
제안된 시스템의 성능을 검증하기 위하여 2개의 다른 특성을 보이는 데이터를 이용하였으며, 본문에 언급되었듯이, 상위 클러스터의 수를 2개, 하위 퍼지집합의 수도 2개로 하여 최대 생성 규칙이 16개 이하가 되도록 하여, 보다 적은 규칙에서도 좋은 성능의 예측이 가능함을 보였다. 또한, 성능 평가는 다른 논문들에서 제안된 방법들과의 비교를 위해 같은 길이의 훈련구간과 예측구간을 정의하여 시뮬레이션 하였다.
본 논문에서는 최소의 퍼지 규칙을 생성하면서도 효율적으로 시스템을 설계하기 위해 계층 구조 클러스터링 알고리즘을 제시하며 이를 통해 적은 수의 퍼지규칙 생성만으로 우수한 예측이 가능할 수 있도록 하였다. 본 논문에 제시된 클러스터링 기법은 상위 층의 클러스터들과 하위 층의 퍼지 집합으로 구성된다. 각각의 상위 클러스터들은 crisp한 집합으로 구분하며, 이들 각각은 그들의 퍼지집합으로 구성된다.
본 논문에서는 계층적 분류구조를 가지는 다중 퍼지 시스템의 설계 방법을 다루었으며, 설계된 시스템을 시계열 예측 분야에 적용하였다. 1차적으로 원형 데이터의 특성을 충분히 고려할 수 있는 시스템의 설계를 위해 원형데이터의 차분 데이터를 사용하였고 이를 이용하여 다중 퍼지 시스템을 설계하여 다양한 패턴이나 규칙성을 최대한 고려할 수 있도록 하였다.
본 논문에서는 비교적 적은 입력과 퍼지 분할로 적합한 언어적 규칙 기반을 구현할 수 있으며, 후반부 선형식을 통해 고전 선형 회귀 모델의 이점도 취할 수 있는 TSK 퍼지 모델을 이용하여 다중 퍼지 시스템을 설계 하였다. TSK 퍼지 모델의 언어적 규칙의 일반식은 다음과 같이 정의 된다.
본 논문에서는 입력데이터쌍이 만족하는 규칙만을 생성하고, 규칙 생성과정에서 중복되는 규칙은 삭제하면서 퍼지 규칙을 생성하므로 하나의 퍼지 시스템의 규칙기반을 이루는 퍼지 규칙의 수는 16개 이하가 된다.
상위 층의 클러스터로의 데이터 분류를 위해선 교차상관 클러스터링 알고리즘을 적용하였으며 다음과 같이 수행되었다. 먼저, 2개의 임의의 상위 클러스터 중심 #가 [#]이라면, 두 개의 클러스터에 분류되는 데이터에 대한 적합도는 다음과 같이 교차상관 함수에 의해 판별된다.
각각의 상위 클러스터들은 crisp한 집합으로 구분하며, 이들 각각은 그들의 퍼지집합으로 구성된다. 상위 클러스터에 분류되는 데이터들은 각각의 클러스터 중심과 입력 데이터들의 상관성을 분석하여 상관성이 높은 클러스터 쪽으로 데이터들이 분류되도록 하였다. 따라서 각각의 상위 클러스터에 분류된 데이터들은 서로간의 상관성이 높을 것이며, 이는 상위 클러스터내의 하위 퍼지집합의 수를 최소한으로 구성하여도 적합한 규칙의 생성이 가능하도록 할 것이다.
시스템의 설계에 사용할 최적 차분 데이터를 선별하기 위하여 먼저, 주어진 시계열 데이터 중 예측 모델을 구성하는데 어려움이 없을 정도의 적정 길이의 데이터를 훈련 데이터로 선정한 후 다음의 과정을 통해 최적 차분 후보군을 선별한다.
구현된 다중 퍼지 시스템이 모델링 과정에서 뿐만 아니라 실제 동작 과정에서 전부 동작된다면 연산의 과정에 있어 상당한 부담이 생길 것이다. 이러한 부담을 줄이기 위해 본 논문에서는 다중 퍼지 시스템들을 훈련데이터를 통해 동작한 후, 성능평가 지수를 가장 잘 만족하는 하나의 시스템만을 실제 동작에 적용함으로써 문제를 해결할 수 있도록 하였다. 이는 훈련 구간의 평균 동작이 가장 우수하였으므로 선택된 퍼지 시스템이 가장 우수한 성능을 나타내는 것으로 간주할 수 있기 때문이다.
또한, 비선형 데이터를 보다 명확히 시스템에 반영시키기 위해 데이터의 원형이 아닌 그들의 차분 데이터를 활용하는 기법을 제안하였다. 제안된 퍼지 시스템은 먼저 통계적 특성이 원형 데이터 보단 안정된 차분 데이터들을 생성하고 [4-6] 상관 분석을 통해 원형 데이터의 특성을 잘 드러낼 수 있는 차분 데이터 후보군을 선별하게 된다. 또한, TSK 퍼지 모델을 이용하여 차분들의 특성을 최대한 고려할 수 있도록 다중 퍼지 예측 시스템을 구현하고, 선별된 차분 데이터들을 그들에 상응하는 다중 퍼지 시스템의 각각의 입력으로 사용하였다.
대상 데이터
두 번째 시뮬레이션 데이터는 혼돈 비선형 시계열 예측에 자주 이용되는 Mackey-Glass 시계열 데이터로 다음과 같이 정의되는 수식으로부터 발생된다.
시뮬레이션에 사용된 데이터는 x(124)부터 x(1123)까지 1000개의 데이터를 추출하여 사용하였으며, 그 중에 500개의 데이터를 훈련데이터로, 나머지데이터를 성능비교를 위한 예측 데이터로 사용하였다. 아래의 그림 5는 상위 3개의 우수한 예측 성능을 보이는 퍼지 시스템에 대한 2개의 상위 클러스터링 결과 이다.
첫 번째 시뮬레이션 데이터는 호주의 분기별 전력생산량 데이터로 총 155개의 데이터 중 70개를 훈련데이터로 사용하였으며, 나머지 데이터를 성능검증을 위한 예측 데이터로 사용하였다. 아래의 그림 3은 다중 퍼지 시스템들 중 성능이 우수한 3개의 시스템의 훈련구간에서의 상위 클러스터링 결과를 보여 준다.
데이터처리
따라서 퍼지 규칙 생성을 위한 퍼지 분할과 분할된 퍼지 집합에 분류된 데이터들은 그들의 상관성과 통계적 특성이 동시에 고려될 수 있기 때문에 규칙의 증가나 구조적 복잡성을 피하면서도 TSK 퍼지 모델의 전반부 규칙들과 후반부에 추정 되는 파라미터들이 데이터들에 대하여 높은 적합성을 반영할 수 있도록 함으로써 시스템의 성능이 강화될 수 있도록 하였다. 마지막으로 제안된 퍼지 시스템의 성능을 검증하기 위해 호주의 전력생산량 데이터와 Mackey-Glass 시계열 데이터를 이용하여 예측분야에 적용하였으며, 시뮬레이션 결과를 통해 제안된 시스템의 효용성을 증명 하였다.
이론/모형
또한, TSK 퍼지 모델을 이용하여 차분들의 특성을 최대한 고려할 수 있도록 다중 퍼지 예측 시스템을 구현하고, 선별된 차분 데이터들을 그들에 상응하는 다중 퍼지 시스템의 각각의 입력으로 사용하였다. 다중 퍼지 시스템 내에서 퍼지 규칙생성을 위한 퍼지 분할에는 계층 구조 클러스터링 알고리즘(HSCA : Hierarchically structured clustering algorithm)을 적용하여 시스템의 정밀성을 높일 수 있도록 하였다. 본 논문에 제안된 계층 구조 클러스터링 알고리즘은 크게 상위 층의 클러스터와 그 클러스터들 내의 하위 층의 퍼지 집합으로 구성되며, 상위 층의 클러스터에 적용된 분류 기법으로는 데이터들 상호간의 상관성 (correlationship) 을 기반으로 하는 교차상관 클러스터링 알고리즘(cross-correlation clustering algorithm)을, 하위 층의 퍼지집합에는 일반적으로 널리 쓰이는 K-평균 클러스터링 알고리즘을(k-means clustering algorithm)적용하여 구조적 복잡성을 간소화 할 수 있도록 하였다.
다중 퍼지 시스템 내에서 퍼지 규칙생성을 위한 퍼지 분할에는 계층 구조 클러스터링 알고리즘(HSCA : Hierarchically structured clustering algorithm)을 적용하여 시스템의 정밀성을 높일 수 있도록 하였다. 본 논문에 제안된 계층 구조 클러스터링 알고리즘은 크게 상위 층의 클러스터와 그 클러스터들 내의 하위 층의 퍼지 집합으로 구성되며, 상위 층의 클러스터에 적용된 분류 기법으로는 데이터들 상호간의 상관성 (correlationship) 을 기반으로 하는 교차상관 클러스터링 알고리즘(cross-correlation clustering algorithm)을, 하위 층의 퍼지집합에는 일반적으로 널리 쓰이는 K-평균 클러스터링 알고리즘을(k-means clustering algorithm)적용하여 구조적 복잡성을 간소화 할 수 있도록 하였다. 따라서 퍼지 규칙 생성을 위한 퍼지 분할과 분할된 퍼지 집합에 분류된 데이터들은 그들의 상관성과 통계적 특성이 동시에 고려될 수 있기 때문에 규칙의 증가나 구조적 복잡성을 피하면서도 TSK 퍼지 모델의 전반부 규칙들과 후반부에 추정 되는 파라미터들이 데이터들에 대하여 높은 적합성을 반영할 수 있도록 함으로써 시스템의 성능이 강화될 수 있도록 하였다.
전반부의 규칙을 생성하기 위해서는 입력공간의 퍼지 분할이 필요하며, 규칙의 출력을 위해서는 파라미터 식별이 필요하다. 본 논문은 입력공간의 퍼지 분할을 위해 계층구조 클러스터링 기법을 적용하였으며, 파라미터 추정에는 구조가 간단하면서도 효율적인 최소 자승법 (least square method)을 사용하였다. 또한, 전반부의 언어적 규칙의 표현과 후반부의 파라미터 추정을 위한 입력데이터 쌍은 기존의 논문[5-6]에서 언급된 것처럼 4개의 연속된 차분 데이터를 하나의 입력데이터 쌍으로 사용하였으며, 따라서 각각의 차분데이터들에 따라 생성될 수 있는 입력 데이터 쌍은 아래와 같다.
아래의 표 1은 상위 3개의 시스템의 성능을 비교한 것으로 3개의 시스템의 성능이 적은 수의 퍼지 규칙을 사용하여서도 비교적 모두 우수한 것으로 나타났으며, 성능비교를 위한 성능 지표로는 식 (23)으로 정의되는 MRE(mean relative error)을 사용하였다.
그림 5를 살펴보면, 상위 클러스터에 분류되는 데이터의 분포 패턴이 호주 시계열 데이터보다 좀 더 뚜렷한 경계를 기준으로 분포되어 있음을 보여주며, 이러한 결과는 상위 클러스터내의 퍼지집합들이 좀 더 데이터에 적합하게 분할될 수 있으며, 따라서 생성되는 규칙들이나 추정되는 파라미터들의 적합성이 우수할 것이다. 이러한 결과들은 아래의 표 3에 나타나 있으며, 성능 평가 지수로는 RMSE를 사용하였다.
성능/효과
또한, 구현되는 시스템들이 보다 데이터의 특성을 잘 반영하며 동작할 수 있도록 하기 위해 계층 구조 클러스터링 알고리즘을 적용하였다. 계층 구조 클러스터링 알고리즘은 각각의 퍼지 시스템의 규칙기반의 형태를 보다 데이터의 특성에 적합하게 생성되도록 하여 시스템의 성능에 중요한 요소인 퍼지 규칙의 수를 최소화 하면서도 우수한 성능을 보이는 시스템 설계를 가능하게 하였으며, 시계열 예측에 대한 시뮬레이션 결과 비선형 데이터의 이면에 내재된 다양한 특성들을 잘 반영할 수 있어 충분히 좋은 결과를 나타내었다. 따라서 본 논문에 제안된 방법들은 좀 더 복잡한 특성을 나타내는 다양한 비선형 데이터들을 다루는 여러 분야에서 정보의 추출이나, 비선형 시스템의 제어 등에 응용될 수 있을 것이다.
그림 5를 살펴보면, 상위 클러스터에 분류되는 데이터의 분포 패턴이 호주 시계열 데이터보다 좀 더 뚜렷한 경계를 기준으로 분포되어 있음을 보여주며, 이러한 결과는 상위 클러스터내의 퍼지집합들이 좀 더 데이터에 적합하게 분할될 수 있으며, 따라서 생성되는 규칙들이나 추정되는 파라미터들의 적합성이 우수할 것이다. 이러한 결과들은 아래의 표 3에 나타나 있으며, 성능 평가 지수로는 RMSE를 사용하였다.
6단계) 차 연산 값이 가장 크게 나타는 구간의 상관 계수 값을 임계치로 정의 하고, 임계치 보다 큰 상관 계수 값에 상응하는 차분 간격 값을 2차적으로 최적 차분 간격 값으로 선택한다. 따라서 최적 차분 간격 값의 개수는 적어도 6개 이상이 될 것이며, 생성되는 차분 데이터들과 구현되는 퍼지 시스템의 수 또한 6개 이상이 될 것이다. 이러한 방법은 원형 데이터의 특성을 충분히 고려 할 수 있도록 하기 위한 것이며, 각각의 차분 데이터들의 특성들 또한 충분히 고려하기 위한 것이다.
제안된 시스템의 성능을 검증하기 위하여 2개의 다른 특성을 보이는 데이터를 이용하였으며, 본문에 언급되었듯이, 상위 클러스터의 수를 2개, 하위 퍼지집합의 수도 2개로 하여 최대 생성 규칙이 16개 이하가 되도록 하여, 보다 적은 규칙에서도 좋은 성능의 예측이 가능함을 보였다. 또한, 성능 평가는 다른 논문들에서 제안된 방법들과의 비교를 위해 같은 길이의 훈련구간과 예측구간을 정의하여 시뮬레이션 하였다.
표 3과 표 4는 제안된 방식이 다른 방법들의 비해 비교적 적은 수의 규칙으로도 매우 우수한 성능으로 비선형 시계열 데이터를 예측하였음을 보여주고 있다.
표 3의 예측 결과를 보면 3개의 퍼지 시스템이 적은 수의 규칙으로도 상당히 우수한 성능을 나타냄을 알 수 있다.
표2를 살펴보면, 제안된 방식이 적은 수의 퍼지규칙으로도 다른 방법들 보다 좋은 예측성능을 보임을 알 수 있다.
후속연구
계층 구조 클러스터링 알고리즘은 각각의 퍼지 시스템의 규칙기반의 형태를 보다 데이터의 특성에 적합하게 생성되도록 하여 시스템의 성능에 중요한 요소인 퍼지 규칙의 수를 최소화 하면서도 우수한 성능을 보이는 시스템 설계를 가능하게 하였으며, 시계열 예측에 대한 시뮬레이션 결과 비선형 데이터의 이면에 내재된 다양한 특성들을 잘 반영할 수 있어 충분히 좋은 결과를 나타내었다. 따라서 본 논문에 제안된 방법들은 좀 더 복잡한 특성을 나타내는 다양한 비선형 데이터들을 다루는 여러 분야에서 정보의 추출이나, 비선형 시스템의 제어 등에 응용될 수 있을 것이다. 향후에는 다중 시스템의 운영을 적절히 할 수 있는 적응 시스템 선택방법이 연구되어야 할 것으로 생각된다.
또한, 상위 클러스터의 수를 증가하면 클러스터에 분류되는 데이터의 양이 그만큼 적어지게 되므로 이는 하위 퍼지집합의 구성에 필요한 충분한 데이터의 양을 보장 하지 못하게 될 수도 있다. 따라서 본 논문은 상위 층의 클러스터의 수를 2개로 제한하며, 또한 각각의 클러스터내의 퍼지 집합의 수도 2개로 제한한다. 따라서 하나의 상위 층 클러스터로부터 생성될 수 있는 최대 생성 규칙 수는 8개 이하가 될 것이며, 하나의 퍼지 시스템에 2개의 상위 클러스터가 존재하므로 하나의 시스템은 16개 이하의 퍼지 규칙을 가지게 된다.
1:계층구조 클러스터링)를 가지고 있다. 따라서 시스템의 동작 특성을 결정짓는 규칙의 생성을 위한 퍼지집합에 분류된 데이터들은 서로간의 연관성이 매우 클 것이며, 이는 보다 데이터의 특성에 적합한 규칙의 생성(단원 4.2:퍼지 규칙 생성)과 보다 정밀한 파라미터 추정(단원 4.3:파리미터 추정)을 가능하게 할 것이다. 또한, 마지막으로 훈련데이터를 이용하여 가장 성능이 우수한 하나의 시스템을 선택(단원 5:동작 시스템 선택)하여 동작하게 함으로써 효과적인 시스템의 운용을 가능케 할 수 있는 구조로 이루어져 있다.
따라서 하나의 상위 층 클러스터로부터 생성될 수 있는 최대 생성 규칙 수는 8개 이하가 될 것이며, 하나의 퍼지 시스템에 2개의 상위 클러스터가 존재하므로 하나의 시스템은 16개 이하의 퍼지 규칙을 가지게 된다. 비록 이러한 방법에 의해 생성되는 퍼지 규칙 수는 적을 수 있으나 데이터의 2중분류 구조를 통해 하위 퍼지집합에 분류된 데이터들은 그들 간의 상관성과 통계적 특성이 모두 고려될 수 있으므로 적합한 퍼지규칙의 생성과 보다 정밀한 파라미터 추정이 가능할 것이며, 이를 통해 적은 규칙으로도 시스템의 효율적인 운영이 가능할 것이다. 아래의 그림 2는 제안된 계층 구조 클러스터링 알고리즘의 구조를 보여 준다.
따라서 본 논문에 제안된 방법들은 좀 더 복잡한 특성을 나타내는 다양한 비선형 데이터들을 다루는 여러 분야에서 정보의 추출이나, 비선형 시스템의 제어 등에 응용될 수 있을 것이다. 향후에는 다중 시스템의 운영을 적절히 할 수 있는 적응 시스템 선택방법이 연구되어야 할 것으로 생각된다.
질의응답
핵심어
질문
논문에서 추출한 답변
데이터 처리 기술이 현대사회의 고도화에 따라 더욱 복잡한 구조를 가지게 되는 이유는?
데이터 처리 기술들은 현대사회의 고도화에 따라 더욱 복잡한 구조를 가지게 되며, 이는 일반적으로 처리되어야할 데이터들이 자연현상에 기인하는 강한 비선형적 특성을 보이기 때문이다. 따라서 이러한 데이터들의 비선형적 특성들을 효과적으로 분석할 수 있다면, 그들의 처리 기술들에 대한 구조적인 복잡성이나 많은 양의 데이터를 필요로 하지 않아도 될 것이다.
데이터 이면에 내재된 다양한 비선형적 특성들은 데이터가 가지는 일련의 패턴들이나 규칙성으로 대표될 수 있으며, 이러한 패턴들을 찾기 위해 많이 사용되는 기법은?
따라서 이러한 데이터들의 비선형적 특성들을 효과적으로 분석할 수 있다면, 그들의 처리 기술들에 대한 구조적인 복잡성이나 많은 양의 데이터를 필요로 하지 않아도 될 것이다. 데이터 이면에 내재된 다양한 비선형적 특성들은 데이터가 가지는 일련의 패턴들이나 규칙성으로 대표될 수 있으며, 이러한 패턴들을 찾기 위해 많이 사용되는 기법이 퍼지 클러스터링 기법이다. 이러한 퍼지 클러스터링 기법들은 유사한 데이터들을 클러스터링하고 또한, 데이터들이 클러스터에 소속되는 정도의 애매함을 퍼지 모델로 구현 가능하게 함으로써 비선형 데이터를 다루는 분야에 광범위하게 적용되어 왔다 [1-3].
TSK 퍼지 모델은 전반부의 규칙을 생성하기 위해 무엇이 필요한가?
TSK 퍼지 모델은 언어적 규칙을 표현하는 전반부와 규칙에 따른 동작을 제어하는 후반부로 구성되어 있다. 전반부의 규칙을 생성하기 위해서는 입력공간의 퍼지 분할이 필요하며, 규칙의 출력을 위해서는 파라미터 식별이 필요하다. 본 논문은 입력공간의 퍼지 분할을 위해 계층구조 클러스터링 기법을 적용하였으며, 파라미터 추정에는 구조가 간단하면서도 효율적인 최소 자승법 (least square method)을 사용하였다.
참고문헌 (10)
Stephen J. Redmond, Conor Heneghan, 'A method for initialising the K-means clustering algorithm using kd-trees', pattern recognition letters, vol.28, pp. 965-973, 2007
K.Ozawa, T.Niimura, 'Fuzzy Time-Series Model of Electric Power Consumption', IEEE Canadian conference on Electrical and Computer Engineering, pp.1195-1198, 1999
Juhong Nie, 'Nonlinear Time-Series Forecasting: A Fuzzy Neural Approach', Neuro computing, vol.16, pp.66-76, MacMaster University, 1997
Inteak Kim, Song-Rock Lee, 'A Fuzzy Time Series Prediction Method based on Consecutive Values', 1999 IEEE International Fuzzy Systems conference proceedings, vol.2, pp.703-707, 1999
Chul-Heui Lee, Sang-Hun Yoon, 'Fuzzy Nonlinear Time Series Forecasting with Data Preprocessing and Model Selection', Joural of Telecommunications and Information, vol.5, pp.232-238, 2001
Young-Keun Bang, Chul-Heui Lee 'Fuzzy Time Series prediction with Data Preprocessing and Error Compensation Based on Correlation Analysis', International Conference on Convergence and Hybrid Information Technology, vol.2, pp.714-721, 2008
Daijin Kim, Chulhyun Kim, 'Forecasting Time Series with Genetic Fuzzy Predictor Ensemble'. IEEE Trans. on Fuzzy Systems, vol. 5, pp.523-535, 1997
주용석, 유전알고리즘과 러프집합을 이용한 퍼지 시스템 모델링, 강원대학교 석사학위논문, 2003
L. X. Wang, J. M. Mendel, 'Generating fuzzy rules from numerical data, with applications', IEEE Trans. on Systems, Man, and Cybern, 22 No.6, pp1414-1427, 1992
※ AI-Helper는 부적절한 답변을 할 수 있습니다.