[논문]다구찌 디자인을 이용한 앙상블 및 군집분석 분류 성능 비교

신형원; 손소영

문제 정의

이는 입력 변수 간에 강한 상관관계를 가지는 경우 모든 변수를 이용하지 않아도 분류 정확성을저해하지 않는 것을 의미한다. 따라서 교통량 추정, 품질 예측문제에 있어서 센서의 설치비용을 절감할 수 있는 가능성을제시한다. 이상의 결과는 기존의 경험적(empirical) 연구 중에서 앙상블 방법이 분류성능을 향상시키는 경우도 있으며 그렇지 못한 경우도 있었던 이유가 연구에 사용된 데이터의 변수간 상관관계와 분산의 정도에 따른 특징에 기인하는 것으로볼 수 있다.
그러나 이상의 다양한 앙상블 방법에 대한 연구들은 데이터의 특성을중심으로 된 것이라기 보다는 경험적(empirical) 연구의 측면이 강하다. 따라서 본 논문은 기존의 연구에서 수행된 Bagging, Variable Selection Bagging, Parameter Combining 방법과 더불어 여러 분류기 예측 결과를 융합하는 기존의 앙상블 방법과는 반대로 데이터를 특성에 따라 군집으로 나누고 각 군집별분류를 하는 Clustering 방법 의 성능을 평가하고자 한다. 분류방법에 따른 성능평가의 현실성을 높이 기 위하여 다구찌 디자인을 바탕으로 데이터로부터 성격을 파악할 수 있는 제어인자와 파악할 수 없는 비제어 인자를 동시에 고려한 시뮬레이션성능을 연구하였다.
이처럼 주어진 데이터의 특성에 따라 적절한 앙상블 또는 군집분석 방법을 선택하는 일종의 메타모형은 그 중요성에도 불구하고 연구가 많이 되어 있지 않은 상황이다. 따라서 본 연구에서는 Monte Carlo Simulation을 이용하여 데 이터의 특성을 나타내는 인자들과 앙상블, Clustering 방법 간의교호작용을 분류정확성의 관점에서 분석하고자 한다. 이를 위하여 데이터의 특성을(1) 입력변수 간의 상관관계, (2) 데이터의 분산, (3) 데이터의 크기, (4) 입출력변수 간의 함수로 나누고, (5) 분류방법(로지스틱 회귀분석, Bagging, Variable Selection Bagging, Parameter Combining, Clustering)에 따라 이진 출력값에 대한 분류정확성을 비교하였다.
본 장에서는 데이터의 특성에 비추어 예측능력이 높은 분류기법을 찾기 위한 시뮬레이 션을 시 행하였다. 시뮬레이션 데이터는 다중 정규(Multivariate Normal) 분포를 따르는 5개의 입 력변수와 이 진 값(Binary)을 가지는 출력 변수로 이 루어 져 있으며, 이들의 특성을 나타내는 실험의 인자(Factor)와 수준(Level)을 정하였다.
따라서 본 논문은 기존의 연구에서 수행된 Bagging, Variable Selection Bagging, Parameter Combining 방법과 더불어 여러 분류기 예측 결과를 융합하는 기존의 앙상블 방법과는 반대로 데이터를 특성에 따라 군집으로 나누고 각 군집별분류를 하는 Clustering 방법 의 성능을 평가하고자 한다. 분류방법에 따른 성능평가의 현실성을 높이 기 위하여 다구찌 디자인을 바탕으로 데이터로부터 성격을 파악할 수 있는 제어인자와 파악할 수 없는 비제어 인자를 동시에 고려한 시뮬레이션성능을 연구하였다.

가설 설정

5개 입력 변수 간 상관관계 가 약할 때의 p2 값은 각각 0.05 ~0.3 사이이며, 중간일 때는 0.4-0.7, 강할 때는 0.7-0.96 사이로 가정하였다. 실험에 사용된 각 입력변수 간 상관관계는<표 1>, <표 2>, <표 3>과 같다.
Ha2: 데이터의 분산이 작으면 로지스틱 회귀분석은 다른네 가지 방법보다 분류 정확성이 높다.
Ha3 : 데 이 터 의 분산이 중간이 면 Bagging과 Parameter Combining 은 다른 네 가지 방법보다 분류 정확성 이 높다.
Ha4 : 데이터의 분산이 크면 Clustering 방법과 다른 네 가지방법보다 분류 정확성이 높다.
Ha5 : 입력변수 간의 상관관계가 높으면 Variable Selection Bagginge 다른 네 가지 방법보다 분류 정확성이 높다.
Hal : 데이터의 크기는 분류 정 확성 에 유의한 영향을 준다.

제안 방법

이 중 (3) 입출력 함수는 주어진 데이터 에서 알 수 없는 성 격 이므로 비 제어 인자로 간주하였다. 실험과정은, 5成3"'x2】 일부 요인 실험계획법을 사용하여 30개의 수준조합(treatment)마다 각 인자와 수준을 고려하여 난수 발생시켜 얻은 데이터를 학습용 데이터에 60 %, 검증용 데이터에 40 % 할당한 후, 비제어 인자를 고려한 실험 디자인을 위하여 분류 정확성의 신호대 잡음비(S/N ratio : Signal to Noise Ratio)를 측정하였다. 여기서 신호대 잡음 비는 실험 디자인의 출력이 분류 정확성이므로 큰 값을 가질수록 바람직한 경우에 적용하는 망대특성((Lager-is-better characteristic)을 사용하였다.
가설 Hal~Ha5의 관점에서 유의한 주 효과와 교호작용을 바탕으로 데이터의 특성에 따른 적합한 분류방법을 선택하기 위하여 고차 교호작용을 중심으로, 과 같이 던칸검정을 하였다.
다섯 개 입력 변수의 평균을 0, 분산 공분산 행렬은의 상관행 렬(Correlation Matrix)에 1, 10, 100을 곱한 세 수준으로 다중 정규(Multivariate Normal) 분포를 따르도록 하였다.
다음은 앞서 언급된 (1) ~(5) 요인과 각각의 수준을 고려하여 실험계획법을 이용한 가설검정을 하였다. 이 중 (3) 입출력 함수는 주어진 데이터 에서 알 수 없는 성 격 이므로 비 제어 인자로 간주하였다.
것이 경제적 이다. 따라서 Variable Selection Bagging 분류기는 실험에서 사용된 5개 설명변수 중 3개씩 불규칙하게 사용하여 16번의 부트스트랩 샘플을 바탕으로 16개의 로지스틱 분류기를 Bagging하는 방법을 취하였다(Ho et al., 1994).
본 실험에서는 16개의 부트스트랩 샘플에 16개의 로지스틱분류기를 적용한 후 Bagging 하였다(Breiman, 1994).
본 연구에서는 로지스틱 회귀분석, Bagging, Variable Selection Bagging, Parameter Combining, Clustering 방법을 이용하여 분류분석을 할 때, 분류성능에 잠재적으로 영향을 미치는 데이터의 특성에 따라 적합한 분류방법을 알아보았다. 분류 정확성에 영향을 미치는 인자로 네 가지를 선택하고, 이 중 입출력변수 간의 연결함수는 주어진 자료에서 파악할 수 없는 성 격이므로 다구찌 디자인을 이용하여 비제어 인자로 간주하고 실험하였다.
또한 로지스틱 회귀분석은 범주형 자료분석에 오랜 기간 이용해 온전통적 통계분석 기법이다. 본 연구에서는 로지스틱 회귀분석을 바탕으로 분류정확성 향상을 위한 여러가지 앙상블 기법을 비교하였다. 앙상블 기법이란 다중 분류기들로부터 얻은예측값들을 결합하는 방법으로써 많은 연구자들이 하나의 분류기를 사용하는 경우보다 높은 분류성능을 얻기 위한 노력을해왔다.
특성에 따라 적합한 분류방법을 알아보았다. 분류 정확성에 영향을 미치는 인자로 네 가지를 선택하고, 이 중 입출력변수 간의 연결함수는 주어진 자료에서 파악할 수 없는 성 격이므로 다구찌 디자인을 이용하여 비제어 인자로 간주하고 실험하였다. 일부 요인 실험계획 결과, '분류방법 X 데이터의 분산', '분류방법 X 입력 변수 간의 상관관계' 등의 교호작용이 분류성능에 유의한 영향을 미치는 것으로 나타났다(a =0.
찾기 위한 시뮬레이 션을 시 행하였다. 시뮬레이션 데이터는 다중 정규(Multivariate Normal) 분포를 따르는 5개의 입 력변수와 이 진 값(Binary)을 가지는 출력 변수로 이 루어 져 있으며, 이들의 특성을 나타내는 실험의 인자(Factor)와 수준(Level)을 정하였다. 실험에 사용한 인자는 기존 연구에서 사용된 바 있는 데이터의 크기, 와, 입출력 변수 간의 함수와 더불어, 본 연구에서는 입력 변수 간의 상관관계와 데이터의 분산을 새로이 추가하여 분류정확성에 미치는 영향을 파악하였다(Peterson d al.
시뮬레이션을 위하여 실제 모델로 사용한 입출력 변수 간의 함수는 모수의 관점에서 로지스틱 선형 인 경우와 로지스틱 비선형인 경우로 나누었다.
시뮬레이션 데이터는 다중 정규(Multivariate Normal) 분포를 따르는 5개의 입 력변수와 이 진 값(Binary)을 가지는 출력 변수로 이 루어 져 있으며, 이들의 특성을 나타내는 실험의 인자(Factor)와 수준(Level)을 정하였다. 실험에 사용한 인자는 기존 연구에서 사용된 바 있는 데이터의 크기, 와, 입출력 변수 간의 함수와 더불어, 본 연구에서는 입력 변수 간의 상관관계와 데이터의 분산을 새로이 추가하여 분류정확성에 미치는 영향을 파악하였다(Peterson d al., 1995 ; Sohn and Shin, 1999). 디자인에 사용된 각 요인별 수준을 자세히 살펴보면 다음과 같다.
이용한 가설검정을 하였다. 이 중 (3) 입출력 함수는 주어진 데이터 에서 알 수 없는 성 격 이므로 비 제어 인자로 간주하였다. 실험과정은, 5成3"'x2】 일부 요인 실험계획법을 사용하여 30개의 수준조합(treatment)마다 각 인자와 수준을 고려하여 난수 발생시켜 얻은 데이터를 학습용 데이터에 60 %, 검증용 데이터에 40 % 할당한 후, 비제어 인자를 고려한 실험 디자인을 위하여 분류 정확성의 신호대 잡음비(S/N ratio : Signal to Noise Ratio)를 측정하였다.

대상 데이터

데이터의 크기는 변수의 수에 비하여 400배의 관측치 수를가지는 '상대적으로 작은' 2000개 데이터 셋과 변수의 수에 비하여 2000배의 관측치 수를 가지는 '상대적으로 많은' 10000개의 데이터 셋으로 나누었다. 전체 데이터의 60 %는 학습용 자료로, 40 %는 검증용 자료로 사용하였다.
데이터 셋으로 나누었다. 전체 데이터의 60 %는 학습용 자료로, 40 %는 검증용 자료로 사용하였다.

데이터처리

본 연구에서 사용된 데이터의 적절한 군집 개수를 결정하기 위하여 학습용 데이터를 이용한 사전 실험을 바탕으로 2~5개로 변화시켜 시험해본 결과, 4개의 군집수가 가장 적절한 것으로 나타났다. 분류 정확성의 측정은 검증용 데이터를 학습용 데이터에 근거하여 4개의 군집으로 나누고 군집별 로지스틱 회 귀분석으로 측정 했다.
따라서 본 연구에서는 Monte Carlo Simulation을 이용하여 데 이터의 특성을 나타내는 인자들과 앙상블, Clustering 방법 간의교호작용을 분류정확성의 관점에서 분석하고자 한다. 이를 위하여 데이터의 특성을(1) 입력변수 간의 상관관계, (2) 데이터의 분산, (3) 데이터의 크기, (4) 입출력변수 간의 함수로 나누고, (5) 분류방법(로지스틱 회귀분석, Bagging, Variable Selection Bagging, Parameter Combining, Clustering)에 따라 이진 출력값에 대한 분류정확성을 비교하였다. 이들 요인 중 입력변수와 출력변수 간의 함수는 주어진 데이터에서 실제 알수 없는 성격이므로 다구찌 실험계획법을 이용하여 비제어 인자로 간주하였다.

이론/모형

실험에 사용된 분류방법은 전통적 통계분석 방법으로 오랜기간 사용된 로지스틱 회귀분석과 앙상블 방법으로 가장 널리알려 진 Bagging(Breiman, 1994), 일부 변수만을 번갈아 사용하므로 경제적인 분류 방법인 Variable Selection Bagging(Ho et al., 1994)), Shanon and Banks(1999)에 의하여 제안된 Parameter Combining, 데이터의 분산이 클 때 효과적일 수 있는 Clustering 방법을 사용하였다.
실험과정은, 5成3"'x2】 일부 요인 실험계획법을 사용하여 30개의 수준조합(treatment)마다 각 인자와 수준을 고려하여 난수 발생시켜 얻은 데이터를 학습용 데이터에 60 %, 검증용 데이터에 40 % 할당한 후, 비제어 인자를 고려한 실험 디자인을 위하여 분류 정확성의 신호대 잡음비(S/N ratio : Signal to Noise Ratio)를 측정하였다. 여기서 신호대 잡음 비는 실험 디자인의 출력이 분류 정확성이므로 큰 값을 가질수록 바람직한 경우에 적용하는 망대특성((Lager-is-better characteristic)을 사용하였다. 다구찌 디자인을 이용한 실험결과는<표 4>와 같다.
이를 위하여 데이터의 특성을(1) 입력변수 간의 상관관계, (2) 데이터의 분산, (3) 데이터의 크기, (4) 입출력변수 간의 함수로 나누고, (5) 분류방법(로지스틱 회귀분석, Bagging, Variable Selection Bagging, Parameter Combining, Clustering)에 따라 이진 출력값에 대한 분류정확성을 비교하였다. 이들 요인 중 입력변수와 출력변수 간의 함수는 주어진 데이터에서 실제 알수 없는 성격이므로 다구찌 실험계획법을 이용하여 비제어 인자로 간주하였다.

성능/효과

분류성능 차이를 보이지 않았다. 그러나 분산이 중간 정도일 때는 Bagging과 Parameter Combining이 로지스틱 회귀분석, Variable Selection Bagging, Clustering에 비하여 상대적으로 떨어지는 것으로 나타났다. 이는 기존의 많은 연구에서 Bagging 을 비롯한 앙상블 방법이 분류 정확성을 향상시킨다는 결과가 통계적으로 유의한 성능 차이를 보이는 것인지 검증해볼 필요가 있음을 제시한다.
다섯번째 가설(Ha5)의 관점에서, Variable Selection Bagging 방법은 입력변수 간의 강한 상관관계를 가질 때 로지스틱 회귀분석이나 Parameter Combining 방법보다 상대적으로 우수한 분류 성능을 보였으며 Clustering이나 Bagging과는 유의한성능 차이가 나지 않았다. 이는 입력 변수 간에 강한 상관관계를 가지는 경우 모든 변수를 이용하지 않아도 분류 정확성을저해하지 않는 것을 의미한다.
이는 기존의 많은 연구에서 Bagging 을 비롯한 앙상블 방법이 분류 정확성을 향상시킨다는 결과가 통계적으로 유의한 성능 차이를 보이는 것인지 검증해볼 필요가 있음을 제시한다. 또한 부트스트랩 샘플링에 기초한 앙상블 방법들이 분석에 소요되는 시간을 감안할 때 로지스틱 회귀분석과 같은 개 별모형 (Individual Model)에 비하여 효과적 이지 못하다는 결론을 내릴 수 있다.
이다(Cao, 1995; Sohn and Lee, 2000). 본 연구에서 사용된 데이터의 적절한 군집 개수를 결정하기 위하여 학습용 데이터를 이용한 사전 실험을 바탕으로 2~5개로 변화시켜 시험해본 결과, 4개의 군집수가 가장 적절한 것으로 나타났다. 분류 정확성의 측정은 검증용 데이터를 학습용 데이터에 근거하여 4개의 군집으로 나누고 군집별 로지스틱 회 귀분석으로 측정 했다.
<표 6>에 나타난 던칸 검정결과에 의하면 데이터의 분산 크기 에 관계없이 모든 경우에 Parameter Combining 방법이 다른 방법에 비해 낮은 분류 정확성을 보이고 있으며, 가설 Ha2~Ha4의 관점에서, 분산이 크거나 작을 때는 로지스틱 회귀분석, Variable Selection Bagging, Bagging, Clustering 방법 간에 유의한 분류성능 차이를 보이지 않았다. 그러나 분산이 중간 정도일 때는 Bagging과 Parameter Combining이 로지스틱 회귀분석, Variable Selection Bagging, Clustering에 비하여 상대적으로 떨어지는 것으로 나타났다.
위와 같은 Hal~Ha4의 가설들에 대해 실험결과를 바탕으로 교호작용인 분류기법 X 입력변수 간의 상관관계 X 데이터의 분산을 오차항으로 두고 분산분석을 하여 유의수준 10 % 에서 가설검정한 결과 분류기법, 입력변수 간의 상관관계, 데이터의 분산이 주 효과가 있으며 데이터의 크기는 분류 정확성에 유의한 영향을 주지 않았다(Hal).
1). 이들 교호작용을 중심으로 분석결과를 정리하면, Parameter Combining방법 이 낮은 분류 정확성을 보인 것을 제외하고, 나머지 앙상블 방법들과 로지스틱 회귀분석 사이에 유의한 성능차이가 나지 않았다. 이는 앙상블 방법이 부트스트랩 샘플링을 취하고 분류기를 만드는 데 소요되는 시간과 작업량을 고려 하면 비효율적 일수도 있다는 결론을 내 릴 수 있다.
따라서 교통량 추정, 품질 예측문제에 있어서 센서의 설치비용을 절감할 수 있는 가능성을제시한다. 이상의 결과는 기존의 경험적(empirical) 연구 중에서 앙상블 방법이 분류성능을 향상시키는 경우도 있으며 그렇지 못한 경우도 있었던 이유가 연구에 사용된 데이터의 변수간 상관관계와 분산의 정도에 따른 특징에 기인하는 것으로볼 수 있다.
이상의 앙상블 방법을 이용한 분류에 대한 기존의 연구결과는 분류정확성을 높인 경우도 있었으며 오히려 낮춘 경우도있었다. Breiman(1994)은 Bagging 방법을 제안하고 시뮬레이션 데이터와 실제 데이터에 적용하여 분류 정확성의 향상을보였으며, Optiz and Maclin(1997)은 14개의 실제 데이터를 대상으로 Bagging과 Boosting을 이용하여 신경망 앙상블과 Decision Tree 앙상블을 만들어 분류하였다.
분류 정확성에 영향을 미치는 인자로 네 가지를 선택하고, 이 중 입출력변수 간의 연결함수는 주어진 자료에서 파악할 수 없는 성 격이므로 다구찌 디자인을 이용하여 비제어 인자로 간주하고 실험하였다. 일부 요인 실험계획 결과, '분류방법 X 데이터의 분산', '분류방법 X 입력 변수 간의 상관관계' 등의 교호작용이 분류성능에 유의한 영향을 미치는 것으로 나타났다(a =0.1). 이들 교호작용을 중심으로 분석결과를 정리하면, Parameter Combining방법 이 낮은 분류 정확성을 보인 것을 제외하고, 나머지 앙상블 방법들과 로지스틱 회귀분석 사이에 유의한 성능차이가 나지 않았다.

후속연구

따라서 이의 검증이 필요하다(Peterson et al, 1995; Sohn and Shin, 1999). 데이터의 분산이 클 때는 부트스트랩 샘플을 바탕으로 하기때문에 일반적으로 강건한(robust) 모형을 만들 수 있다고 알려 진 앙상블 방법 (Bagging, Parameter Combining)이 우수한 성능을 발휘 할 것으로 기대되며 특히 Clustering 방법은 관측치의 산포가 클 때 군집을 이룰 가능성이 크므로 더욱 우수한 성능을 보일 것으로 예상된다. 또한 Variable Selection Bagginge 부트스트랩 샘플마다 입력변수 중 일부를 선택함으로 입력변수 간의 상관관계가 높을 경우, 분류 정확성이 높을 것으로 기대된다.
또한 부트스트랩 샘플의 수에 따라 앙상블 모형의 성능이 달라질 수 있음을 고려하지 않았다. 따라서 향후 연구방향으로, 더욱 다양한 인자와 수준을 이용한 성능비교가 요구되며, 부트스트랩 샘플의 수 하나의 인자로 사용하여 앙상블의 효과를 파악할 필요가 있다.
데이터의 분산이 클 때는 부트스트랩 샘플을 바탕으로 하기때문에 일반적으로 강건한(robust) 모형을 만들 수 있다고 알려 진 앙상블 방법 (Bagging, Parameter Combining)이 우수한 성능을 발휘 할 것으로 기대되며 특히 Clustering 방법은 관측치의 산포가 클 때 군집을 이룰 가능성이 크므로 더욱 우수한 성능을 보일 것으로 예상된다. 또한 Variable Selection Bagginge 부트스트랩 샘플마다 입력변수 중 일부를 선택함으로 입력변수 간의 상관관계가 높을 경우, 분류 정확성이 높을 것으로 기대된다.
Variable Selection Bagginge 입력 변수 간의 상관관계가 높을 경우, 로지스틱 회귀분석이나 Parameter Combining보다 우수하며 모든 변수를 사용하는 Bagging, Clustering 방법과 유의한 차이 가나지 않았다(Ha5). 이 결과는 여러 입력값을 동시에 감지하는데 많은 비용이 소요되는 분야에서 유용히 활용할 수 있을 것으로 보인다. 예를 들어, 교통량 예측 분야에서는 여러 도로 상황변수를 동시에 센싱하기 위하여 한 지점에 다량의 센서를설치함으로써 발생하는 비용 문제를 해결할 수 있는 대안이될 수 있을 것이다.
그러나 분산이 중간 정도일 때는 Bagging과 Parameter Combining이 로지스틱 회귀분석, Variable Selection Bagging, Clustering에 비하여 상대적으로 떨어지는 것으로 나타났다. 이는 기존의 많은 연구에서 Bagging 을 비롯한 앙상블 방법이 분류 정확성을 향상시킨다는 결과가 통계적으로 유의한 성능 차이를 보이는 것인지 검증해볼 필요가 있음을 제시한다. 또한 부트스트랩 샘플링에 기초한 앙상블 방법들이 분석에 소요되는 시간을 감안할 때 로지스틱 회귀분석과 같은 개 별모형 (Individual Model)에 비하여 효과적 이지 못하다는 결론을 내릴 수 있다.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

다구찌 디자인을 이용한 앙상블 및 군집분석 분류 성능 비교
Comparing Classification Accuracy of Ensemble and Clustering Algorithms Based on Taguchi Design 원문보기

Abstract ▼ AI-Helper

주제어

AI 본문요약
AI-Helper

문제 정의

가설 설정

제안 방법

대상 데이터

데이터처리

이론/모형

성능/효과

후속연구

이 논문을 인용한 문헌

저자의 다른 논문 :

관련 콘텐츠

원문 보기

원문 URL 링크

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

다구찌 디자인을 이용한 앙상블 및 군집분석 분류 성능 비교 Comparing Classification Accuracy of Ensemble and Clustering Algorithms Based on Taguchi Design 원문보기

Abstract ▼ AI-Helper

주제어

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

가설 설정

제안 방법

대상 데이터

데이터처리

이론/모형

성능/효과

후속연구

이 논문을 인용한 문헌

저자의 다른 논문 :

신형원 (6) 손소영 (58)

관련 콘텐츠

원문 보기

원문 URL 링크

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

다구찌 디자인을 이용한 앙상블 및 군집분석 분류 성능 비교
Comparing Classification Accuracy of Ensemble and Clustering Algorithms Based on Taguchi Design 원문보기

AI 본문요약
AI-Helper