화석 연료의 무분별한 사용으로 환경이 심각하게 오염되고, 화석 연료의 고갈에 대한 문제가 대두됨에 따라서 화석 연료에 대한 문제를 해결 할 수 있는 대체 에너지원에 대해 관심이 집중되기 시작하였다. 현재 신재생 에너지 중에서 가장 각광을 받고 있는 에너지는 중에 하나가 풍력에너지이다. 풍력에너지 발전단지와 기존의 전력 발전소는 소비되는 전력에 대한 생산의 균형을 맞춰야하며, 풍력에너지단지에서 균형적인 생산을 하기 위해서는 풍력에너지에 대한 분석 및 예측이 필요하다. 이를 위해서 데이터마이닝 분야의 예측 기법이 활용 될 수 있다. 본 논문에서는 풍력 데이터를 이용하여 발전 패턴을 예측하기 위해 SOM(Self-Organizing Feature Map) Clustering 기법과 의사결정나무(decision tree)를 이용한 연구를 진행하였다. 즉, 1) 풍력 데이터의 누락된 데이터와 이상치 데이터를 처리하기 위하여, 전처리 과정을 수행하였고, 이 과정에서 특징 벡터를 추출하였다. 2) 전처리 단계를 거쳐 정제되고 정규화된 데이터 집합을 MIA(Mean Index Adequacy) 척도와 SOM Clustering 기법에 적용하여 대표 발전 패턴을 찾아내고 각각의 데이터에 해당하는 대표 패턴을 클래스레이블로 할당하도록 하였다. 3) 의사결정나무 기반의 분류 기법에 데이터 집합을 적용시켜 새로운 풍력에너지에 대한 분석 및 예측 모델을 생성하였다. 실험 결과, 의사결정나무를 통한 풍력에너지 발전 패턴을 예측하기 위한 모델을 구축하였다.
화석 연료의 무분별한 사용으로 환경이 심각하게 오염되고, 화석 연료의 고갈에 대한 문제가 대두됨에 따라서 화석 연료에 대한 문제를 해결 할 수 있는 대체 에너지원에 대해 관심이 집중되기 시작하였다. 현재 신재생 에너지 중에서 가장 각광을 받고 있는 에너지는 중에 하나가 풍력에너지이다. 풍력에너지 발전단지와 기존의 전력 발전소는 소비되는 전력에 대한 생산의 균형을 맞춰야하며, 풍력에너지단지에서 균형적인 생산을 하기 위해서는 풍력에너지에 대한 분석 및 예측이 필요하다. 이를 위해서 데이터마이닝 분야의 예측 기법이 활용 될 수 있다. 본 논문에서는 풍력 데이터를 이용하여 발전 패턴을 예측하기 위해 SOM(Self-Organizing Feature Map) Clustering 기법과 의사결정나무(decision tree)를 이용한 연구를 진행하였다. 즉, 1) 풍력 데이터의 누락된 데이터와 이상치 데이터를 처리하기 위하여, 전처리 과정을 수행하였고, 이 과정에서 특징 벡터를 추출하였다. 2) 전처리 단계를 거쳐 정제되고 정규화된 데이터 집합을 MIA(Mean Index Adequacy) 척도와 SOM Clustering 기법에 적용하여 대표 발전 패턴을 찾아내고 각각의 데이터에 해당하는 대표 패턴을 클래스 레이블로 할당하도록 하였다. 3) 의사결정나무 기반의 분류 기법에 데이터 집합을 적용시켜 새로운 풍력에너지에 대한 분석 및 예측 모델을 생성하였다. 실험 결과, 의사결정나무를 통한 풍력에너지 발전 패턴을 예측하기 위한 모델을 구축하였다.
Due to the imprudent spending of the fossil fuels, the environment was contaminated seriously and the exhaustion problems of the fossil fuels loomed large. Therefore people become taking a great interest in alternative energy resources which can solve problems of fossil fuels. The wind power energy ...
Due to the imprudent spending of the fossil fuels, the environment was contaminated seriously and the exhaustion problems of the fossil fuels loomed large. Therefore people become taking a great interest in alternative energy resources which can solve problems of fossil fuels. The wind power energy is one of the most interested energy in the new and renewable energy. However, the plants of wind power energy and the traditional power plants should be balanced between the power generation and the power consumption. Therefore, we need analysis and prediction to generate power efficiently using wind energy. In this paper, we have performed a research to predict power generation patterns using the wind power data. Prediction approaches of datamining area can be used for building a prediction model. The research steps are as follows: 1) we performed preprocessing to handle the missing values and anomalous data. And we extracted the characteristic vector data. 2) The representative patterns were found by the MIA(Mean Index Adequacy) measure and the SOM(Self-Organizing Feature Map) clustering approach using the normalized dataset. We assigned the class labels to each data. 3) We built a new predicting model about the wind power generation with classification approach. In this experiment, we built a forecasting model to predict wind power generation patterns using the decision tree.
Due to the imprudent spending of the fossil fuels, the environment was contaminated seriously and the exhaustion problems of the fossil fuels loomed large. Therefore people become taking a great interest in alternative energy resources which can solve problems of fossil fuels. The wind power energy is one of the most interested energy in the new and renewable energy. However, the plants of wind power energy and the traditional power plants should be balanced between the power generation and the power consumption. Therefore, we need analysis and prediction to generate power efficiently using wind energy. In this paper, we have performed a research to predict power generation patterns using the wind power data. Prediction approaches of datamining area can be used for building a prediction model. The research steps are as follows: 1) we performed preprocessing to handle the missing values and anomalous data. And we extracted the characteristic vector data. 2) The representative patterns were found by the MIA(Mean Index Adequacy) measure and the SOM(Self-Organizing Feature Map) clustering approach using the normalized dataset. We assigned the class labels to each data. 3) We built a new predicting model about the wind power generation with classification approach. In this experiment, we built a forecasting model to predict wind power generation patterns using the decision tree.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
그리고 3장에서는 이상치와 누락 데이터에 대한 처리와 특징 벡터를 추출하기 위한 전처리 과정과 대표 프로파일 생성을 위한 자기조직화지도 알고리즘 및 최적의 군집 개수 결정을 위해 사용한 MIA 척도에 대해 기술을 한다. 또한, 생성된 대표 프로파일을 이용하여 생산 패턴을 분류하는 기법에 대해 설명한다. 4장에서는 실험 평가를 설명한다.
제안 방법
10개의 대표 패턴을 가지고 있는 풍력 발전 데이터 집합을 통해 분류 모델을 구축한다. 여기서 만들어진 분류 모델을 이용하여 발전 패턴을 예측한다.
이 데이터는 전처리 과정에서 이상치 및 결측치가 처리되었으며, 총 136일치의 데이터 집합을 얻을 수 있었다. 그 다음, 특징을 추출하여 데이터 샘플을 수를 줄였으며, 추출된 특징값을 SOM Clustering에 적용하여 10개의 대표 패턴을 정의할 수 있었다. 각각의 풍력 발전 대표 패턴들은 그림 10과 같은 특징을 나타낸다.
둘째, 전력 부하 패턴의 특징 벡터 계산 방법을 이용하여, 풍력 발전 터빈의 패턴에 대한 특징 벡터를 계산한다[5, 6, 7, 8, 9].
배전 계통의 전문가에 의해 제안된 특징 벡터를 계산하는 방법을 이용하여 풍력 발전 터빈의 전력 생산 패턴에 대한 특징 벡터를 계산한다[9]
이 에너지를 이용하여 발전을 하고, 소비자들에게 공급을 하기 위해서는 에너지에 대한 분석이 필요하다. 본 논문에서는 신재생 에너지 중에서도 발전 효율이 높은 풍력에너지의 예측 모델을 구축하는 실험을 진행하였고, 이전에 이루어진 소비자의 부하 패턴 예측에 관한 연구들을 통해 소비자의 생활패턴을 고려한 예측 프레임워크를 본 논문의 실험에 적용하였다. 그 결과 80% 이상의 정확도를 가진 예측 모델과 그에 따른 의사결정 규칙들을 얻을 수 있었다.
10개의 대표 패턴을 가지고 있는 풍력 발전 데이터 집합을 통해 분류 모델을 구축한다. 여기서 만들어진 분류 모델을 이용하여 발전 패턴을 예측한다. 실험은 WEKA 툴의 C4.
그림 8는 군집 개수별 MIA 척도의 값을 나타낸다. 우리는 MIA 척도 측정 실험을 토대로 계산된 값들의 분석을 토대로 값이 안정화되는 부분을 최적의 클러스터 개수로 지정하였다. 이 실험의 결과로 클러스터의 개수는 10개가 가장 적절하다고 분석하였다.
위의 절차대로 풍력에너지 발전량 패턴 예측에 대한 연구를 진행하였고, 단기간 동안 수집된 풍력 데이터를 이용하여 풍력 발전 터빈의 생산 패턴을 예측할 수 있었다.
첫째, 먼저 한국에너지기술연구원[4]으로부터 풍력 발전 터빈에서 1년 동안 수집된 데이터로부터 패턴을 찾아내기에 앞서, 누락된 데이터와 이상치 데이터를 처리하기 위한 전처리 과정을 수행한다.
최종적으로 본 실험을 통해 우리는 기존에 수집된 풍력 발전량에 대한 데이터와 풍속과 같은 요소를 이용하여 풍력 발전 터빈의 발전 패턴을 예측 가능한 모델을 구축하였다. 이 모델에 데이터를 적용시켜 해당 데이터의 발전 패턴을 예측할 수 있으며, 추가적으로 패턴 예측에 중대한 영향을 끼치는 속성들을 알 수 있다.
풍력 발전 패턴을 예측하기 위해서 분류 기법을 이용한 예측 모델을 생성한다. 분류 기법은 WEKA의 C4.
대상 데이터
SOM Clustering을 통해 총 136개의 풍력 발전 벡터 데이터는 총 10개의 대표 프로파일을 갖는다. 이 데이터 집합은 예측 모델을 생성하는데 중요한 역할을 한다.
논문에서 사용하는 데이터는 대용량의 고차원 데이터이다. 고차원의 데이터는 실험을 하는데 있어서 데이터로부터 규칙을 찾거나 알고리즘의 계산을 하는데 어려움을 겪는다.
그 중에서 이슈가 되고 있는 신재생 에너지는 풍력과 태양광 분야이다. 본 논문에서는 투자자본 대비 발전 효율이 좋은 풍력 에너지에 대한 데이터를 이용한다. 이러한 자연계 에너지가 가지고 있는 속성은 실시간적이고, 무한량이며, 친환경적이라는 것이다.
우리는 한국에너지기술연구원으로부터 1년 동안 수집된 풍력 발전 데이터 집합을 제공받아 실험에 사용하였다. 이 데이터는 전처리 과정에서 이상치 및 결측치가 처리되었으며, 총 136일치의 데이터 집합을 얻을 수 있었다.
제공 받은 풍력 발전 데이터는 10분 간격으로 1년 동안 수집된 데이터이다. 하지만 설치된 장비의 안정화 작업이 지연됨으로 인해 데이터 수집에 어려움이 있었다.
이론/모형
SOM Clustering 기법은 WEKA (Waikato Environ ment for Knowledge Analysis) Tools[15]의 plug-in으로 제공하는 알고리즘을 사용하였다. 전 단계에서 MIA 척도를 통해 최적의 클러스터 개수를 10개로 정하였다.
객체들의 대표 패턴을 찾기 위해서는 군집 기법을 사용한다. 여기서 SOM Clustering 기법을 사용하는데, 이 기법은 클러스터의 수를 미리 정해주어야 하는 알고리즘이다.
이 과정에서는 MIA 척도와 SOM Clustering 기법을 사용한다. 그 뒤 Classification 기법을 이용하여 예측 모델을 생성한다.
대표적으로 국내에서는 시공간적인 요소를 고려하여 소비자의 전력 부하 패턴 예측의 정확도를 향상하는 연구[5]가 진행되었고, 국외에서는 소비자의 전력 부하 패턴을 찾아내어 최적의 전력 공급업체를 찾아내는 연구[6]가 진행된바 있다. 또한 우리는 기존에 이루어진 연구를 토대로 그 연구들에서 사용된 프레임워크와 군집 및 분류 기법들을 이용한다.
풍력 발전 패턴을 예측하기 위해서 분류 기법을 이용한 예측 모델을 생성한다. 분류 기법은 WEKA의 C4.5 알고리즘을 사용한다. 이 알고리즘의 의사결정규칙(decision rule)으로 예측 및 분류를 수행한다.
셋째, 특징 벡터의 데이터 집합에서 대표 프로파일을 형성하기 위하여 자기조직화지도 (SOM: Self-Organizing Map) [10, 11] 군집 기법을 사용한다. 여기서 자기조직화지도는 Map의 사이즈를 지정해주어야 하는데, 최적의 군집 개수를 지정하기 위해 MIA 척도를 사용한다.
여기서 만들어진 분류 모델을 이용하여 발전 패턴을 예측한다. 실험은 WEKA 툴의 C4.5 알고리즘으로 진행하고, 10 Folds Cross-Validation 기법을 사용하여 모델의 정확도를 평가하였다. 이 실험을 통해 우리는 82.
여기서 우리는 최적의 군집 개수를 찾아내기 위해 MIA 라고 불리는 척도를 사용한다.
셋째, 특징 벡터의 데이터 집합에서 대표 프로파일을 형성하기 위하여 자기조직화지도 (SOM: Self-Organizing Map) [10, 11] 군집 기법을 사용한다. 여기서 자기조직화지도는 Map의 사이즈를 지정해주어야 하는데, 최적의 군집 개수를 지정하기 위해 MIA 척도를 사용한다.
하지만 그 이외의 경우는 인위적인 작업이 필요하다. 우리는 시각화 툴인 TIBCO Spotfire[14]를 이용하여 세번째 경우를 처리한다. 그림 6은 첫번째 경우부터 세번째 경우에 해당하는 데이터를 시각화 한 모습이다.
이 데이터에 Clustering 기법이 적용되면 대표 발전 패턴이 생성된다. 이 과정에서는 MIA 척도와 SOM Clustering 기법을 사용한다. 그 뒤 Classification 기법을 이용하여 예측 모델을 생성한다.
성능/효과
본 논문에서는 신재생 에너지 중에서도 발전 효율이 높은 풍력에너지의 예측 모델을 구축하는 실험을 진행하였고, 이전에 이루어진 소비자의 부하 패턴 예측에 관한 연구들을 통해 소비자의 생활패턴을 고려한 예측 프레임워크를 본 논문의 실험에 적용하였다. 그 결과 80% 이상의 정확도를 가진 예측 모델과 그에 따른 의사결정 규칙들을 얻을 수 있었다. 이 예측모델과 프레임워크는 앞으로 기존의 전력발전체계와 풍력에너지를 통해 전력을 균형적으로 공급할 수 있도록 활용될 수 있을 것이다.
5 알고리즘으로 진행하고, 10 Folds Cross-Validation 기법을 사용하여 모델의 정확도를 평가하였다. 이 실험을 통해 우리는 82.3%의 정확도를 가진 예측 모델을 구축하였다. 그림 11 구축된 모델의 의사결정나무를 나타낸다.
우리는 MIA 척도 측정 실험을 토대로 계산된 값들의 분석을 토대로 값이 안정화되는 부분을 최적의 클러스터 개수로 지정하였다. 이 실험의 결과로 클러스터의 개수는 10개가 가장 적절하다고 분석하였다.
후속연구
하지만 이러한 신재생 에너지의 발전량 예측과 패턴에 대한 연구는 아직 미비한 실정이다. 앞으로 시행될 예정인 신재생 에너지의 의무할당제 등으로 인해 신재생 에너지를 이용하여 발전된 전력에 대한 공급을 점차 확대할 계획이다. 이처럼 신재생 에너지의 사용 비율이 증가하고, 소비자들이 고품질의 전력을 사용하기 위해서는 더 많은 연구와 분석이 필요하다.
그 결과 80% 이상의 정확도를 가진 예측 모델과 그에 따른 의사결정 규칙들을 얻을 수 있었다. 이 예측모델과 프레임워크는 앞으로 기존의 전력발전체계와 풍력에너지를 통해 전력을 균형적으로 공급할 수 있도록 활용될 수 있을 것이다.
앞으로 시행될 예정인 신재생 에너지의 의무할당제 등으로 인해 신재생 에너지를 이용하여 발전된 전력에 대한 공급을 점차 확대할 계획이다. 이처럼 신재생 에너지의 사용 비율이 증가하고, 소비자들이 고품질의 전력을 사용하기 위해서는 더 많은 연구와 분석이 필요하다. 특히, 신재생 에너지 발전단지를 조성하는데 있어서, 그 발전단지의 지역적인 특성과 발전 패턴을 분석하는 것은 소비자에게 고품질의 전력을 공급하는데 있어서도 중요한 요인이다.
향후에는 제주도에 설치되어있는 특정 발전 터빈이라는 제한성과 계절을 고려하지 않은 문제를 해결 할 수 있도록 하고, 또한 실험에 사용 가능한 데이터 집합을 충분히 확보하여 예측에 대한 정확도를 높일 수 있는 연구를 진행 할 것이다.
질의응답
핵심어
질문
논문에서 추출한 답변
풍력에너지가 활성화되기 위해 필요한 것은 무엇인가?
현재 신재생 에너지 중에서 가장 각광을 받고 있는 에너지는 중에 하나가 풍력에너지이다. 풍력에너지 발전단지와 기존의 전력 발전소는 소비되는 전력에 대한 생산의 균형을 맞춰야하며, 풍력에너지단지에서 균형적인 생산을 하기 위해서는 풍력에너지에 대한 분석 및 예측이 필요하다. 이를 위해서 데이터마이닝 분야의 예측 기법이 활용 될 수 있다.
고차원의 데이터의 단점은 무엇인가?
논문에서 사용하는 데이터는 대용량의 고차원 데이터이다. 고차원의 데이터는 실험을 하는데 있어서 데이터로부터 규칙을 찾거나 알고리즘의 계산을 하는데 어려움을 겪는다. 이러한 문제를 해결하기 위해 데이터의 특징 벡터를 추출하는 연구가 제안되었다.
풍력에너지에 대한 분석 및 예측을 위해 사용할 수 있는 방법은 무엇인가?
풍력에너지 발전단지와 기존의 전력 발전소는 소비되는 전력에 대한 생산의 균형을 맞춰야하며, 풍력에너지단지에서 균형적인 생산을 하기 위해서는 풍력에너지에 대한 분석 및 예측이 필요하다. 이를 위해서 데이터마이닝 분야의 예측 기법이 활용 될 수 있다. 본 논문에서는 풍력 데이터를 이용하여 발전 패턴을 예측하기 위해 SOM(Self-Organizing Feature Map) Clustering 기법과 의사결정나무(decision tree)를 이용한 연구를 진행하였다.
참고문헌 (16)
S.K. Park, L. Wang, Y.K. Lee, D.J. Chai, C.H. Heo, K.H Ryu, K.D. Kim, "Design of Monitoring System Based on Sensor Network for Managing New&Re newable Energy Resources", In Proc. Of KIPS, Vol.16 No.1, pp. 377-378, 2009
What is the new & renewable energy? (2011, August, 15). Korea Institute of Energy Research Home Page. Retrieved July 15, 2011 from http://www.kier.re.kr/open_content/energy/new_energy/view.jsp
G. H. Ryu, K. S. Kim, J. C. Kim, K. B. Song, "A Study on Estimation of Wind Power Generation using Weather Data in Jeju Island", The Transactions of The Korean Institute of Electrical Engineers, Vol. 58 No.12, pp. 2349-2353, 2009
Korea Institute of Energy Research, http://www.kier.re.kr/
H.G. Lee, Y.H Choi, J.H Shin, "Spatio-Temporal Mining for Power Load Forecasting in GIS-AMR Load Analysis Model", IJIPM: International Journal of Information Processing and Management, Vol. 2, No. 1, pp. 57-66, 2011
V. Figueiredo , F. Rodrigues , Z. Vale and J. B. Gouveia "An electric energy consumer character ization framework based on data mining techniques", IEEE Trans. Power Syst., vol. 20, pp. 596-602, 2005.
M.H. PIAO, J.H. Park, H.G. Lee, K.H. Ryu, "Class ification Methods for Automated Prediction of Power Load Patterns", KCC., Vol. 35, pp. 26-30, 2008.
H. G. Lee, H. J. Shin, K.. H. Ryu, "Forecasting Elec tric Power Load Patterns using Unsupervised and Supervised Methods from Load Demand Data", The First International Workshop on Frontiers of Information Technology, Applications and Tools, Vol.1, pp. 2-6, 2008
J. H. Park, H. G. Lee, J. H. Shin, K. H. Ryu, H. S. Kim, "Power Consumption Patterns Analysis Using Expectation-Maximization Clustering Algorithm and Emerging Pattern Mining", In Proc. Of KIPS, Vol.15 No.2, pp. 261-264, 2008
S.V. Verdu, M.O. Garcia, C. Senabre, A.G. Marin and F.J.G. Franco, "Classification, Filtering, and Identification of Electrical Customer Load Patterns Through the Use of Self-Organizing Maps", IEEE Transactions on Power Systems., Vol. 21, pp. 1672-1682, 2006
G. Chicco, R. Napoli, P. Postolache, M. Scutariu, and C. Toader, "Customer characterization options for improving the tariff offer", IEEE Trans. Power System, vol. 18, pp. 381-387, Feb. 2003.
G. Chicco, R. Napoli, P. Postulache, M.Scutariu, C. Toader, "Load Pattern-Based Classification of Electricity Customers.", IEEE Trans. Power System, vol.19, pp. 1232-1239, 2004
T. Kohonen, Slef-Organization and Associative Memor y, 3rd Edition, NewYork: Springer-Verlag, 1989.
Introduction of the TIBCO Spotfire Tools, http://spotfire.tibco.com/
Weka Machine Learning Data Mining Tools, http://www.cs.waikato.ac.nz/ml/weka/
J.R. Quinlan, "C4.5: Programs for Machine Learning, Morgan Kauffman.", 1993.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.