$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

시간단위 전력사용량 시계열 패턴의 군집 및 분류분석
Clustering and classification to characterize daily electricity demand 원문보기

Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지, v.28 no.2, 2017년, pp.395 - 406  

박다인 (대구대학교 일반대학원 통계학과) ,  윤상후 (대구대학교 전산통계학과, 대구대학교 기초과학연구소)

초록
AI-Helper 아이콘AI-Helper

전력 공급 시스템의 효율적인 운영을 위해 전력수요예측은 필수적이다. 본 연구에서는 군집분석분류분석을 이용하여 일 단위 시간별 전력수요량 시계열 패턴의 유형을 살펴보고자 한다. 전력거래소에서 수집된 2008년 1월 1일부터 2012년 12월 31일까지의 일 단위 시간별 전력수요량 데이터를 추세성분, 계절성분, 오차 성분으로 구성된 시계열 자료로 변환하여 사용하였다. 추세성분을 제거한 시계열 자료의 패턴을 구분하기 위한 군집 분석방법k-평균 군집분석 (k-means), 가우시안혼합모델 혼합 모델 군집분석 (Gaussian mixture model), 함수적 군집분석 (functional clustering)을 고려하였다. 주성분분석을 통해 24시간 자료를 2개의 요인로 축소한 후 k-평균 군집분석과 가우시안 혼합 모델, 함수적 군집분석을 수행하였다. 군집분석 결과를 토대로 2008년부터 2011년까지 총 4년간 데이터를 4가지 분류분석방법인 의사결정나무, RF (random forest), Naive bayes, SVM (support vector machine)을 통해 훈련시켜 2012년 군집을 예측하였다. 분석 결과 가우시안 혼합 분포기반 군집분석과 RF를 이용한 군집예측 결과의 성능이 가장 우수하였다.

Abstract AI-Helper 아이콘AI-Helper

The purpose of this study is to identify the pattern of daily electricity demand through clustering and classification. The hourly data was collected by KPS (Korea Power Exchange) between 2008 and 2012. The time trend was eliminated for conducting the pattern of daily electricity demand because elec...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 일반적인 시계열자료와 유사하게 추세성과 계절성이 존재하고 있다. 시간의 흐름에 따라 자료의 변동 폭이 증가하므로 로그변환을 실시하고 추세성이 전력수요량의 유형을 파악하는데 영향을 미칠 수 있으므로 추세성을 제거하여 연구를 수행하였다. 로그변환과 추세성이 제거된 자료는 시간과 무관한 계절성만이 반영된 자료이다 (Figure 3.
  • 이번 절에서는 전력수요 패턴을 파악하기 위해 본 연구에서 고려한 군집분석 및 분류분석 방법에 대해 설명하고자 한다. 일단위 전력수요 패턴을 파악하기 위해 k 평균 군집분석, 가우시안 혼합 모델 군집분석, 함수적 군집분석이 고려되었다.

가설 설정

  • 모집단이 G개의 군집으로 구성된다면 k번째 군집에 속한 p차원 관측벡터 x의 밀도함수는 fk(x, θ)라고 가정한다.
  • = 1을 만족한다. 이제 관측벡터가 다변량 정규분포를 따른다고 가정하는 가우시안 혼합모형을 고려해보자. fk(x, θ)는 평균벡터 µk와 공분산행렬 Σk를 갖는 k번째 군집의 다변량정규분포의 밀도함수는 다음과 같다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
본 논문에서 주성분분석을 통해 어떠한 결과를 얻었는가? 추세성분을 제거한 시계열 자료의 패턴을 구분하기 위한 군집 분석방법은 k-평균 군집분석 (k-means), 가우시안혼합모델 혼합 모델 군집분석 (Gaussian mixture model), 함수적 군집분석 (functional clustering)을 고려하였다. 주성분분석을 통해 24시간 자료를 2개의 요인로 축소한 후 k-평균 군집분석과 가우시안 혼합 모델, 함수적 군집분석을 수행하였다. 군집분석 결과를 토대로 2008년부터 2011년까지 총 4년간 데이터를 4가지 분류분석방법인 의사결정나무, RF (random forest), Naive bayes, SVM (support vector machine)을 통해 훈련시켜 2012년 군집을 예측하였다.
추세성분을 제거한 시계열 자료의 패턴을 구분하기 위한 군집 분석방법으로 본 논문에서는 어떠한 방법을 고려하였는가? 전력거래소에서 수집된 2008년 1월 1일부터 2012년 12월 31일까지의 일 단위 시간별 전력수요량 데이터를 추세성분, 계절성분, 오차 성분으로 구성된 시계열 자료로 변환하여 사용하였다. 추세성분을 제거한 시계열 자료의 패턴을 구분하기 위한 군집 분석방법은 k-평균 군집분석 (k-means), 가우시안혼합모델 혼합 모델 군집분석 (Gaussian mixture model), 함수적 군집분석 (functional clustering)을 고려하였다. 주성분분석을 통해 24시간 자료를 2개의 요인로 축소한 후 k-평균 군집분석과 가우시안 혼합 모델, 함수적 군집분석을 수행하였다.
k-평균 군집분석의 절차는 무엇인가? (1) 전체 개체를 k개의 군집으로 초기화한다. (2) 각 군집별 중심점을 찾는다. (3) 모든 개체와 각 군집의 중심점과의 유클리드 거리를 계산하여 개체와의 거리가 가장 가까운 중심점에 대응하는 군집으로 배정 한다. (4) 모든 개체가 다른 군집으로 재배정되지 않을 때까지 (2)∼(4) 과정을 반복한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (18)

  1. Breiman, L. (2001). Random forests. Machine learning, 45, 5-32. 

  2. Cho, H., Goude, Y., Brossat, X. and Yao, Q.(2013). Modeling and forecasting daily electricity load curves: A hybrid approach. Journal of the American Statistical Association, 108, 7-21. 

  3. Dimitriadou, E., Hornik, K., Leisch, F., Meyer, D. and Weingessel, A. (2005). Misc Functions of the Department of Statistics (e1071), TU Wien. R package version 1.5-7, http://CRAN.R-project.org/. 

  4. Fraley, C., Raftery, A. E., Scrucca, L., Murphy, T. B. and Fop, M. (2016). mclust: Normal mixture modelling for model-based clustering, classification, and density estimation, http://CRAN.R-project.org/packagemclust.Rpackageversion,5. 

  5. Hwang, H. M., Lee, S. H., Park, J. B., Park, Y. G., and Son, S. Y. (2015). Load forecasting using hierarchical clustering method for building. Journal of the Korean Institute of Illuminating and Electrical Installation Engineers, 59-65. 

  6. Kang, D. H., Park, J. D. and Song, K. B. (2016). 24-Hour load forecasting for anomalous weather days using hourly temperature. The Transactions of The Korean Institute of Electrical Engineers, 65, 1144-1150. 

  7. Kim, C. H., Koo, B. G. and Park, J. H. (2012). Short-term electric load forecasting using data mining technique. Journal of Electrical Engineering & Technology, 7, 807-813. 

  8. Liaw, A, and Wiener, M. (2002). Classification and regression by randomForest. IR news, 2, 18-22 

  9. Lim, J. H., Kim, S. Y., Park, J. D. and Song, K. B. (2013). Representative temperature assessment for improvement of short-term load forecasting accuracy. Journal of the Korean Institute of Illuminating and Electrical Installation Engineers, 27, 39-43. 

  10. Ma, P., Castillo-Davis, C. I., Zhong, W. and Liu, J. S. (2006). A data-driven clustering method for time course gene expression data. Nucleic Acids Research, 34, 1261-1269. 

  11. MacQueen, J. (1967). Some methods for classification and analysis of multivariate observations. Proceedings of the fifth Berkeley Symposium on Mathematical Statistics and Probability, 1, 281-297. 

  12. Meyer, D., Dimitriadou, E., Hornik, K., Weingessel, A., Leisch, F., Chang, C. C. and Lin, C. C. (2015). Package 'e1071'. The Comprehensive R Archive Network, Available at https://cran.r-project.org/web/packages/e1071/e1071.pdf. 

  13. Park, C. (2016). A simple diagnostic statistic for determining the size of random forest. Journal of the Korean Data & information Science Society, 27, 855-863. 

  14. Scott, A. J. and Symons, M. J. (1971). Clustering methods based on likelihood ratio criteria. Biometrics, 27, 387-397. 

  15. Song, K. B., Baek, Y. S., Hong, D. H., and Jang, G. (2005). Short-term load forecasting for the holidays using fuzzy linear regression method. IEEE transactions on power systems, 20, 96-101. 

  16. Therneau, T., Atkinson, B., Ripley, B., and Ripley, M. B. (2015). Package 'rpart', Available online cran.ma.ic.ac.uk/web/packages/rpart/rpart.pdf. 

  17. Wi, Y. M. and Min, Y. K. (2016). Weekly peak load forecasting using weather stochastic model and weather sensitivity. The Transactions of the Korean Institute of Electrical Engineers, 64, 41-47. 

  18. Yoon, S. H. and Choi, Y. J. (2015). Functional clustering for electricity demand data: A case study. Journal of the Korean Data & information Science Society, 26, 885-894. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로