데이터 시각화 및 탐색적 데이터 분석을 통한 태양광 에너지 예측용 특징벡터 추출 Feature Vector Extraction for Solar Energy Prediction through Data Visualization and Exploratory Data Analysis원문보기
태양광 발전 시스템에서 전력 생산은 기상 상태에 따라 크게 영향을 받으므로 안정적인 부하 운용을 위해 태양광 에너지에 대한 예측이 필수적이다. 따라서 태양광 에너지 예측을 위한 기계학습 알고리즘의 입력으로 기상 상태에 대한 데이터가 필요하다. 본 논문에서는 알고리즘에 대한 입력 데이터로 표면의 3시간 동안 누적된 강수량, 상 하향 장파 복사선 평균, 상 하향 단파 복사선 평균, 지상 2m에서의 3시간 동안 온도, 표면에서의 온도 등 15가지 종류의 기상 데이터를 사용한다. 기상 데이터의 통계적 특성을 파악하고 상관관계를 분석하여 태양광 에너지와 70% 이상의 높은 상관성을 갖는 하향 단파 복사선 평균과 상향 단파 복사선 평균을 특징벡터의 주요 원소로 추출하였다.
태양광 발전 시스템에서 전력 생산은 기상 상태에 따라 크게 영향을 받으므로 안정적인 부하 운용을 위해 태양광 에너지에 대한 예측이 필수적이다. 따라서 태양광 에너지 예측을 위한 기계학습 알고리즘의 입력으로 기상 상태에 대한 데이터가 필요하다. 본 논문에서는 알고리즘에 대한 입력 데이터로 표면의 3시간 동안 누적된 강수량, 상 하향 장파 복사선 평균, 상 하향 단파 복사선 평균, 지상 2m에서의 3시간 동안 온도, 표면에서의 온도 등 15가지 종류의 기상 데이터를 사용한다. 기상 데이터의 통계적 특성을 파악하고 상관관계를 분석하여 태양광 에너지와 70% 이상의 높은 상관성을 갖는 하향 단파 복사선 평균과 상향 단파 복사선 평균을 특징벡터의 주요 원소로 추출하였다.
In solar photovoltaic systems, power generation is greatly affected by the weather conditions, so it is essential to predict solar energy for stable load operation. Therefore, data on weather conditions are needed as inputs to machine learning algorithms for solar energy prediction. In this paper, w...
In solar photovoltaic systems, power generation is greatly affected by the weather conditions, so it is essential to predict solar energy for stable load operation. Therefore, data on weather conditions are needed as inputs to machine learning algorithms for solar energy prediction. In this paper, we use 15 kinds of weather data such as the precipitation accumulated during the 3 hours of the surface, upward and downward longwave radiation average, upward and downward shortwave radiation average, the temperature during the past 3 hours at 2 m above from the ground and temperature from the ground surface as input data to the algorithm. We analyzed the statistical characteristics and correlations of weather data and extracted the downward and upward shortwave radiation averages as a major elements of a feature vector with high correlation of 70% or more with solar energy.
In solar photovoltaic systems, power generation is greatly affected by the weather conditions, so it is essential to predict solar energy for stable load operation. Therefore, data on weather conditions are needed as inputs to machine learning algorithms for solar energy prediction. In this paper, we use 15 kinds of weather data such as the precipitation accumulated during the 3 hours of the surface, upward and downward longwave radiation average, upward and downward shortwave radiation average, the temperature during the past 3 hours at 2 m above from the ground and temperature from the ground surface as input data to the algorithm. We analyzed the statistical characteristics and correlations of weather data and extracted the downward and upward shortwave radiation averages as a major elements of a feature vector with high correlation of 70% or more with solar energy.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 논문에서는 위와 같은 이유로 탐색적 자료분석(Exploratory Data Analysis; EDA)의 시각화를 통해 특징벡터 추출을 목적으로 데이터의 통계적 특성을 파악하고 특징벡터 간 상관관계를 분석하여 연관성을 파악한다. EDA의 시각화는 분석가가 고급의 데이터 분석 지식 없이도 손쉽게 데이터의 특성을 파악할 수 있는 장점이 있다.
본 논문에서는 정확한 태양광 에너지 예측을 위해 사용하는 기계학습 알고리즘의 입력으로 표면의 3시간 동안 누적된 강수량, 상ㆍ하향 장파 복사선 평균, 상ㆍ하향 단파 복사선 평균, 지상 2m에서의 3시간 동안 온도, 표면에서의 온도 등 15가지 종류의 기상 데이터를 사용하여 특징벡터의 주요 원소를 추출하기 위해 기상 데이터의 통계적 특성을 파악하고 상관관계를 분석한다.
본 논문에서는 태양광 에너지 예측을 위해 특징벡터를 추출하는 것이므로 특징벡터와 일일 태양 에너지 간의 상관관계를 분석한다. 태양에너지와 특징벡터 간의 상관관계 그래프를 분석한 결과 특징벡터 dswrf_sfc와 uswrf_sfc가 88%와 82%로 total과 가장 높은 상관관계를 가지고 있어 태양 에너지 예측을 위한 주요 원소로 추출하였다.
대상 데이터
Kaggle은 예측모델 및 분석 대회 플랫폼으로, 기업 및 단체에서 데이터와 해결과제를 등록하면, 데이터 과학자들이 이를 해결하는 모델을 개발하고 경쟁한다. 본 논문에서는 미국 기상 학회 주최로 2013년부터 2014년까지 개최된 태양 에너지 예측경연 대회의 데이터를 사용하였다[4]. 사용된 데이터는 1994년부터 2007년 총 14년 치의 미국 오클라호마지역 중 Chickasha지역의 기상정보 데이터로 그림 1과 같이 표현된다.
본 논문에서는 미국 기상 학회 주최로 2013년부터 2014년까지 개최된 태양 에너지 예측경연 대회의 데이터를 사용하였다[4]. 사용된 데이터는 1994년부터 2007년 총 14년 치의 미국 오클라호마지역 중 Chickasha지역의 기상정보 데이터로 그림 1과 같이 표현된다. 하루 단위의 15개 기상요소로 이루어져 있으며, 데이터 수는 약 75,000개이다.
사용된 데이터는 1994년부터 2007년 총 14년 치의 미국 오클라호마지역 중 Chickasha지역의 기상정보 데이터로 그림 1과 같이 표현된다. 하루 단위의 15개 기상요소로 이루어져 있으며, 데이터 수는 약 75,000개이다.
성능/효과
태양 에너지 예측을 위한 특징벡터 주요 원소 추출 작업은 태양 에너지와 특징벡터 간의 상관관계를 바탕으로 태양 에너지 예측에 가장 영향을 끼치는 특징벡터들을 선별하는 작업으로 예측을 위한 기계학습 알고리즘의 성능 향상과 최소한의 기상 관측 장비를 사용하여 비용적 측면에서 효율성 향상을 기대할 수 있게 한다.
본 논문에서는 태양광 에너지 예측을 위해 특징벡터를 추출하는 것이므로 특징벡터와 일일 태양 에너지 간의 상관관계를 분석한다. 태양에너지와 특징벡터 간의 상관관계 그래프를 분석한 결과 특징벡터 dswrf_sfc와 uswrf_sfc가 88%와 82%로 total과 가장 높은 상관관계를 가지고 있어 태양 에너지 예측을 위한 주요 원소로 추출하였다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.