최근 사물 인터넷 센서가 설치된 스마트 돈사의 보급을 통해 돈사 관련 빅데이터 축적이 가능해졌고, 다양한 기계 학습방안들이 수집된 데이터에 적용되어 축산농가의 생산성을 향상시키고 있다. 본 연구에서는 다양한 기계학습 방안을 이용하여 돈사관리에서 가장 중요한 요소 중 하나인 급수량을 예측하였다. 구체적으로 실제 돈사에서 수집된 데이터에 회귀 방안인 선형회귀, 회귀트리 및 아다부스트 회귀 방안과 분류 방안인 로지스틱 분류, 결정트리 및 서포트 벡터 머신 (SVM) 분류방안을 적용하여 돈사의 온도와 습도를 기반으로 급수량을 예측하였다. 성능 분석을 통해서 제안한 방안이 높은 정확도로 급수량을 예측하는 것을 확인할 수 있었다. 제안한 방안은 돈사의 급수시설 이상을 조기에 파악하는데 활용되어 가축을 폐사를 막고 돈사 생산성을 높이는데 활용될 수 있다.
최근 사물 인터넷 센서가 설치된 스마트 돈사의 보급을 통해 돈사 관련 빅데이터 축적이 가능해졌고, 다양한 기계 학습방안들이 수집된 데이터에 적용되어 축산농가의 생산성을 향상시키고 있다. 본 연구에서는 다양한 기계학습 방안을 이용하여 돈사관리에서 가장 중요한 요소 중 하나인 급수량을 예측하였다. 구체적으로 실제 돈사에서 수집된 데이터에 회귀 방안인 선형회귀, 회귀트리 및 아다부스트 회귀 방안과 분류 방안인 로지스틱 분류, 결정트리 및 서포트 벡터 머신 (SVM) 분류방안을 적용하여 돈사의 온도와 습도를 기반으로 급수량을 예측하였다. 성능 분석을 통해서 제안한 방안이 높은 정확도로 급수량을 예측하는 것을 확인할 수 있었다. 제안한 방안은 돈사의 급수시설 이상을 조기에 파악하는데 활용되어 가축을 폐사를 막고 돈사 생산성을 높이는데 활용될 수 있다.
Recently, accumulation of data on pig farm is enabled through the wide spread of smart pig farm equipped with Internet-of-Things based sensors, and various machine learning algorithms are applied on the data in order to improve the productivity of pig farm. Herein, multiple machine learning schemes ...
Recently, accumulation of data on pig farm is enabled through the wide spread of smart pig farm equipped with Internet-of-Things based sensors, and various machine learning algorithms are applied on the data in order to improve the productivity of pig farm. Herein, multiple machine learning schemes are used to predict the water usage in pig farm which is known to be one of the most important element in pig farm management. Especially, regression algorithms, which are linear regression, regression tree and AdaBoost regression, and classification algorithms which are logistic classification, decision tree and support vector machine, are applied to derive a prediction scheme which forecast the water usage based on the temperature and humidity of pig farm. Through performance evaluation, we find that the water usage can be predicted with high accuracy. The proposed scheme can be used to detect the malfunction of water system which prevents the death of pigs and reduces the loss of pig farm.
Recently, accumulation of data on pig farm is enabled through the wide spread of smart pig farm equipped with Internet-of-Things based sensors, and various machine learning algorithms are applied on the data in order to improve the productivity of pig farm. Herein, multiple machine learning schemes are used to predict the water usage in pig farm which is known to be one of the most important element in pig farm management. Especially, regression algorithms, which are linear regression, regression tree and AdaBoost regression, and classification algorithms which are logistic classification, decision tree and support vector machine, are applied to derive a prediction scheme which forecast the water usage based on the temperature and humidity of pig farm. Through performance evaluation, we find that the water usage can be predicted with high accuracy. The proposed scheme can be used to detect the malfunction of water system which prevents the death of pigs and reduces the loss of pig farm.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
하지만 현재 돈사의 급수와 관련된 연구는 주로 폐수처리 시설 쪽에 집중이 되어있고[8] 환경데이터를 기반으로 음수량을 예측하는 방안은 현재 연구되지 않았다. 따라서 본 연구에서는 실제 양돈농가에서 수집된 데이터에 다양한 기계학습 방안들을 적용하여 돈사 급수량을 예측하는 방안을 제안한다.
본 연구에서는 스마트돈사에서 수집된 온도 및 습도 데이터를 기반으로 다양한 기계학습 방안을 이용하여 돈사의 급수량을 예측하는 방안을 제안하였다. 선형 회귀, 회귀 트리 및 아다부스트 회귀방식을 이용하여 급수량을 예측하는 방안과 로지스틱 분류, 결정트리 및 서포트 벡터 머신을 이용하여 이진 급수량 데이터를 예측하는 방식을 고려하였다.
본 연구에서는 회귀방식(Regression)과 분류방식(Classification)의 기계학습 방안을 이용하여 분석을 진행하였다. 회귀방식 알고리즘에서는 돈사급수량을 정확하게 예측하는 것을 목표로 하였고 분류방식 알고리즘에서는 이진데이터인 Water_bin을 정확하게 예측하는 것을 목표로 하였다.
제안 방법
또한 해당 날짜에 수집된 온도와 습도 데이터도 사용하였다. 각 날짜에서 5분 간격으로 수집된 온도와 습도 데이터 중 각 날짜의 최대/최소/평균 데이터만을 사용하였다 (Temp_avg, Temp_max, Temp_min, Hum_avg,Hum_max, Hum_min). 또한 본 연구에서는 회귀방식(Regression) 기반의 급수량 예측뿐만이 아니라 분류방식 (Classification) 기반의 급수량 예측도 진행하였다.
개발된 예측방안의 성능을 좀 더 자세히 살펴보기 위해 실제 돈사급수량과 예측된 급수량을 비교하였다. 성능비교는 그림 3에 표시하였다.
결정트리는 트리알고리즘을 분류에 사용한 방식이고 서포트 벡터 머신 방안에서는 선형커널을 사용하여 분류를 하도록 학습시켰다. 분류 방안에서는 성능분석지표로 정밀도 (precision)와 재현율 (recall) 및 이 두 값을 평균한 F1-score를 사용하였다.
다음으로 분류방안의 성능분석을 진행하였다. 로지스틱 분류방안에서 평균온도, 최대온도, 최소온도, 평균습도, 최대습도, 최소습도에 대응하는 계수는 각각 0.
각 날짜에서 5분 간격으로 수집된 온도와 습도 데이터 중 각 날짜의 최대/최소/평균 데이터만을 사용하였다 (Temp_avg, Temp_max, Temp_min, Hum_avg,Hum_max, Hum_min). 또한 본 연구에서는 회귀방식(Regression) 기반의 급수량 예측뿐만이 아니라 분류방식 (Classification) 기반의 급수량 예측도 진행하였다. 분류방식 기계학습방안에서는 분류기준을 3500L로 설정하여 급수량이 3500L이하일 경우에는 0, 초과일 경우에는 1로 두었다 (Water_bin).
마지막으로 개발된 예측방안의 성능을 좀 더 자세히 살펴보기 위해 실제 돈사급수량(이진데이터)과 예측된 이진 데이터값을 비교하였다. 성능비교는 그림 5에 나타냈다.
본 연구에서는 회귀방식(Regression)과 분류방식(Classification)의 기계학습 방안을 이용하여 분석을 진행하였다. 회귀방식 알고리즘에서는 돈사급수량을 정확하게 예측하는 것을 목표로 하였고 분류방식 알고리즘에서는 이진데이터인 Water_bin을 정확하게 예측하는 것을 목표로 하였다.
또한 본 연구에서는 회귀방식(Regression) 기반의 급수량 예측뿐만이 아니라 분류방식 (Classification) 기반의 급수량 예측도 진행하였다. 분류방식 기계학습방안에서는 분류기준을 3500L로 설정하여 급수량이 3500L이하일 경우에는 0, 초과일 경우에는 1로 두었다 (Water_bin). 본 연구에서 활용한 데이터의 통계적 특성은 표1에 나타내었다.
본 연구에서는 스마트돈사에서 수집된 온도 및 습도 데이터를 기반으로 다양한 기계학습 방안을 이용하여 돈사의 급수량을 예측하는 방안을 제안하였다. 선형 회귀, 회귀 트리 및 아다부스트 회귀방식을 이용하여 급수량을 예측하는 방안과 로지스틱 분류, 결정트리 및 서포트 벡터 머신을 이용하여 이진 급수량 데이터를 예측하는 방식을 고려하였다. 성능분석을 통해 제안 방안이 높은 정확도로 급수량을 예측하는 것을 확인하였다.
우선 회귀방식의 성능분석을 진행하였다. 선형회귀방식의 경우 급수량이 –45𐤟Temp_avg + 165𐤟Temp_max + 75𐤟Temp _min - 48𐤟Hum _avg + 51𐤟Hum _max +13𐤟Hum_min - 2731 으로 예측이 되었다.
회귀방식 알고리즘으로는 선형회귀 (Linear regression), 회귀트리 (Regression Tree) 및 아다부스트(AdaBoost regression) 회귀방안을 고려하였다. 선형회귀 방식은 환경데이터의 선형방정식으로 예측 식을 도출하는 방식이다.
대상 데이터
전체 데이터 중 90%는 학습에 사용하고 나머지 10%의 데이터를 이용하여 성능을 분석하였고, 정확도 분석에는 10-Fold 교차검증을 사용하였다. 결과분석에서는 총 173개의 인스턴스를 사용하였다. 돈사급수량을 예측한 기존의 연구가 없으므로 본 연구에서 제안한 방안들의 성능만 분석하였다.
음수량 데이터는 10분 간격으로 측정되었고 각 날짜의 최종 음수량만을 사용하였다(Water). 또한 해당 날짜에 수집된 온도와 습도 데이터도 사용하였다. 각 날짜에서 5분 간격으로 수집된 온도와 습도 데이터 중 각 날짜의 최대/최소/평균 데이터만을 사용하였다 (Temp_avg, Temp_max, Temp_min, Hum_avg,Hum_max, Hum_min).
본 연구에서는 B농장의 육성비육돈사에서 2016년 2월 3일부터 2016년 8월 1일까지의 수집된 환경 데이터를 사용하였다. 음수량 데이터는 10분 간격으로 측정되었고 각 날짜의 최종 음수량만을 사용하였다(Water).
데이터처리
결과분석에서는 총 173개의 인스턴스를 사용하였다. 돈사급수량을 예측한 기존의 연구가 없으므로 본 연구에서 제안한 방안들의 성능만 분석하였다.
본 장에서는 기계학습 방안을 이용하여 개발된 돈사급수량 예측방안의 성능을 분석한다. 전체 데이터 중 90%는 학습에 사용하고 나머지 10%의 데이터를 이용하여 성능을 분석하였고, 정확도 분석에는 10-Fold 교차검증을 사용하였다. 결과분석에서는 총 173개의 인스턴스를 사용하였다.
회귀방안에서는 성능분석 지표로 평균제곱근 오차(MSE) 및 R2-score를 사용하였다. 실제급수량이 Y이고 예측된 급수량이 Ŷ일 때 평균 제곱근 오차는 다음과 같이 계산할 수 있다.
이론/모형
마지막으로 아다부스트는 기계학습메타알고리즘으로 잘못 예측된 샘플을 적응적으로 수정하여 더 좋은 성능을 보이는 앙상블 알고리즘이다. 본 연구에서 고려한 아다부스트 방안에서는 base classifier로 선형회귀트리를 사용하였다.
결정트리는 트리알고리즘을 분류에 사용한 방식이고 서포트 벡터 머신 방안에서는 선형커널을 사용하여 분류를 하도록 학습시켰다. 분류 방안에서는 성능분석지표로 정밀도 (precision)와 재현율 (recall) 및 이 두 값을 평균한 F1-score를 사용하였다.
분류방식 알고리즘으로는 로지스틱 분류, 결정트리 및 서포트 벡터 머신 (SVM) 방안을 사용하였다. 로지스틱 분류방식은 아래와 같은 로지스틱 함수를 이용하여 0/1의 바이너리 결과를 예측한다.
성능/효과
산점도에서 확인할 수 있듯이 평균온도 및 습도와 돈사급수량이 양의 상관관계(positive correlation)를 가지고 있는 것을 확인할 수 있고 상관도가 큰 것을 확인할 수 있다. 또한 습도와 온도도 양의 상관관계를 가지는 것을 확인할 수 있다.
다음으로 분류방안의 성능분석을 진행하였다. 로지스틱 분류방안에서 평균온도, 최대온도, 최소온도, 평균습도, 최대습도, 최소습도에 대응하는 계수는 각각 0.38, 0.66, -0.25, -0.31, 0.2, 0.11 로 계산되었고 이를 통해서 돈사급수량에 가장 큰 영향을 주는 환경요소는 돈사 최대 온도임을 확인할 수 있다. 결정트리방안의 경우 아래의 그림과 같은 트리구조를 구할 수 있었다.
산점도에서는 평균온도/평균습도만을 사용하였고 주대각선 (diagonal)에는 누적분포함수를 표시하였다. 산점도에서 확인할 수 있듯이 평균온도 및 습도와 돈사급수량이 양의 상관관계(positive correlation)를 가지고 있는 것을 확인할 수 있고 상관도가 큰 것을 확인할 수 있다. 또한 습도와 온도도 양의 상관관계를 가지는 것을 확인할 수 있다.
선형회귀방식의 경우 급수량이 –45𐤟Temp_avg + 165𐤟Temp_max + 75𐤟Temp _min - 48𐤟Hum _avg + 51𐤟Hum _max +13𐤟Hum_min - 2731 으로 예측이 되었다. 선형 회귀식을 통해 돈사급수량이 일최대온도에 가장 큰 영향을 받는 것을 확인할 수 있다. 회귀트리방안의 경우 아래의 그림 2와 같은 트리구조를 구할 수 있었다.
그림 5에서 가로축은 테스트에 사용된 인스턴스들의 인덱스를 의미한다. 성능분석에서 확인할 수 있듯이 로지스틱 분류방식과 결정트리 방식은 실제 돈사급수량을 잘 예측하는 것을 확인할 수 있다. 다만 서포트 벡터 머신기반의 분류방안은 모든 경우 1로 예측하는 것을 확인할 수 있다.
그림 3에서 가로축은 테스트에 사용된 인스턴스들의 인덱스를 의미한다. 성능분석에서 확인할 수 있듯이 본 연구에서 사용한 3가지 방식 모두 실제 돈사급수량을 잘 예측하는 것을 확인할 수 있다.
선형 회귀, 회귀 트리 및 아다부스트 회귀방식을 이용하여 급수량을 예측하는 방안과 로지스틱 분류, 결정트리 및 서포트 벡터 머신을 이용하여 이진 급수량 데이터를 예측하는 방식을 고려하였다. 성능분석을 통해 제안 방안이 높은 정확도로 급수량을 예측하는 것을 확인하였다. 제안 방안의 사용을 통해서 양돈농가에 큰 영향을 미치는 급수시설의 문제를 조기에 파악가능하고 이를 통해 양돈의 생산성을 향상시킬 수 있다.
표 1의 환경 데이터에서 확인할 수 있듯이 온도는 평균 28도를 유지하는 것을 볼 수 있고 표준편차가 작으므로 돈사 내 온도변화가 크지 않는 것을 확인할 수 있다. 습도는 평균 60% 정도를 유지하고 온도에 비해서 변화량이 큰 것을 확인할 수 있다.
다만 서포트 벡터 머신기반의 분류방안은 모든 경우 1로 예측하는 것을 확인할 수 있다. 이를 통해서 선형 서포트 벡터 머신보다는 로지스틱 분류나 결정트리 방식이 좀 더 좋은 성능을 보이는 것을 확인할 수 있다.
성능분석을 통해 제안 방안이 높은 정확도로 급수량을 예측하는 것을 확인하였다. 제안 방안의 사용을 통해서 양돈농가에 큰 영향을 미치는 급수시설의 문제를 조기에 파악가능하고 이를 통해 양돈의 생산성을 향상시킬 수 있다.
특히 88% 이상의 높은 정확도로 돈사급수량을 예측하는 것을 확인할 수 있고 이를 통해 제안방안이 실제 양돈농가에서 효율적으로 활용될 수 있을 것으로 예측할 수 있다.
분류 방식들의 성능을 표 3에 나타내었다. 표에서 확인할 수 있듯이 로지스틱 분류방식이 가장 좋은 성능을 보이는 것을 확인할 수 있다.
선형회귀 방식의 성능을 표2에 나타냈다. 표에서 확인할 수 있듯이 아다부스트 회귀방식이 가장 좋은 성능지표를 보이는 것을 확인할 수 있고 모든 방안에서 높은 정확도로 물사용량을 예측하는 것을 확인할 수 있다.
질의응답
핵심어
질문
논문에서 추출한 답변
선형회귀 방식이란?
회귀방식 알고리즘으로는 선형회귀 (Linear regression), 회귀트리 (Regression Tree) 및 아다부스트(AdaBoost regression) 회귀방안을 고려하였다. 선형회귀 방식은 환경데이터의 선형방정식으로 예측 식을 도출하는 방식이다. 선형회귀 방식에서는 Ŷ가 예측 값이고 Xi가 각 환경요소일 때 계수 Wi와 바이어스 B를 구하고 아래의 식과 같이 값을 예측한다.
스마트 돈사의 보금이 점차 빨라지고 있는 이유는?
최근 농가의 생산성을 높이기 위해 다양한 사물 인터넷 센서들이 설치된 스마트 돈사가 확대 보급되고 있다. 특히 사물인터넷 센서들의 가격이 점차 낮아지면서 스마트 돈사의 보급이 점차 빨라지고 있는 추세이다. 스마트 돈사는 설치되어 있는 다양한 센서들을 이용하여 온도, 습도, 풍속, 이산화탄소, 암모니아 등 다양한 환경요소들을 측정할 수 있을 뿐만이 아니라 환경요소를 실시간으로 모니터링 및 수집 할 수 있다.
온도 및 습도 데이터를 기반으로 다양한 기계학습 방안을 이용하여 돈사의 급수량을 예측하기 위해 어떤 방식을 사용하였는가?
본 연구에서는 스마트돈사에서 수집된 온도 및 습도 데이터를 기반으로 다양한 기계학습 방안을 이용하여 돈사의 급수량을 예측하는 방안을 제안하였다. 선형 회귀, 회귀 트리 및 아다부스트 회귀방식을 이용하여 급수량을 예측하는 방안과 로지스틱 분류, 결정트리 및 서포트 벡터 머신을 이용하여 이진 급수량 데이터를 예측하는 방식을 고려하였다. 성능분석을 통해 제안 방안이 높은 정확도로 급수량을 예측하는 것을 확인하였다.
참고문헌 (8)
K. Han, W. Lee, and K. Sung, "Development of a model to analyze the relationship between smart pig-farm environmental data and daily weight increase based on decision tree," Journal of Korea Institute of information and communication engineering, vol. 20, no. 12, pp.2348-2354, Dec. 2016.
M. S. Lee and Y.C. Choe, "Forecasting Sow's Productivity using the Machine Learning Models," Journal of Agricultural Extension & Community Development, vol. 16, no. 4, pp. 939-965, Dec. 2009.
S. Shahinfar, D. Page, J. Guenther, V. Cabrera, P. Fricke and K. Weigel, "Prediction of insemination outcomes in Holstein dairy cattle using alternative machine learning algorithms," Journal of dairy science, vol. 97, no. 2, pp.731-742, Feb. 2014.
W. Lee, S. Kim, J. Ryu, and T. Ban, "Fast Detection of Disease in Livestock based on Deep Learning," Journal of Korea Institute of information and communication engineering, vol. 21, no. 5, pp.1009-1015, May 2017.
M. A. Kashiha, C. Bahr, S. Ott, C. P. Moons, T. A. Niewold, F. Tuyttens and D. Berckmans, "Automatic monitoring of pig locomotion using image analysis," Livestock Science, vol. 159, no. 1, pp.141-148, Jan. 2014.
S. J. Roberts, R. Cain and M. S. Dawkins, "Prediction of welfare outcomes for broiler chickens using Bayesian regression on continuous optical flow data," Journal of the Royal Society interface, vol. 9, no. 77, pp.3436-3443, Sep. 2012.
K. Kim, K. Kim, J. Kim, K. Seol, J. Hong, Y. Jung, J. Park, and Y. Kim, "Changes of serum electrolytes and hematological profiles in Yorkshire at a high ambient temperature" Journal of Agriculture and Life Science, vol. 49, no. 1, pp.103-113, Nov. 2014.
B. Fridrich, D. Krcmar, B. Dalmacija, J. Molnar, V. Pesic, M. Kragulj, and N. Varga, "Impact of wastewater from pig farm lagoons on the quality of local groundwater," Agricultural Water Management, vol. 135, no. 1, pp. 40-53, Mar. 2014.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.