한석호
(IT Application Research Center, Korea Electronics Technology Institute (KETI))
,
장훈석
(IT Application Research Center, Korea Electronics Technology Institute (KETI))
최근 농촌문제를 해결하기 위해 주목받고 있는 스마트팜은 작물의 생육환경을 최적화하고 효율적인 관리를 통해 작물의 생산성과 품질을 높이는 기술을 의미한다. 이러한 스마트팜에 생육환경 데이터 간 관계를 분석한다면 추가적인 생산성 향상과 작물 관리가 가능할 것이다. 본 논문에서는 온도, 습도, CO2, 토양온도, 토양습도, 일사, 토양EC, EC, pH 9개의 생육환경 데이터를 획득하고, 이를 분석하는 방법을 제안한다. 데이터 획득은 Main board와 Sensor board 간 RS-485 통신을 통해 획득 후 데이터베이스에 저장하였다. 저장된 데이터는 엑셀 시트 형식으로 내려받아 히스토그램, 데이터 차트, 상관관계 히트맵 분석을 진행하였다. 먼저 히스토그램 분석을 통해 전체, 주간, 야간 데이터의 분포를 파악하였고, 주간과 야간을 구분하여 데이터 차트 분석을 통해 월별로 평균, 중앙값, 최소값, 최대값을 파악하여 월별 데이터 변화 추이를 확인했다. 마지막으로 주간과 야간을 구분하여 상관관계 히트맵 분석을 통해 데이터의 상관관계를 파악하였다. 결과 주간에서는 온도와 토양온도, 토양EC와 EC 간에 매우 강한 양의 상관관계를 보였으며, 야간에는 온도와 토양온도, 토양EC와 EC 간에 매우 강한 양의 상관관계, 온도와 토양EC 간에 강한 음의 관계를 확인할 수 있었다.
최근 농촌문제를 해결하기 위해 주목받고 있는 스마트팜은 작물의 생육환경을 최적화하고 효율적인 관리를 통해 작물의 생산성과 품질을 높이는 기술을 의미한다. 이러한 스마트팜에 생육환경 데이터 간 관계를 분석한다면 추가적인 생산성 향상과 작물 관리가 가능할 것이다. 본 논문에서는 온도, 습도, CO2, 토양온도, 토양습도, 일사, 토양EC, EC, pH 9개의 생육환경 데이터를 획득하고, 이를 분석하는 방법을 제안한다. 데이터 획득은 Main board와 Sensor board 간 RS-485 통신을 통해 획득 후 데이터베이스에 저장하였다. 저장된 데이터는 엑셀 시트 형식으로 내려받아 히스토그램, 데이터 차트, 상관관계 히트맵 분석을 진행하였다. 먼저 히스토그램 분석을 통해 전체, 주간, 야간 데이터의 분포를 파악하였고, 주간과 야간을 구분하여 데이터 차트 분석을 통해 월별로 평균, 중앙값, 최소값, 최대값을 파악하여 월별 데이터 변화 추이를 확인했다. 마지막으로 주간과 야간을 구분하여 상관관계 히트맵 분석을 통해 데이터의 상관관계를 파악하였다. 결과 주간에서는 온도와 토양온도, 토양EC와 EC 간에 매우 강한 양의 상관관계를 보였으며, 야간에는 온도와 토양온도, 토양EC와 EC 간에 매우 강한 양의 상관관계, 온도와 토양EC 간에 강한 음의 관계를 확인할 수 있었다.
Smart farms, which have been receiving attention as a solution to recent rural problems, refer to technologies that optimize the growing environment of crops and increase the productivity and quality of crops through efficient management. If the relationships between environmental data in smart farm...
Smart farms, which have been receiving attention as a solution to recent rural problems, refer to technologies that optimize the growing environment of crops and increase the productivity and quality of crops through efficient management. If the relationships between environmental data in smart farms are analyzed, additional productivity enhancement and crop management will be possible. In this paper, we propose a method for acquiring and analyzing nine environmental data, including temperature, humidity, CO2, soil temperature, soil moisture, insolation, soil EC, EC, and pH. Data acquisition is done through RS-485 communication between the main board and the sensor board and stored in the database after acquisition. The stored data is downloaded in Excel sheet format and analyzed through histograms, data charts, and correlation heatmaps. First, we analyze the distribution of total, day, and night data through histogram analysis, and identifiy the average, median, minimum, and maximum values by month through data chart analysis separating day and night to see how the data changes by month. Finally, we analyze the correlation of the data through a correlation heatmap analysis separating day and night. The results show a very strong positive correlation between temperature and soil temperature and soil EC and EC during the day, and a very strong positive correlation between temperature and soil temperature and soil EC and EC at night, and a strong negative correlation between temperature and soil EC.
Smart farms, which have been receiving attention as a solution to recent rural problems, refer to technologies that optimize the growing environment of crops and increase the productivity and quality of crops through efficient management. If the relationships between environmental data in smart farms are analyzed, additional productivity enhancement and crop management will be possible. In this paper, we propose a method for acquiring and analyzing nine environmental data, including temperature, humidity, CO2, soil temperature, soil moisture, insolation, soil EC, EC, and pH. Data acquisition is done through RS-485 communication between the main board and the sensor board and stored in the database after acquisition. The stored data is downloaded in Excel sheet format and analyzed through histograms, data charts, and correlation heatmaps. First, we analyze the distribution of total, day, and night data through histogram analysis, and identifiy the average, median, minimum, and maximum values by month through data chart analysis separating day and night to see how the data changes by month. Finally, we analyze the correlation of the data through a correlation heatmap analysis separating day and night. The results show a very strong positive correlation between temperature and soil temperature and soil EC and EC during the day, and a very strong positive correlation between temperature and soil temperature and soil EC and EC at night, and a strong negative correlation between temperature and soil EC.
본 논문에서는 스마트팜 테스트베드 설치 후 RS-485 통신을 통해 9개의 스마트팜 생육환경 데이터를 획득하고 데이터베이스에 저장하였다. 이후 데이터베이스에서 엑셀 시트 형식으로 내려받아 데이터 분석을 진행하였다.
스마트팜 생육환경 데이터를 획득하기 위해 9개의 센서 (온도, 습도, CO2, 일사, 토양온도, 토양수분, 토양 EC, EC, pH)를 설치하여 테스트베드를 구축하였다. 그림 1은 구축한 스마트팜 테스트베드 사진으로 (a)는 온도, 습도, CO2, 일사 센서 및 노드 사진, (b)는 토양온도, 토양습도, 토양 EC 센서 및 노드, (c)는 EC, pH 노드, (d)는 EC 센서, (e)는 pH 센서 사진이다.
자세한 분석을 위해, 일사 데이터가 자주 측정된 06:00~18:00 시간대를 주간으로, 그 외 시간대를 야간으로 설정하여 주간과 야간 데이터를 구분하여 Fig 6 주간 야간 데이터 비교 히스토그램을 시각화하였다. 온도의 경우 주간이 야간에 비해 25~30℃에 데이터가 많이 분포되어 상대적으로 야간이 온도가 더 낮은 것을 확인할 수 있었고, 습도는 야간에 90~100%에 많이 분포되어있는 야간에 비해 주간은 60~80%에도 데이터가 분포된 것을 확인할 수 있었다.
대상 데이터
2장에서는 생육환경 데이터 획득을 위해 스마트팜 테스트베드 구축 및 데이터 획득을 진행한다.
생육환경 데이터는 6월 20일부터 11월 16일까지 1시간 주기로 획득하였다. 저장된 데이터는 데이터베이스에서 엑셀 시트로 내려받았으며, 데이터 전처리를 통해 누락된 데이터를 제외한 약 3만 개의 데이터를 획득할 수 있었다.
생육환경 데이터는 6월 20일부터 11월 16일까지 1시간 주기로 획득하였다. 저장된 데이터는 데이터베이스에서 엑셀 시트로 내려받았으며, 데이터 전처리를 통해 누락된 데이터를 제외한 약 3만 개의 데이터를 획득할 수 있었다.
Main board와 3개의 Sensor board 간 RS-485 통신을 사용하여 데이터를 송수신하는 방식으로 진행된다. 첫 번째 Sensor board에서는 온도, 습도, CO2, 일사 총 4가지의 데이터를 획득하며, 두 번째 Sensor board에서는 토양온도, 토양수분, 토양 EC 총 3가지의 데이터를 획득하고, 마지막 Sensor board에서는 EC와 pH 2가지의 데이터를 획득한다.
데이터처리
9개의 생육환경 데이터의 분포를 파악하기 위해 히스토그램을 사용하여 시각화하였다.
히스토그램 분석을 통해 전체, 주간, 야간을 구분하여 데이터 분포를 확인하였고, 데이터 차트 분석을 통해 평균, 중앙값, 최소값, 최대값을 파악하여 월별 데이터 변화 추이를 확인하였다. 마지막으로 주간과 야간을 구분하여 상관관계 히트맵 분석을 통해 데이터의 상관관계를 파악하였다. 결과 주간에서는 온도와 토양온도, 토양EC와 EC 간에 매우 강한 양의 상관 관계를 보였으며, 야간에는 온도와 토양온도, 토양EC와 EC 간에 매우 강한 양의 상관관계를 보였으며, 온도와 토양EC 간에 강한 음의 관계를 보였다.
3장에서는 획득한 생육환경 데이터 분석을 진행한다. 분석은 히스토그램 분석, 데이터 차트 분석, 상관 계수 히트맵 분석 순으로 진행된다.
데이터 차트 분석 결과, 온도와 토양온도, 토양EC와 EC 등 월별 데이터 변화가 비슷한 모습을 보이는 생육 환경들 데이터가 있다는 것을 확인할 수 있었다. 이러한 관계를 분석하기 위해 데이터에 상관관계를 계산하고, 상관관계를 한눈에 파악할 수 있도록 주간과 야간을 나눠 데이터 히트맵을 그렸다.
본 논문에서는 스마트팜 테스트베드 설치 후 RS-485 통신을 통해 9개의 스마트팜 생육환경 데이터를 획득하고 데이터베이스에 저장하였다. 이후 데이터베이스에서 엑셀 시트 형식으로 내려받아 데이터 분석을 진행하였다. 히스토그램 분석을 통해 전체, 주간, 야간을 구분하여 데이터 분포를 확인하였고, 데이터 차트 분석을 통해 평균, 중앙값, 최소값, 최대값을 파악하여 월별 데이터 변화 추이를 확인하였다.
이후 데이터베이스에서 엑셀 시트 형식으로 내려받아 데이터 분석을 진행하였다. 히스토그램 분석을 통해 전체, 주간, 야간을 구분하여 데이터 분포를 확인하였고, 데이터 차트 분석을 통해 평균, 중앙값, 최소값, 최대값을 파악하여 월별 데이터 변화 추이를 확인하였다. 마지막으로 주간과 야간을 구분하여 상관관계 히트맵 분석을 통해 데이터의 상관관계를 파악하였다.
히스토그램을 이용하여 데이터 분포를 확인한 후, 주간과 야간을 구분하여 월별 평균, 중앙값, 최솟값, 최댓값을 계산하고 이를 차트로 시각화하여 데이터 변화 추이를 분석하였다. 차트에서 파란색 평균, 주황색은 중앙값, 회색은 최솟값, 노란색은 최댓값을 나타낸다.
성능/효과
CO2 데이터 분석 결과, 주간과 야간 평균과 중앙값이 6월부터 11월까지 서서히 하락하는 모습을 확인할 수 있었으며, 야간이 주간에 비해 높은 중앙값과 최소값, CO2 농도를 유지하는 것을 확인할 수 있었다. 최댓값은 8월까지는 야간이 더 높았지만, 9월부터는 미세한 차이로 주간이 더 높은 것을 확인할 수 있었다.
EC 데이터 분석 결과, 주간과 야간의 차트가 토양EC와 비슷한 모습을 보이는 것을 확인할 수 있었다. 또한 7월의 최댓값을 제외하면 주간과 야간의 평균, 중앙값, 최솟값, 최댓값 모두 큰 차이가 없는 것을 확인할 수 있었다.
pH 데이터 분석 결과, 8월 최솟값을 제외하면 앞선 토양EC, EC와 같이 주간과 야간의 평균, 중앙값, 최솟값, 최댓값 모두 큰 차이가 없는 것을 확인할 수 있었으며, 6월부터 11월까지 천천히 평균이 하락하는 것을 확인할 수 있었다.
마지막으로 주간과 야간을 구분하여 상관관계 히트맵 분석을 통해 데이터의 상관관계를 파악하였다. 결과 주간에서는 온도와 토양온도, 토양EC와 EC 간에 매우 강한 양의 상관 관계를 보였으며, 야간에는 온도와 토양온도, 토양EC와 EC 간에 매우 강한 양의 상관관계를 보였으며, 온도와 토양EC 간에 강한 음의 관계를 보였다. 본 연구에서는 단기간 데이터를 분석하여 얻은 결과를 바탕으로 진행하였기에 생육환경 데이터의 상관관계를 파악하였으나, 더 정확한 결과를 얻기 위해서는 장기간 데이터 획득 및 분석이 필요하다.
데이터 차트 분석 결과, 온도와 토양온도, 토양EC와 EC 등 월별 데이터 변화가 비슷한 모습을 보이는 생육 환경들 데이터가 있다는 것을 확인할 수 있었다. 이러한 관계를 분석하기 위해 데이터에 상관관계를 계산하고, 상관관계를 한눈에 파악할 수 있도록 주간과 야간을 나눠 데이터 히트맵을 그렸다.
습도 데이터 분석 결과, 온도 데이터와 달리 주간과 야간의 평균과 중앙값이 월별로 일정하게 유지되는 것을 확인할 수 있었다. 주간의 월별 평균 습도는 74%~83%, 야간의 월별 평균 습도는 89%~97%로 야간이 주간에 비해 높은 평균 습도를 유지하였으며, 최솟값과 최댓값 간격 역시 야간이 주간보다 더 안정적인 습도를 유지하는 것을 확인할 수 있었다.
주간 상관계수 분석 결과, 온도와 토양온도, 토양 EC와 EC 간에는 매우 강한 양의 상관관계, 온도와 일사, 습도와 CO2, CO2와 pH 간에는 중간 정도의 양의 상관관계를 보였다. 습도와 일사, CO2와 토양 수분, 토양온도와 토양EC, 토양온도와 EC, 토양EC와 pH, EC와 pH에는 중간 정도의 음의 상관관계가 보였으며, 그 외 데이터는 약하거나 매우 약하거나, 거의 없는 양(음)의 상관관계를 보였다.
야간 상관계수 분석 결과, 주간과 같게 온도와 토양 온도, 토양EC와 EC 간에는 매우 강한 양의 상관관계를 보였고, 온도와 토양EC 간에는 강한 음의 관계를 보였다. CO2와 pH 간에는 중간 정도의 양의 상관관계, 온도와 EC, 토양온도와 토양EC, 토양온도와 EC, 토양EC와 pH, EC와 pH 간에는 중간 정도의 음의 상관관계를 보였으며, 그 외 데이터는 약하거나 매우 약하거나, 거의 없는 양(음)의 상관관계를 보였다.
온도 데이터 분석 결과, 주간과 야간 평균은 6월부터 8월까지 일정하게 유지하다 이후 9월부터 11월까지 하락하는 것을 확인할 수 있었다. 최솟값과 최댓값을 비교해보면 주간이 야간에 비해 일교차가 큰 것을 확인할 수 있었다.
자세한 분석을 위해, 일사 데이터가 자주 측정된 06:00~18:00 시간대를 주간으로, 그 외 시간대를 야간으로 설정하여 주간과 야간 데이터를 구분하여 Fig 6 주간 야간 데이터 비교 히스토그램을 시각화하였다. 온도의 경우 주간이 야간에 비해 25~30℃에 데이터가 많이 분포되어 상대적으로 야간이 온도가 더 낮은 것을 확인할 수 있었고, 습도는 야간에 90~100%에 많이 분포되어있는 야간에 비해 주간은 60~80%에도 데이터가 분포된 것을 확인할 수 있었다. CO2는 주간의 경우 150~300ppm, 야간은 200~350ppm에 분포된 것을 확인할 수 있었다.
주간 상관계수 분석 결과, 온도와 토양온도, 토양 EC와 EC 간에는 매우 강한 양의 상관관계, 온도와 일사, 습도와 CO2, CO2와 pH 간에는 중간 정도의 양의 상관관계를 보였다. 습도와 일사, CO2와 토양 수분, 토양온도와 토양EC, 토양온도와 EC, 토양EC와 pH, EC와 pH에는 중간 정도의 음의 상관관계가 보였으며, 그 외 데이터는 약하거나 매우 약하거나, 거의 없는 양(음)의 상관관계를 보였다.
습도 데이터 분석 결과, 온도 데이터와 달리 주간과 야간의 평균과 중앙값이 월별로 일정하게 유지되는 것을 확인할 수 있었다. 주간의 월별 평균 습도는 74%~83%, 야간의 월별 평균 습도는 89%~97%로 야간이 주간에 비해 높은 평균 습도를 유지하였으며, 최솟값과 최댓값 간격 역시 야간이 주간보다 더 안정적인 습도를 유지하는 것을 확인할 수 있었다.
토양EC 데이터 분석 결과, 7월과 9월의 최댓값을 제외하면 주간과 야간의 평균, 중앙값, 최솟값, 최댓값 모두 큰 차이가 없는 것을 확인할 수 있었다. 주간과 야간 평균은 6월부터 8월까지 하락 후, 9월부터 10월까지 상승하였으며, 이후 11월에 다시 하락하는 모습을 확인할 수 있었다.
토양수분 데이터 분석 결과, 9월을 제외한 평균, 중앙값, 최솟값, 최댓값 모두 주간과 야간의 차이가 거의 없는 것을 확인할 수 있었으며, 데이터의 변동성이 적었다. 주간과 야간 평균 25%~28%를 유지하는 것을 확인할 수 있었다.
후속연구
본 연구에서는 단기간 데이터를 분석하여 얻은 결과를 바탕으로 진행하였기에 생육환경 데이터의 상관관계를 파악하였으나, 더 정확한 결과를 얻기 위해서는 장기간 데이터 획득 및 분석이 필요하다. 따라서 추후 연구에서는 장기간 데이터 획득을 통해 더 자세하고 정확한 분석을 진행할 예정이다.
결과 주간에서는 온도와 토양온도, 토양EC와 EC 간에 매우 강한 양의 상관 관계를 보였으며, 야간에는 온도와 토양온도, 토양EC와 EC 간에 매우 강한 양의 상관관계를 보였으며, 온도와 토양EC 간에 강한 음의 관계를 보였다. 본 연구에서는 단기간 데이터를 분석하여 얻은 결과를 바탕으로 진행하였기에 생육환경 데이터의 상관관계를 파악하였으나, 더 정확한 결과를 얻기 위해서는 장기간 데이터 획득 및 분석이 필요하다. 따라서 추후 연구에서는 장기간 데이터 획득을 통해 더 자세하고 정확한 분석을 진행할 예정이다.
참고문헌 (6)
M. S, Choi, "A Study on the Efficient Implementation Method of Cloud-based Smart Farm Control System", Journal of Digital Convergence, vol. 18, no. 3, pp. 171-177, December, 2020
T. Y. Ju, S. C. Kim, E. K. Kim, "Development of a Low Cost Smart Farm System for Cultivating High Value-added Specialized Crops", The Journal of the Korea Institute of Electronic Communication Sciences, vol. 16, no. 4, pp. 743-748, August, 2021
K. B. Min, H. J. Park, "A Study on the Patent Trend of 'Smart Farm' in Domestic through Network Analysis", Journal of Korea Institute of Information, Electronics, and Communication Technology, vol. 15, no. 5, pp. 413-422, October, 2022
H. K. Choi, H. H. Ahn, Y. N. Jeong, B. K. Lee, "A Smart Farm Environment Optimization and Yield Prediction Platform based on IoT and Deep Learning", Journal of Korea Institute of Information, Electronics, and Communication Technology, vol. 12, no. 6, pp. 672-680, December, 2019
Mukaka, Mavuto M, "A guide to appropriate use of correlation coefficient in medical research.", Malawi medical journal, vol. 24, no. 3, pp. 69-71, September, 2012
Ratner, Bruce, "The correlation coefficient: Its values range between +1/-1, or do they?", Journal of targeting, measurement and analysis for marketing, vol. 17, no. 2, pp. 139-142, May, 2009
※ AI-Helper는 부적절한 답변을 할 수 있습니다.