최근에 머신 러닝 기술은 의료, 제조, 마케팅, 금융, 방송, 농업 등 사회 전반에 많은 영향을 미치고 있고 미래에도 인류의 생활에 많은 도움을 줄 것으로 예상된다. 본 논문에서는 인류의 생존에 가장 큰 영향을 주는 먹거리 즉, 농업 분야에 머신러닝기술을 적용하는 방법을 연구한다. 농업 분야에 IoT(Internet of Things) 기술을 접목하는 스마트 팜 (Smart Farm) 분야는 생육환경을 실시간으로 모니터링 하여 농작물의 생육환경을 최적으로 유지 하는 방법을 중점적으로 연구한다. 최근 KT에서 출시된 기가 스마트 팜 솔루션 2.0 에서는 머신러닝 기술을 사용하여 온실내의 온습도를 최적으로 유지하는 기술에 머신러닝을 적용하였다. 기존의 스마트 팜 분야 연구가 생육환경 조절에 중점을 두어 생산성 증대에 집중되어 있지만 본 연구에서는 과일을 최상의 품질 상태에서 수확하여 좋은 가격으로 출하할 수 있도록 수확시기에 머신러닝을 적용하는 방법을 연구한다. 스마트 팜 분야에 머신러닝 기술을 적용하기 위해서는 풍부한 빅 데이터의 확보가 무엇보다 중요하므로 정확한 머신러닝 기술을 적용하기 위해서는 지속적으로 빅 데이터 수집이 가능해야 한다. 본 논문에서 수확시기 예측에 필요한 인자로는 온실 내에서 재배되는 과일의 색상 값과 무게 값, 내부 온습도 값을 색상센서 와 무게센서, 온습도센서를 사용하여 실시간으로 수집하여 확보한다. 본 논문에서 제안하는 FPSML은 유사 과일 재배에 반복적으로 사용할 수 있는 아키텍처를 제공하며 지속적으로 빅 데이터가 축적될수록 보다 정밀한 수확시기를 예측할 수 있다.
최근에 머신 러닝 기술은 의료, 제조, 마케팅, 금융, 방송, 농업 등 사회 전반에 많은 영향을 미치고 있고 미래에도 인류의 생활에 많은 도움을 줄 것으로 예상된다. 본 논문에서는 인류의 생존에 가장 큰 영향을 주는 먹거리 즉, 농업 분야에 머신러닝기술을 적용하는 방법을 연구한다. 농업 분야에 IoT(Internet of Things) 기술을 접목하는 스마트 팜 (Smart Farm) 분야는 생육환경을 실시간으로 모니터링 하여 농작물의 생육환경을 최적으로 유지 하는 방법을 중점적으로 연구한다. 최근 KT에서 출시된 기가 스마트 팜 솔루션 2.0 에서는 머신러닝 기술을 사용하여 온실내의 온습도를 최적으로 유지하는 기술에 머신러닝을 적용하였다. 기존의 스마트 팜 분야 연구가 생육환경 조절에 중점을 두어 생산성 증대에 집중되어 있지만 본 연구에서는 과일을 최상의 품질 상태에서 수확하여 좋은 가격으로 출하할 수 있도록 수확시기에 머신러닝을 적용하는 방법을 연구한다. 스마트 팜 분야에 머신러닝 기술을 적용하기 위해서는 풍부한 빅 데이터의 확보가 무엇보다 중요하므로 정확한 머신러닝 기술을 적용하기 위해서는 지속적으로 빅 데이터 수집이 가능해야 한다. 본 논문에서 수확시기 예측에 필요한 인자로는 온실 내에서 재배되는 과일의 색상 값과 무게 값, 내부 온습도 값을 색상센서 와 무게센서, 온습도센서를 사용하여 실시간으로 수집하여 확보한다. 본 논문에서 제안하는 FPSML은 유사 과일 재배에 반복적으로 사용할 수 있는 아키텍처를 제공하며 지속적으로 빅 데이터가 축적될수록 보다 정밀한 수확시기를 예측할 수 있다.
Recently, machine learning technology has had a significant impact on society, particularly in the medical, manufacturing, marketing, finance, broadcasting, and agricultural aspects of human lives. In this paper, we study how to apply machine learning techniques to foods, which have the greatest inf...
Recently, machine learning technology has had a significant impact on society, particularly in the medical, manufacturing, marketing, finance, broadcasting, and agricultural aspects of human lives. In this paper, we study how to apply machine learning techniques to foods, which have the greatest influence on the human survival. In the field of Smart Farm, which integrates the Internet of Things (IoT) technology into agriculture, we focus on optimizing the crop growth environment by monitoring the growth environment in real time. KT Smart Farm Solution 2.0 has adopted machine learning to optimize temperature and humidity in the greenhouse. Most existing smart farm businesses mainly focus on controlling the growth environment and improving productivity. On the other hand, in this study, we are studying how to apply machine learning with respect to harvest time so that we will be able to harvest fruits of the highest quality and ship them at an excellent cost. In order to apply machine learning techniques to the field of smart farms, it is important to acquire abundant voluminous data. Therefore, to apply accurate machine learning technology, it is necessary to continuously collect large data. Therefore, the color, value, internal temperature, and moisture of greenhouse-grown fruits are collected and secured in real time using color, weight, and temperature/humidity sensors. The proposed FPSML provides an architecture that can be used repeatedly for a similar fruit crop. It allows for a more accurate harvest time as massive data is accumulated continuously.
Recently, machine learning technology has had a significant impact on society, particularly in the medical, manufacturing, marketing, finance, broadcasting, and agricultural aspects of human lives. In this paper, we study how to apply machine learning techniques to foods, which have the greatest influence on the human survival. In the field of Smart Farm, which integrates the Internet of Things (IoT) technology into agriculture, we focus on optimizing the crop growth environment by monitoring the growth environment in real time. KT Smart Farm Solution 2.0 has adopted machine learning to optimize temperature and humidity in the greenhouse. Most existing smart farm businesses mainly focus on controlling the growth environment and improving productivity. On the other hand, in this study, we are studying how to apply machine learning with respect to harvest time so that we will be able to harvest fruits of the highest quality and ship them at an excellent cost. In order to apply machine learning techniques to the field of smart farms, it is important to acquire abundant voluminous data. Therefore, to apply accurate machine learning technology, it is necessary to continuously collect large data. Therefore, the color, value, internal temperature, and moisture of greenhouse-grown fruits are collected and secured in real time using color, weight, and temperature/humidity sensors. The proposed FPSML provides an architecture that can be used repeatedly for a similar fruit crop. It allows for a more accurate harvest time as massive data is accumulated continuously.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
최근 스마트 팜 분야의 연구는 시설내의 생육 환경을 최적으로 유지 하여 농작물의 생산성을 극대화 하는 데 연구가 중점 되어 있었 다. 단순한 생산성 증대는 농작물 가격의 하락을 초래하는 부작용이 발생할 수 있으므로 농부들의 수익을 증대시키기 위해서는 생산성 증대도 중요하지만 농작물을 최고의 품질로 생산하여 수익성을 높이는 것이 중요하다는 점을 착안하여 본 논문에 서는 과일의 수확시기를 정확하게 예측할 수 있는 방법을 연구 하였다. 과일의 수확시기를 정확히 예측하기 위해서 과일의 무게, 과일의 색상, 내부온도, 내부습도 등을 실시간으로 측정하여 머신 러닝에 적용하였다.
가설 설정
과일의 수확시기를 예측하는 머신러닝 모델 단위인 FPHarvestMLModel은 내부온도, 내부습도, 과일빨강색상, 과일녹색상, 과일파랑색상, 과일무게 특성 값을 머신러닝에 적용하여 과일의 예상 수확시기를 시간단위로 예측 한다 . 과일의 수확시기에 가장 영향을 미치는 기준은 과일의 무게와 색상이 다. 또한, 현재의 습도와 온도가 과일의 무게와 색상을 변화시키는 속도에 영향을 주기 때문에 수확시기 상관인자에 포함시켰다.
태스크라는 실질적인 작업 단위가 익스큐터(Executor)에 전달된다[10]. 아파치 스파크는 메모리 기반 실시간 데이터 분석이 가능하다.
제안 방법
표 2는 과일 수확시기 예측에 사용되는 특성 값들을 보여 준다. 과일의 수확시기를 예측하는 머신러닝 모델 단위인 FPHarvestMLModel은 내부온도, 내부습도, 과일빨강색상, 과일녹색상, 과일파랑색상, 과일무게 특성 값을 머신러닝에 적용하여 과일의 예상 수확시기를 시간단위로 예측 한다 . 과일의 수확시기에 가장 영향을 미치는 기준은 과일의 무게와 색상이 다.
단순한 생산성 증대는 농작물 가격의 하락을 초래하는 부작용이 발생할 수 있으므로 농부들의 수익을 증대시키기 위해서는 생산성 증대도 중요하지만 농작물을 최고의 품질로 생산하여 수익성을 높이는 것이 중요하다는 점을 착안하여 본 논문에 서는 과일의 수확시기를 정확하게 예측할 수 있는 방법을 연구 하였다. 과일의 수확시기를 정확히 예측하기 위해서 과일의 무게, 과일의 색상, 내부온도, 내부습도 등을 실시간으로 측정하여 머신 러닝에 적용하였다. 수확시기 관련 또한 실시간으로 발생 하는 빅 데이터들을 하둡에 저장하여 지속적으로 정밀도 높은 머신러닝 모델을 개선해 가도록 설계하였다.
그림 7은 Kafka의 생산자와 소비자 구조를 보여준다. 본 논문의 FPSML 시스템에서는 빅 데이터가 실시간 방식으로 스파크로 수집되므로 실시간 메시지에 대한 안정적인 트랜젝션 처리가 필요하다고 판단되어 Kafka를 메시징 큐로 사용했다. Kafka는 노드관리를 위해서 Zookeeper를 사용하므로 Kafka Server를 운영하기 위해서는 반드시 Zookeeper 서버를 먼저 실행해야한다[13].
과일의 수확시기를 정확히 예측하기 위해서 과일의 무게, 과일의 색상, 내부온도, 내부습도 등을 실시간으로 측정하여 머신 러닝에 적용하였다. 수확시기 관련 또한 실시간으로 발생 하는 빅 데이터들을 하둡에 저장하여 지속적으로 정밀도 높은 머신러닝 모델을 개선해 가도록 설계하였다. 본 논문에서 개발한 시스템은 상용화 정도에 이르지는 못했으며 향후 유사 상용화 시스템 개발 시 기반 시스템으로 사용이 가능하다.
대상 데이터
0’ 솔루션에 대해 소개했다. 기가 스마트 팜 솔루션은 센서가 달린 사물인터넷(IoT) 기기를 통해 재배시설의 온도·습도·일사·CO2·토양 등을 분석해 자료를 모은다. 또 분석 결과에 따라 제어장치를 구동해 최적의 작물 재배환경의 조성에 기여 한다는 설명이다[3].
본 논문에서는 최근 모든 산업 분야에서 가장 많은 변화를 야기하고 있고 미래의 인류에게 막대한 영향을 미칠 것으로 예상 되는 머신러닝 기술을 스마트 팜 영역에 적용했다. 스마트 팜영역 중 에서도 과수 분야에 집중하여 연구를 진행했다.
본 논문에서 수확시기를 예측하는 알고리즘으로는 과일색상 값 과 과일무게 값, 온실의 온습도 값을 사용하여 과일의 수확시기 예측 값을 예측하므로 다중선형회귀를 사용한다. 수집된 빅 데이터에 머신러닝을 적용하는 프레임워크로는 Apache Spark를 사용한다. 샘플 과일로는 우리 국민들이가장 많이 사먹는 사과를 선택한다.
3 을 지정하여 Overfitting을 피하게 지정하였고, MaxIter 값의 경우는 10으로 지정하여 머신러닝 속도를 증가 시켰다. 수확시기 예측에 대한 학습데이터를 획득하려면 5년 ~ 10년 혹은 그 이상의 기간이 필요하고, 농촌진흥청 등 기관에 문의 하였으나 빅 데이터를 획득할 방법이 없어서본 논문에서 사용한 수확시기 예측에 관한 학습데이터는 임의의 데이터셋을 설계하여 사용하였다. 향후 학습에 필요한 빅 데이터가 축적될수록 더욱 정밀한 모델이 기대된다.
본 논문에서는 다양한 스마트 팜 영역 중 스마트 온실 분야를 연구한다. 스마트 온실에서 재배하는 과일의 수확시기 상관인자(과일의 색상, 과일의 무게, 온실의 온습도)를 색상센서 와 무게센서, 온습도센서를 이용하여 실시간으로 아두이노로 수집한 후 MQTT(MQ Telemetry Transport)와 Kafka를 사용하여 실시간으로 수집 한다. 실시간으로 수집된 데이터들은 머신러닝이 적용되어 수확시기를 정확히 예측한다.
데이터처리
또한, 현재의 습도와 온도가 과일의 무게와 색상을 변화시키는 속도에 영향을 주기 때문에 수확시기 상관인자에 포함시켰다. 각 특성 값들을 다중 선형회귀 알고리즘을 이용해서 머신러닝을 학습하고 테스트 한다. 본 논문에서는 아파치 스파크에서 제공되는 LinearRegression 클래스와 LinearRegressionModel 클래스를 사용하여 머신러닝을 적용 하였다.
본 논문에서는 수확시기 예측에 중점을 두어 연구하며 기존 스마트 팜 관련 시스템에서 중점을 두었던 생육환경 자동 조절 부분은 제외 한다. 본 논문에서 수확시기를 예측하는 알고리즘으로는 과일색상 값 과 과일무게 값, 온실의 온습도 값을 사용하여 과일의 수확시기 예측 값을 예측하므로 다중선형회귀를 사용한다. 수집된 빅 데이터에 머신러닝을 적용하는 프레임워크로는 Apache Spark를 사용한다.
이론/모형
표 1은 국내 스마트 팜 적용 모델을 보여준다[6]. 본 논문 에서는 스마트 팜 적용 모델 중 스마트온실 모델을 적용한다. 기존 스마트 온실 모델에서는 온실 내의 생육환경을 최적으로 유지하는 것이 중점적으로 연구 되었지만 본 논문에서는 수확 시기 예측에 중점을 둔다.
각 특성 값들을 다중 선형회귀 알고리즘을 이용해서 머신러닝을 학습하고 테스트 한다. 본 논문에서는 아파치 스파크에서 제공되는 LinearRegression 클래스와 LinearRegressionModel 클래스를 사용하여 머신러닝을 적용 하였다.
성능/효과
즉, 대역폭이 작은 통신에 적합하다. FPSML 시스템 에서는 각종 센서로부터 수집되는 과일 정보 값이나 온실 생육환경 정보를 아두이노로부터 실시간으로 수집해야 하므로 메시지 푸시 기능처리로 MQTT를 사용하는 것이 적합하다. MQTT 의 Server로 사용하는 장치가 MQTT Broker이다.
본 문문의 머신러닝 학습에서는 과일의 색상 값, 과일의 무게 값, 온실 내부의 온도, 온실 내부의 습도특성이 중요하게 사용되었다. FPSML의 경우 센서로부터 실시간으로 전송되는 값들을 빠른 속도로 분석해야 하므로 분석 속도를 향상시키기 위해서 하이퍼파라미터 값으로 사용된 RegParam 값의 경우 0.3 을 지정하여 Overfitting을 피하게 지정하였고, MaxIter 값의 경우는 10으로 지정하여 머신러닝 속도를 증가 시켰다. 수확시기 예측에 대한 학습데이터를 획득하려면 5년 ~ 10년 혹은 그 이상의 기간이 필요하고, 농촌진흥청 등 기관에 문의 하였으나 빅 데이터를 획득할 방법이 없어서본 논문에서 사용한 수확시기 예측에 관한 학습데이터는 임의의 데이터셋을 설계하여 사용하였다.
후속연구
수확시기 관련 또한 실시간으로 발생 하는 빅 데이터들을 하둡에 저장하여 지속적으로 정밀도 높은 머신러닝 모델을 개선해 가도록 설계하였다. 본 논문에서 개발한 시스템은 상용화 정도에 이르지는 못했으며 향후 유사 상용화 시스템 개발 시 기반 시스템으로 사용이 가능하다.
본 논문에서 사과를 샘플 과일로 사용했지만 FPSML의 제안 아키텍처는 타 과수를 재배할 때 반복적으로 적용될 수 있다. 본 논문에서는 FPSML을 프로토타이핑 수준으로 구현하였지만 향후 상용화시스템으로 개발될 때 스켈리톤(skeleton) 으로 제공될 수 있다.
수확시기 예측에 대한 학습데이터를 획득하려면 5년 ~ 10년 혹은 그 이상의 기간이 필요하고, 농촌진흥청 등 기관에 문의 하였으나 빅 데이터를 획득할 방법이 없어서본 논문에서 사용한 수확시기 예측에 관한 학습데이터는 임의의 데이터셋을 설계하여 사용하였다. 향후 학습에 필요한 빅 데이터가 축적될수록 더욱 정밀한 모델이 기대된다. 본 논문에서는 실제 데이터에 적용하여 검증하는 단계는 진행하지 않았고 아키텍처와 모델 제안 및 구현에 중점을 두어 연구되었다.
질의응답
핵심어
질문
논문에서 추출한 답변
하둡의 시작이 되는 두 개의 논문은 각각 무엇인가?
하둡의 시작은 두 개의 논문에서다. 첫 번째 논문은 2003년에 발표한 “The Google File System” 이고 HDFS의 시작이 되었다. 두 번째 논문은 2004년에 발표한 “MapReduce:Simplified Data Processing on Large Clusters” 이고 맵리듀스 의 기초가 되었다. 작업을 병렬로 처리하는 프레임워크인하둡은 HDFS와 MapReduce로 구성된다.
작업을 병렬로 처리하는 프레임워크인하둡은 어떻게 구성되는가?
두 번째 논문은 2004년에 발표한 “MapReduce:Simplified Data Processing on Large Clusters” 이고 맵리듀스 의 기초가 되었다. 작업을 병렬로 처리하는 프레임워크인하둡은 HDFS와 MapReduce로 구성된다. MapReduce는 분산 저장되어있는 데이터를 처리하는 프레임워크이며 HDFS(Hadoop Distributed File System)는 분산 파일 시스템이다.
스마트 팜이란 무엇인가?
스마트 팜 (Smart Farm)은 농업 과 ICT 기술을 융합하여 시공간의 제약 없이 농업 환경을 수집, 분석하며 생산, 유통, 소비의 각 분야에서 ICT를 기본으로 하여 시스템화하고 이를 농업에 적용하여 생산성 향상, 비용 절감뿐만 아니라 농업인 삶의 질을 향상시키는 고효율 지향의 농업형태를 의미한다[5].
※ AI-Helper는 부적절한 답변을 할 수 있습니다.