$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

FT NIR 분광법 및 이진분류 머신러닝 방법을 이용한 소나무 종자 발아 예측
Prediction of Germination of Korean Red Pine (Pinus densiflora) Seed using FT NIR Spectroscopy and Binary Classification Machine Learning Methods 원문보기

한국산림과학회지 = Journal of korean society of forest science, v.112 no.2, 2023년, pp.145 - 156  

김용율 (국립산림과학원 생명정보연구과) ,  구자정 (국립산림과학원 생명정보연구과) ,  구다은 (국립산림과학원 생명정보연구과) ,  한심희 (국립산림과학원 생명정보연구과) ,  강규석 (서울대학교 농림생물자원학부)

초록
AI-Helper 아이콘AI-Helper

본 연구에서는 -18℃ 및 4℃에서 18년간 저장된 소나무 종자 963개에 대해 FT NIR 스펙트럼을 조사하여 7개 머신러닝 방법(XGBoost, Boosted Tree, Bootstrap Forest, Neural Networks, Decision Tree, Support Vector Machine, PLS-DA)을 이용한 종자발아 예측모델을 만들고, 그 성능을 비교하였다. XGBoost 및 Boosted Tree 모델의 예측성능이 가장 우수하였으며, 정확도, 오분류율AUC 값은 각각 0.9722, 0.0278, 0.9735과 0.9653, 0.0347, 0.9647이었다. 2개 모델에서 종자발아 유무를 예측하는 데 있어 상대적 중요도가 높았던 54개 파수 변수들에 대한 파장대는 크게 6개(811~1,088 nm, 1,137~1,273 nm, 1,336~1,453 nm, 1,666~1,671 nm, 1,879~2,045 nm, 2,058~2,409 nm) 그룹으로 나눌 수 있었으며, 방향족 아미노산, 셀룰로스, 리그닌, 전분, 지방산 및 수분과 관련된 것으로 추정되었다. 이상의 결과를 종합할 때, 본 연구에서 얻어진 FT NIR 스펙트럼 데이터과 2개의 머신러닝 모델은 소나무 저장종자의 발아 유무를 정확도 96% 이상으로 예측할 수 있기에 장기저장 종자 유전자원의 비파괴적 활력검정에 유용하게 활용될 수 있을 것으로 생각된다.

Abstract AI-Helper 아이콘AI-Helper

In this study, Fourier-transform near-infrared (FT-NIR) spectra of Korean red pine seeds stored at -18℃ and 4℃ for 18 years were analyzed. To develop seed-germination prediction models, the performance of seven machine learning methods, namely XGBoost, Boosted Tree, Bootstrap Forest, N...

주제어

표/그림 (11)

AI 본문요약
AI-Helper 아이콘 AI-Helper

문제 정의

  • 본 연구는 20년간 장기 저장된 소나무 종자를 FT NIR 스펙트럼으로 측정하여 종자의 발아 유무를 정확히 예측할 수 있는 머신러닝 모델을 확립하기 위해 수행되었다. Savitzky-Golay 2차 다항식 변환을 통해 얻어진 스펙트럼 데이터를 7개의 머신러닝 방법에 적용하여 종자발아 유무 판별을 위한 이항분류 모델을 만들고 예측성능을 비교한 결과, XGBoost(28개 변수) 및 Boosted Tree(33개 변수) 축소모델이 정확도, 오분류율 및 AUC에서 다른 머신러닝 모델보다 더 우수한 성능을 보였다.
  • 이에 본 연구는 국립산림과학원에서 18년간 저장되어 있던 소나무 종자에 대해 FT NIR 스펙트럼 측정과 발아실험을 수행하고, 3개의 전처리(pre-processing) 방법에 의해 변환 스펙트럼 데이터를 얻은 후, 7개의 머신러닝 방법을 이용하여 종자발아 유무를 정확히 예측할 수 있는 모델을 개발하고자 수행되었다. 보다 세부적으로는 (1) 모델의 예측성능을 향상시키는 NIR 스펙트럼 데이터의 전처리(pre-processing) 방법을 확인하고, (2) 가장 우수한 예측성능을 보이는 머신러닝 모델을 확립하며, (3) 모델에서 상대적 중요도가 높은 변수와 관련된 화합물을 추정하고자 하였다.
본문요약 정보가 도움이 되었나요?

참고문헌 (31)

  1. Chen, Q., Lin, H. and Zhao, J. 2021. Advanced nondestructive detection technologies in food. Springer Nature Singapore. Gateway East, Singapore. pp. 333. 

  2. Chen, T. and Guestrin, C. 2016. XGBoost: a scalable tree boosting system. pp. 785-794. In: Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining(KDD '16). Association for Computing Machinery. New York, U.S.A. 

  3. Daneshvar, A., Tigabu, M., Karimidoost, A. and Oden, P.C. 2015. Single seed near infrared spectroscopy discriminates viable and non-viable seeds of Juniperus polycarpos. Silva Fennica 49(5): 1-14. 

  4. Food and Agriculture Organization of the United Nations. 2014. Genebank standards for plant genetic resources for food and agriculture. FAO Working Group. Rome, Italy. pp. 181. 

  5. JMP Statistical Discovery LLC. 2022. JMP® 17 Documentation Library. JMP Statistical Discovery LLC. North Carolina, U.S.A. 

  6. Kim, D.H., Han, S.H., Song, J.H. and Jang, K.H. 2012. Seed storage and longevity in woody plant. Korea Forest Research Institute, Seoul, Republic of Korea. pp. 159. 

  7. Kim, J.H., Ku, J.J., Lim, H.I. and Kim, Y.Y. 2020. Characteristics and conservation status of useful forest genetic resources seeds. National Institute of Forest Science, Seoul, Republic of Korea. pp. 178. 

  8. Kumari, R. and Srivastava, S. 2017. Machine learning: a review on binary classification. International Journal of Computer Applications 160(7): 11-15. 

  9. Lestander, T. and Oden, P.C. 2002. Separation of viable and nonviable filled scots pine seeds by differentiating between drying rates using single seed near infrared transmittance spectroscopy. Seed Science and Technology 30(2): 383-392. 

  10. Liu, W., Liu, J., Jiang, J. and Li, Y. 2021. Comparison of partial least squares-discriminant analysis, support vector machines and deep neural networks for spectrometric classification of seed vigour in a broad range of tree species. Journal of Near Infrared Spectroscopy 29(1): 33-41. 

  11. Mo, L., Chen, H., Chen, W., Feng, Q. and Xu, L. 2020. Study on evolution methods for the optimization of machine learning models based on FT-NIR spectroscopy. Infrared Physics and Technology 108: 103366. 

  12. Mukasa, P., Cho, B.K., Joo, H.J. and Kwon, Y.R. 2018. Determination of viability of Japanese larch seeds using hyperspectral imaging. Proceedings of the Korean Society for Agricultural Machinery Conference 23(1): 195. 

  13. Mukasa, P., Wakholi, C., Mo, C.Y., Oh, M.R., Joo, H.J., Suh, H.K. and Cho, B.K. 2019. Determination of viability of retinispora (Hinoki cypress) seeds using FT-NIR spectroscopy. Infrared Physics and Technology 98: 62-68. 

  14. Narassiguin, A., Bibimoune, M., Elghazel, H. and Aussem, A. 2016. An extensive empirical comparison of ensemble learning methods for binary classification. Pattern Analysis and Application 19(4): 1093-1128. 

  15. Qiu, G., Lu, E., Lu, H., Xu, S., Zeng, F. and Shui, Q. 2018. Single-kernel FT-NIR spectroscopy for detecting supersweet corn (Zea mays L. Saccharata Sturt) seed viability with multivariate data analysis. Sensors 18(4): 1010. 

  16. Rocha, W.F.D.C., Prado, C.B.D. and Blonder, N. 2020. Comparison of chemometric problems in food analysis using non-linear methods. Molecules 25(13): 3025. https://doi.org/10.3390/molecules25133025. 

  17. Ruiz-Perez, D., Guan, H., Madhivanan, P., Mathee, K. and Narasimhan, G. 2020. So you think you can PLS-DA?. BMC Bioinformatics 21(Suppl 1): 2. 

  18. Sampaio, P.S. and Brites, C.M. 2021. Near-Infrared spectroscopy and machine learning: analysis and classification methods of rice. pp. 257-288. In: Huang, M. (Ed.). Integrative Advances in Rice Research. IntechOpen. London, UK. 

  19. Sato, T., Kawano, S. and Iwamoto, M. 1991. Near-infrared spectral patterns of fatty acid analysis from fats and oils. Journal of the Americal Oil Chemists Society 68(11): 827-833. 

  20. Savitzky, A. and Golay, M.J.E. 1964. Smoothing and differentiation of data by simplified least squares procedures. Analytical Chemistry 36(8): 1627-1639. 

  21. Schwanninger, M., Rodrigues, J.C. and Fackler, K. 2011. A review of band assignments in near infrared spectra of wood and wood components. Journal of Near Infrared Spectroscopy 19(5): 287-308. 

  22. Shenk, J.S., Workman, J.J. and Westerhaus, M.O. 2007. Application of NIR spectroscopy to agricultural products. pp. 419-474. In: Burns D.A. and Ciurczak E.W. (eds), Handbook of Near-Infrared Spectroscopy. CRC Press. New York, U.S.A. 

  23. Shetty, N, Min T.G., Gislum, R., Olesen M.H. and Boelt B. 2011. Optimal sample size for predicting viability of cabbage and radish seeds based on near infrared spectra of single seeds. Journal of Near Infrared Spectroscopy 19(6): 451-461. 

  24. Tian, W., Zang, L., Nie, L., Li, L., Zhong, L., Guo, X., Huang, S. and Zang, H. 2023. Structural analysis and classification of low-molecular-weight hyaluronic acid by near-infrared spectroscopy: a comparison between traditional machine learning and deep learning. Molecules 28(2): 809. 

  25. Tigabu, M. 2003. Characterization of forest tree seed quality with near infrared spectroscopy and multivariate analysis. (Dissertation). Umea, Sweden. Acta Universitatis Agriculturae Sueciae. 

  26. Tigabu, M. and Oden, P.C. 2003. Discrimination of viable and empty seeds of Pinus patula Schiede & Deppe with near-infrared spectroscopy. New Forest. 25(3): 163-176. 

  27. Tigabu, M., Daneshvar, A., Jingjing, R., Wu, P., Ma, X. and Oden, P.C. 2019. Multivariate discriminant analysis of single seed near infrared spectra for sorting dead-filled and viable seeds of three pine Species: Does one model fit all species? Forests 10(6): 469-482. 

  28. Tigabu, M., Daneshvar, A., Wu, P., Ma, X. and Oden, P.C. 2020. Rapid and non-destructive evaluation of seed quality of Chinese fir by near infrared spectroscopy and multivariate discriminant analysis. New Forests 51(3): 395-408. 

  29. Wang, L, Huang, Z. and Wang, R. 2021. Discrimination of cracked soybean seeds by near-infrared spectroscopy and random variable selection. Infrared Physics and Technology 115: 103731. 

  30. Workman, J. and Weyer, L. 2012. Practical guide and spectral atlas for interpretative near-infrared spectroscopy. 2nd Edition. CRC Press. New York, U.S.A. pp. 326. 

  31. Xia, Y., Xu, Y., Li, J., Zhang, C. and Fan, S. 2019. Recent advances in emerging techniques for non-destructive detection of seed viability: A review. Artificial Intelligence in Agriculture 1: 35-47. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로