수산물은 식단에서 단백질 영양소로 영양과 에너지를 공급하는 중요한 역할을 한다. 수산물의 원천인 해양 생태계는 지하수 및 대기, 경작지와 하천, 생활하수, 공장폐수 및 산업폐수를 비롯해 선박 및 각종 해양시설로부터 오염물질이 유입되고 있다. 미량의 오염물질, 약물 잔류물, 중금속은 수산물에 축적이 될 수 있고, 먹이 사슬로 인해 사람에게도 영향이 미치게 된다. 국내로 수입되는 수산물은 110여 개 국가로부터 수백 종에 이르며, 수입 수산물의 안전관리를 검사관의 경험에만 의존하면 한계가 있다. 데이터를 기반으로 수입 수산물 통관검사 결과를 예측할 수 있는 모델을 개발함으로써 부적합 가능성이 있는 수산물을 걸러질 수 있도록 연구하였다. 머신러닝 기반의 분류 모델은 데이터에 포함된 ...
수산물은 식단에서 단백질 영양소로 영양과 에너지를 공급하는 중요한 역할을 한다. 수산물의 원천인 해양 생태계는 지하수 및 대기, 경작지와 하천, 생활하수, 공장폐수 및 산업폐수를 비롯해 선박 및 각종 해양시설로부터 오염물질이 유입되고 있다. 미량의 오염물질, 약물 잔류물, 중금속은 수산물에 축적이 될 수 있고, 먹이 사슬로 인해 사람에게도 영향이 미치게 된다. 국내로 수입되는 수산물은 110여 개 국가로부터 수백 종에 이르며, 수입 수산물의 안전관리를 검사관의 경험에만 의존하면 한계가 있다. 데이터를 기반으로 수입 수산물 통관검사 결과를 예측할 수 있는 모델을 개발함으로써 부적합 가능성이 있는 수산물을 걸러질 수 있도록 연구하였다. 머신러닝 기반의 분류 모델은 데이터에 포함된 이상치 제거 및 불균형한 데이터 특성을 보완할 수 있는 여러 가지 샘플링 기법을 적용하였다. 그 결과 부적합을 가장 잘 예측하는 모델은 랜덤오버샘플링과 원-핫 인코딩을 적용한 랜덤포레스트 기본 모델이며, 정확도 99.78%, 정밀도 100%, 재현율 98.57%, AUC 99.78%이다. 적합과 부적합을 모두 잘 예측하는 모델은 ADASYN과 원-핫 인코딩을 적용한 랜덤포레스트 기본 모델이고, 정확도 99.88%, 정밀도 99.87%, 재현율 99.89%, AUC 99.88%이다. XGBoost는 오버샘플링과 인코딩 종류에 상관없이 모든 지표가 90%를 넘겨 가장 안정적인 모델이다.
수산물은 식단에서 단백질 영양소로 영양과 에너지를 공급하는 중요한 역할을 한다. 수산물의 원천인 해양 생태계는 지하수 및 대기, 경작지와 하천, 생활하수, 공장폐수 및 산업폐수를 비롯해 선박 및 각종 해양시설로부터 오염물질이 유입되고 있다. 미량의 오염물질, 약물 잔류물, 중금속은 수산물에 축적이 될 수 있고, 먹이 사슬로 인해 사람에게도 영향이 미치게 된다. 국내로 수입되는 수산물은 110여 개 국가로부터 수백 종에 이르며, 수입 수산물의 안전관리를 검사관의 경험에만 의존하면 한계가 있다. 데이터를 기반으로 수입 수산물 통관검사 결과를 예측할 수 있는 모델을 개발함으로써 부적합 가능성이 있는 수산물을 걸러질 수 있도록 연구하였다. 머신러닝 기반의 분류 모델은 데이터에 포함된 이상치 제거 및 불균형한 데이터 특성을 보완할 수 있는 여러 가지 샘플링 기법을 적용하였다. 그 결과 부적합을 가장 잘 예측하는 모델은 랜덤오버샘플링과 원-핫 인코딩을 적용한 랜덤포레스트 기본 모델이며, 정확도 99.78%, 정밀도 100%, 재현율 98.57%, AUC 99.78%이다. 적합과 부적합을 모두 잘 예측하는 모델은 ADASYN과 원-핫 인코딩을 적용한 랜덤포레스트 기본 모델이고, 정확도 99.88%, 정밀도 99.87%, 재현율 99.89%, AUC 99.88%이다. XGBoost는 오버샘플링과 인코딩 종류에 상관없이 모든 지표가 90%를 넘겨 가장 안정적인 모델이다.
Seafood plays an important role in supplying nutrition and energy as a protein nutrient in the diet. In the marine ecosystem, which is the source of seafood, pollutants are introduced from ships and various marine facilities, including underground water and air, cultivated land and rivers, domestic ...
Seafood plays an important role in supplying nutrition and energy as a protein nutrient in the diet. In the marine ecosystem, which is the source of seafood, pollutants are introduced from ships and various marine facilities, including underground water and air, cultivated land and rivers, domestic sewage, factory wastewater and industrial wastewater. Trace contaminants, drug residues and heavy metals can accumulate in seafood and affect humans up the food chain. There are hundreds of species of seafood imported into Korea from over 110 countries, and there is a limit to relying only on the experience of inspectors for safety management of imported seafood. Based on the data, a model that can predict the results of the customs inspection of imported seafood was developed to filter out potentially unsuitable seafood products. The machine learning-based classification model applied various sampling techniques that can remove outliers included in data and compensate for imbalanced data characteristics. As a result, the model that best predicts misfit is the Random Forest basic model using RandomOverSampling and one-hot encoding, with accuracy of 99.78%, precision of 100%, recall of 98.57%, and AUC of 99.78%. The model that predicts both fit and non-conformance well is the Random Forest basic model using ADASYN and one-hot encoding, with an accuracy of 99.88%, precision of 99.87%, recall of 99.89%, and AUC of 99.88%. XGBoost is the most stable model with all indicators exceeding 90% regardless of OverSampling and encoding type.
Seafood plays an important role in supplying nutrition and energy as a protein nutrient in the diet. In the marine ecosystem, which is the source of seafood, pollutants are introduced from ships and various marine facilities, including underground water and air, cultivated land and rivers, domestic sewage, factory wastewater and industrial wastewater. Trace contaminants, drug residues and heavy metals can accumulate in seafood and affect humans up the food chain. There are hundreds of species of seafood imported into Korea from over 110 countries, and there is a limit to relying only on the experience of inspectors for safety management of imported seafood. Based on the data, a model that can predict the results of the customs inspection of imported seafood was developed to filter out potentially unsuitable seafood products. The machine learning-based classification model applied various sampling techniques that can remove outliers included in data and compensate for imbalanced data characteristics. As a result, the model that best predicts misfit is the Random Forest basic model using RandomOverSampling and one-hot encoding, with accuracy of 99.78%, precision of 100%, recall of 98.57%, and AUC of 99.78%. The model that predicts both fit and non-conformance well is the Random Forest basic model using ADASYN and one-hot encoding, with an accuracy of 99.88%, precision of 99.87%, recall of 99.89%, and AUC of 99.88%. XGBoost is the most stable model with all indicators exceeding 90% regardless of OverSampling and encoding type.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.