본 연구는 농약류에 대하여 구조-활성의 정량적 관계(QSAR)를 이용하여 무지개 송어(학명: Oncorhynchus mykiss)의 급성 독성을 예측-분석하는 과정을 수행하였다. 모델 구현을 위해 사용된 275종의 농약류에 대한 수중 독성(96h $LC_{50}$) 값은 DEMETRA프로젝트의 데이터를 사용하였다. 예측 모델에 사용된 2차원 분자 표현자는 PreADMET프로그램으로부터 계산을 하였고, 선형 (다중 선형 회귀 방법)모델과 비선형(서포트 벡터 머신, 인공 신경망) 학습 방법들은 실험값과 예측값의 적합도를 고려하여 최적화 되었다. 데이터 전처리 과정을 거친 뒤에, 5묶음 교차 검증과정을 포함한 모집단 기반 전진 선택법을 통해서 각 학습 방법의 최적의 표현자 집합을 결정하였다. 가장 좋은 결과는 SVM 방법 ($R^2_{CV}$=0.677, RMSECV=0.887, MSECV=0.674) 이었고, EU의 규제 기준에 따른 분류에서는 87%의 정확도를 나타내었다. MLR방법을 통해서는 무지개 송어의 급성 독성에 대하여 독성을 나타내는 농약류의 구조적 특징과 지질 층과의 상호작용을 설명할 수 있었다. 개발된 모든 모델들은 5묶음 교차 검증과 Y-scrambling test을 통해 검증되었다.
본 연구는 농약류에 대하여 구조-활성의 정량적 관계(QSAR)를 이용하여 무지개 송어(학명: Oncorhynchus mykiss)의 급성 독성을 예측-분석하는 과정을 수행하였다. 모델 구현을 위해 사용된 275종의 농약류에 대한 수중 독성(96h $LC_{50}$) 값은 DEMETRA프로젝트의 데이터를 사용하였다. 예측 모델에 사용된 2차원 분자 표현자는 PreADMET프로그램으로부터 계산을 하였고, 선형 (다중 선형 회귀 방법)모델과 비선형(서포트 벡터 머신, 인공 신경망) 학습 방법들은 실험값과 예측값의 적합도를 고려하여 최적화 되었다. 데이터 전처리 과정을 거친 뒤에, 5묶음 교차 검증과정을 포함한 모집단 기반 전진 선택법을 통해서 각 학습 방법의 최적의 표현자 집합을 결정하였다. 가장 좋은 결과는 SVM 방법 ($R^2_{CV}$=0.677, RMSECV=0.887, MSECV=0.674) 이었고, EU의 규제 기준에 따른 분류에서는 87%의 정확도를 나타내었다. MLR방법을 통해서는 무지개 송어의 급성 독성에 대하여 독성을 나타내는 농약류의 구조적 특징과 지질 층과의 상호작용을 설명할 수 있었다. 개발된 모든 모델들은 5묶음 교차 검증과 Y-scrambling test을 통해 검증되었다.
The acute toxicity in the rainbow trout (Oncorhynchus mykiss) was analyzed and predicted using quantitative structure-activity relationships (QSAR). The aquatic toxicity, 96h $LC_{50}$ (median lethal concentration) of 275 organic pesticides, was obtained from EU-funded project DEMETRA. Pr...
The acute toxicity in the rainbow trout (Oncorhynchus mykiss) was analyzed and predicted using quantitative structure-activity relationships (QSAR). The aquatic toxicity, 96h $LC_{50}$ (median lethal concentration) of 275 organic pesticides, was obtained from EU-funded project DEMETRA. Prediction models were derived from 558 2D molecular descriptors, calculated in PreADMET. The linear (multiple linear regression) and nonlinear (support vector machine and artificial neural network) learning methods were optimized by taking into account the statistical parameters between the experimental and predicted p$LC_{50}$. After preprocessing, population based forward selection were used to select the best subsets of descriptors in the learning methods including 5-fold cross-validation procedure. The support vector machine model was used as the best model ($R^2_{CV}$=0.677, RMSECV=0.887, MSECV=0.674) and also correctly classified 87% for the training set according to EU regulation criteria. The MLR model could describe the structural characteristics of toxic chemicals and interaction with lipid membrane of fish. All the developed models were validated by 5 fold cross-validation and Y-scrambling test.
The acute toxicity in the rainbow trout (Oncorhynchus mykiss) was analyzed and predicted using quantitative structure-activity relationships (QSAR). The aquatic toxicity, 96h $LC_{50}$ (median lethal concentration) of 275 organic pesticides, was obtained from EU-funded project DEMETRA. Prediction models were derived from 558 2D molecular descriptors, calculated in PreADMET. The linear (multiple linear regression) and nonlinear (support vector machine and artificial neural network) learning methods were optimized by taking into account the statistical parameters between the experimental and predicted p$LC_{50}$. After preprocessing, population based forward selection were used to select the best subsets of descriptors in the learning methods including 5-fold cross-validation procedure. The support vector machine model was used as the best model ($R^2_{CV}$=0.677, RMSECV=0.887, MSECV=0.674) and also correctly classified 87% for the training set according to EU regulation criteria. The MLR model could describe the structural characteristics of toxic chemicals and interaction with lipid membrane of fish. All the developed models were validated by 5 fold cross-validation and Y-scrambling test.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구에서는 농약류들에 대하여 어류의 급성 독성을 예측할 수 있도록 QSAR분석방법을 수행하고 모델을 검증하고자 한다. 특히 다른 어종에 비해 성장이 빠르고 번식력이 왕성하여 국제적으로 어류 독성에 대표적으로 어종으로 사용되는 무지개 송어(rainbow trout, 학명:Onchorhyncus mykiss)에 대하여 적용하도록 하고, QSAR방법의 검증을 위하여 교차 검증법과 Y-scrambling방법을 통해 예측 정도를 평가하도록 하였다.
이 방법을 표현자의 수만큼의 개별 수식을 포함 하는 모집단(population) 을 통해서 최종적으로 가장 적합한 표현자 집합을 선택하게 하므로, 다른 표현자 선택 방법(유전자 알고리즘, simulated annealing 등등) 보다 빠르게 최적 표현자 집합을 선택할 수 있는 장점이 있다. 본 연구에서는 전진 선택 방법을 교차 검증 법에서 계산된 적합도를 기준으로 최적의 표현자 집합을 선택하였다.
본 연구에서는 환경에 영향을 미치는 농약류에 대하여 무지개 송어의 어독성을 예측하는 모델을 구현하고 분석하였다. 학습방법으로 선형 모델(MLR), 비선형 모델(SVM, ANN)을 이용하였고, 2차원 화학 구조에서 쉽게 계산할 수 있는 표현자만을 이용하여 QSAR예측모델을 구현하였다.
제안 방법
본 연구에서는 농약류들에 대하여 어류의 급성 독성을 예측할 수 있도록 QSAR분석방법을 수행하고 모델을 검증하고자 한다. 특히 다른 어종에 비해 성장이 빠르고 번식력이 왕성하여 국제적으로 어류 독성에 대표적으로 어종으로 사용되는 무지개 송어(rainbow trout, 학명:Onchorhyncus mykiss)에 대하여 적용하도록 하고, QSAR방법의 검증을 위하여 교차 검증법과 Y-scrambling방법을 통해 예측 정도를 평가하도록 하였다. 마지막으로 EU등에서 규제를 목적으로 구분해 놓은 어류 급성 독성의 분류 기준에 대하여 예측모델의 결과를 통해서 분류 정확도를 확인하였다.
특히 다른 어종에 비해 성장이 빠르고 번식력이 왕성하여 국제적으로 어류 독성에 대표적으로 어종으로 사용되는 무지개 송어(rainbow trout, 학명:Onchorhyncus mykiss)에 대하여 적용하도록 하고, QSAR방법의 검증을 위하여 교차 검증법과 Y-scrambling방법을 통해 예측 정도를 평가하도록 하였다. 마지막으로 EU등에서 규제를 목적으로 구분해 놓은 어류 급성 독성의 분류 기준에 대하여 예측모델의 결과를 통해서 분류 정확도를 확인하였다.
1은 본 연구에서 수행한 QSAR 과정을 도표로 나타낸 것이다. 데이터 수집, 표현자 계산, 데이터전처리, 표현자선택, 모델 성능 평가 및 검증 순으로 진행하였다.
본 연구에서는 EU가 지원한 DEMETRA project6-8에서 수집한 농약류 282종에 대하여 96시간동안 무지개 송어에 대하여 측정한 LC50값 (mM)을 사용하였다. 이 값은 무지개 송어 개체 중 절반 가량이 치사하는 반수 치사 농도(lethal concentration 50%)를 나타내며, 이 때의 농도는 mM로 나타내었다.
분자 표현자는 화학 분자의 구조적 특성을 정량적인 수치로 표현한 것을 말한다. 뒤에서 언급할 학습 방법에 분자 표현자를 적용하여 분자의 구조적 특성과 급성 독성과의 관계를 분석해 내고, 이를 통해 독성 분자의 구조적 공통점과 독성 메커니즘을 설명할 수 있다. 본 연구에서는 PreADMET v2.
계산된 558종의 분자 표현자로부터 우선적으로 불필요한 표현자들을 선별하여 제거하는 전처리 과정을 수행하였다. 첫 번째 과정은 모든 화합물에 대하여 계산한 화합물의 표준 편차가 0.
방법은 뇌의 신경망 전파 방식을 모사한 방법으로, 다층 전진 신경망(multilayer feed forward neural network)형태의 역-전파(back-propagation) 알고리즘을 적용하였다. 본 방법은 입력층(input layer)의 뉴런은 표현자, 출력층(out layer)의 뉴런은 pLC50으로 지정하고, 은닉층(hidden layer)의 뉴런 수를 최적화 하였고, 최적화 과정에서 필요한 learning rate, momentum 은 각각 grid search방법으로 정해진 범위 내에서 최적 조건을 결정하였다.
QSAR모델을 구현할 때는 훈련 데이터에 대한 적합도 계산과 더불어 모델 검증을 위한 다양한 과정들이 중요하다. 본 연구에서는 두 가지의 모델 검증 과정을 수행하였다. 첫 번째 방법은 교차 검증(cross-validation) 방법으로 훈련 데이터를 정해진 수의 묶음(fold)으로 구분한 뒤, 묶음 중 한 가지를 제외한 다른 묶음들로 QSAR모델을 구현하고, 제외된 묶음을 모델에 적용하여 예측한 결과를 얻도록 한다.
두 번째 방법은 Y-scrambling test로, 많은 표현자로부터 우연히 상관성을 나타냈을 가능성에 대하여 확인하는 방법이다. 종속변수인 pLC50값을 무작위로 섞은 데이터를 모델 구현에 사용한 방법들을 똑같이 수행하여 얻은 적합도를 얻는데, 이러한 방법들을 여러번 반복하여 얻은 적합도와 최적 모델의 적합도를 차이를 통해 모델 자체가 우연 상관(chance correlation)에 의한 결과가 아님을 증명하도록 하였다.
데이터 전처리 방법을 이용하여 216종의 분자 표현자로 축약한 뒤에, 모집단 기반 전진 선택법을 이용하여 교차 검증법의 적합도에 따라 표현자를 선택하도록 하였다. 표현자 선택, 교차 검증 등 모델 구현을 위해 사용된 모든 학습 방법들은 공개 프로그램인 Rapidminer v5.
SVM의 매개 변수는 C, γ, ν 이었으며, C는 01, 1, 10, 100 그리고 γ는 0.0001~0.1에 0.0001씩, 마지막으로 ν는 0.1~0.5에 0.1씩 변환하여 모든 조건에서의 교차 검증법에 의한 RMSECV값이 가장 낮은 조건으로 결정하였다.
5묶음(fold)로 나눈 교차 검증법을 수행하여 얻은 적합도(#, RMSECV, MAECV)는 표현자의 수가 추가되면서 모두 향상되는 결과를 나타내었다. 특히 통계적으로 의미가 있는 모델을 세우기 위하여 사용되는 기본 규칙인 화합물의 수의 1/10에 해당하는 25여종의 표현자까지 추가하여도 모든 적합도가 개선되는 결과를 나타내었기 때문에, 본 연구에는 표현자 선택을 위해서 다른 기준을 적용하여야 하였다. 이를 위해 도입된 기준값은 Jp값으로, 그 수식은 다음과 같다.
MLR 방법의 경우는 16종, SVM과 ANN 방법은 19종의 표현자를 포함할 때 가장 낮은 Jp값을 지니므로, 각 조건을 최적의 표현자 집합으로 결정하 였다. 결정된 표현자 집합에 대하여 SVM과 ANN방법은 추가적으로 매개 변수 최적화 과정을 진행 하였다. SVM의 매개 변수는 C, γ, ν 이었으며, C는 01, 1, 10, 100 그리고 γ는 0.
5이였다. ANN에서 사용되는 매개 변수는 learning rate, momentum 그리고 은닉층의 뉴런 수이며, learning rate 와 momentum은 0.1~1.0 사이로 0.1씩 각각 변화하였고, 은닉층의 뉴런 수는 6개로만 고정하여 각 조건에서 마찬가지로 교차 검증에 의한 RMSECV값을 얻었다. ANN방법에서 매개 변수의 최적 조건은 learning rate=0.
많은 표현자로부터 다양한 학습 방법에 따라 예측 모델을 구현하였기 때문에, 이 과정에서 우연히 어독성과 상관성을 나타냈을 가능성을 확인하기 위하여 Y-scrambling방법을 통해 우연 상관성(chance correlation)을 확인하였다. 이 과정은 화합물간의 종속변수(Y)만을 뒤섞고, 그 외의 과정(데이터 전처리부터 학습 방법 적용)은 앞에서 최적 모델을 결정할 때와 동일한 과정으로 수행하였고, 그 결과는 Table 6에 나타내었다.
본 연구에서는 환경에 영향을 미치는 농약류에 대하여 무지개 송어의 어독성을 예측하는 모델을 구현하고 분석하였다. 학습방법으로 선형 모델(MLR), 비선형 모델(SVM, ANN)을 이용하였고, 2차원 화학 구조에서 쉽게 계산할 수 있는 표현자만을 이용하여 QSAR예측모델을 구현하였다. 본 연구에 사용된 모든 학습 방법은 5묶음 교차 검증 법과 Y-scrambling test 에 의해서 얻은 적합도(#, RMSECV, MAECV)를 통해서 모델의 예측 능력과 견고함을 확인 할 수 있었다.
대상 데이터
1) OECD나 EPA의 지침서와 같은 표준화된 과정에 따라 얻은 데이터, 2) 우량 실험 규정(Good Laboratory Practice, GLP)에 따라 얻은 데이터, 3) 실험 수행 연도, 순도, 실험 불확도를 포함한 통계 자료를 부수적인 데이터로 이용이 가능한 데이터. 282종의 농약류 중에서 분자 표현자가 계산되지 않는 7종의 무기 화합물을 제외한 뒤, 최종적으로 275 종의 농약류 데이터를 모델 개발에 사용하였다.
뒤에서 언급할 학습 방법에 분자 표현자를 적용하여 분자의 구조적 특성과 급성 독성과의 관계를 분석해 내고, 이를 통해 독성 분자의 구조적 공통점과 독성 메커니즘을 설명할 수 있다. 본 연구에서는 PreADMET v2.0 프로그램9을 이용하여 2차원 화학 구조로부터 분자 표현자들을 계산하였고, 계산된 표현자들은 143종의 구성 요소 표현 자(constitutional descriptors), 79종의 정전기적 표현자(electrostatic descriptors), 24종의 기하학적 표현자(geometrical descriptors), 3종의 물리 화학적 표현자(physicochemical descriptors), 95종을 위상학적 표현자(topological descriptors), 그리고 화학적 상호 작용점(chemical feature)들간의 결합간 거리 정보를 포함하는 231종의 CATS (Chemical Advanced Template Search)10 표현자가 사용되었다. 최종적으로 총 558종의 2차원 분자 표현자가 모델 구현에 앞서서 데이터 전처리 과정에 적용되었다.
0 프로그램9을 이용하여 2차원 화학 구조로부터 분자 표현자들을 계산하였고, 계산된 표현자들은 143종의 구성 요소 표현 자(constitutional descriptors), 79종의 정전기적 표현자(electrostatic descriptors), 24종의 기하학적 표현자(geometrical descriptors), 3종의 물리 화학적 표현자(physicochemical descriptors), 95종을 위상학적 표현자(topological descriptors), 그리고 화학적 상호 작용점(chemical feature)들간의 결합간 거리 정보를 포함하는 231종의 CATS (Chemical Advanced Template Search)10 표현자가 사용되었다. 최종적으로 총 558종의 2차원 분자 표현자가 모델 구현에 앞서서 데이터 전처리 과정에 적용되었다.
데이터처리
본 연구에서는 두 가지의 모델 검증 과정을 수행하였다. 첫 번째 방법은 교차 검증(cross-validation) 방법으로 훈련 데이터를 정해진 수의 묶음(fold)으로 구분한 뒤, 묶음 중 한 가지를 제외한 다른 묶음들로 QSAR모델을 구현하고, 제외된 묶음을 모델에 적용하여 예측한 결과를 얻도록 한다. 이러한 과정은 한 묶음씩 번갈아 제외하여 예측한 결과를 얻도록 하고, 제외시킨 묶음들을 모두 모으면 전체 훈련 데이터의 수와 같으므로 제외된 묶음들의 예측값에 대한 적합도를 측정하여 평가하는 방법이다.
데이터 전처리 방법을 이용하여 216종의 분자 표현자로 축약한 뒤에, 모집단 기반 전진 선택법을 이용하여 교차 검증법의 적합도에 따라 표현자를 선택하도록 하였다. 표현자 선택, 교차 검증 등 모델 구현을 위해 사용된 모든 학습 방법들은 공개 프로그램인 Rapidminer v5.015프로그램을 사용하여 결과를 얻었다. 표현자 선택을 위해 사용한 전진 선택법은 교차 검증 의 적합도를 가장 잘 향상 시키는 표현자를 차례대로 개별 수식에 추가하게 되므로, 최종적으로 모델에 적합한 최적의 표현자 수를 결정할 필요가 있다.
이 과정은 화합물간의 종속변수(Y)만을 뒤섞고, 그 외의 과정(데이터 전처리부터 학습 방법 적용)은 앞에서 최적 모델을 결정할 때와 동일한 과정으로 수행하였고, 그 결과는 Table 6에 나타내었다. 이 과정은 총 50번을 반복하여 수행하였고, 마찬가지로 교차 검증방법에 의해 결정된 적합도(#, RMSECV, MAECV)를 계산하였다. 결과적으로 Yscrambling test에서 얻은 적합도는 최적 모델의 적합도와 비교하여 큰 차이를 나타내므로, 이 모델은 우연 상관성이 없는 것으로 확인할 수 있었다.
이론/모형
데이터 전 처리 과정을 통해 선별된 표현자로 QSAR 모델을 구현할 때, 학습 방법에 적합한 표현자를 선택 하는 과정이 또한 필요하다. 본 연구에서는 모집단 기반 전진 선택(population based Forward selection)방법11을 통해서 각 학습 방법에 적합한 표현자를 선택하도록 하였다. 기본적으로 전진 선택 방법을 간단히 설명 하면, 모델의 적합도를 가장 증가시키는 표현자를 처음 추가하고, 이 다음부터는 이전 모델의 적합도를 가장 향상시키는 표현자를 다음으로 추가하면서 가장 최적이 되는 기준값에 도달할 때 까지 추가하는 방법이다.
SVM방법의 고차원 공간 변환은 Gaussian radial basis function를 이용하였고, SVM방법내의 추가적인 매개 변수를 제거할 수 있는 γ-SVM방법13을 적용하였다.
본 연구에서 QSAR모델을 구현하기 위한 학습방법으로 선형 모델인 다중 선형 회귀(Multiple Linear Regression: MLR)방법과 비선형 모델인 서포트 벡터 머신(Support Vector Machine: SVM)과 인공 신경망(Artificial Neural Network: ANN)방법을 적용하였다. 다중 선형 회귀은 종속변수(Y)와 하나 이상의 독립 변수(X) 관계를 선형 회귀식으로 나타낸 것이며, 형태는 아래와 같다.
성능/효과
9이상인 표현자들은 두 표현자들이 서로 중복으로 표현되므로, 이 중 다른 표현자와의 상관 계수들이 평균적으로 큰 표현자를 제거하였고, 이 과정으로 총 70여종의 표현자들을 제거하였다. 최종적으로 세가지 과정을 통해 기본적인 학습 모델에 적용할 표현자수를 216종으로 줄이게 되었다.
각 학습 방법의 통계 결과를 비교하면, SVM방법이 교차 검증의 적합도 뿐만 아니라, 훈련 데이터에서의 적합도에서도 다른 방법과 비교하여 가장 우수한 것으로 나타났고, 실험값과 예측값과의 비교는 Fig. 3에 나타내었다. 교차 검증에 의한 #값을 3가지 학습 방법에 대하여 모두 0.
하지만 너무 높은 AlogP98값은 큰 비극성을 띄어서 물에 잘 녹지 않아 독성 물질이 지질 층까지 도달하지 못하고, 너무 낮은 AlogP98값은 물에 많이 분포하나 독성 물질이 큰 극성을 띄기 때문에 비극성인 지질층을 통과하지 못한다.19 결론적으로 물에 어느 정도 녹으면서도 비극성 성질을 지닌 물질이 독성으로 크게 작용 할 것이다. HRNCS (The relative negative charged surface area to H-bond acceptors atoms) 표현자는 수소결합받게 원자당 (−)전하를 지닌 표면적으로서, 수소결합받게의 수에 비해 상대적으로 (−)전하 를 지닌 표면적이 크면 어류의 표피와 반응성이 증가 되어 독성이 증가한다고 볼 수 있다.
그 이외의 표현자들은 모델 내에서의 기여도가 낮아서 상세하게 설명하지 않고 생략하도록 한다. 표현자를 이용한 무지개 송어의 MLR모델 분석을 통해서 특정 화학 구조의 반응성(Noring3, HRNCS)에 의한 어독성을 확인할 수 있었고, 분자의 친지성이 높고(AlogP98), 전하를 띤 표면적이 감소할수록(FraVSAdon, CATSAccNeg2, (+)PSAMPEOE, FPSA1, NoSdO) 어류 지질층을 통과하기가 용이하여 어독성을 나타낸다라는 사실을 확인할 수 있었다.
본 연구에서는 구현된 각 모델들의 예측값을 EU에서 정한 기준으로 분류하였을 때의 정확도(accuracy, %)를 계산하여 Table 5에 나타내었다. 각 분류 별로 정확도를 확인해 보면, MLR과 ANN방법의 경우에서는 class I과 II의 정확도는 우수한 반면에 class III과 IV의 정확도가 낮음을 알 수 있다. 반면에 SVM모델의 경우는 가장 낮은 정확도를 나타낸 것이 class IV로 약 78%를 나타내었고, 이 외의 class의 정확도는 모두 80%이상이었다.
반면에 SVM모델의 경우는 가장 낮은 정확도를 나타낸 것이 class IV로 약 78%를 나타내었고, 이 외의 class의 정확도는 모두 80%이상이었다. 전체 화합물에 대한 정확도에서도 SVM방법이 87%로 가장 우수한 것을 확인 할 수 있었다.
이 과정은 총 50번을 반복하여 수행하였고, 마찬가지로 교차 검증방법에 의해 결정된 적합도(#, RMSECV, MAECV)를 계산하였다. 결과적으로 Yscrambling test에서 얻은 적합도는 최적 모델의 적합도와 비교하여 큰 차이를 나타내므로, 이 모델은 우연 상관성이 없는 것으로 확인할 수 있었다.
본 연구에 사용된 모든 학습 방법은 5묶음 교차 검증 법과 Y-scrambling test 에 의해서 얻은 적합도(#, RMSECV, MAECV)를 통해서 모델의 예측 능력과 견고함을 확인 할 수 있었다. 학습 방법 중에서 SVM방법은 가장 좋은 예측 결과를 나타내었고, MLR방법을 통해서는 어독성을 유발하는 반응성에 대한 구조적 특징과 지질 투과성 및 정전기적인 상호 작용의 영향 등을 모델에 사용된 표현자를 통해서 설명할 수 있었다. 특히 EU에서 규정한 규제 기준에 따라 농약류를 분류하여 87%의 정확도를 나타내므로, 이 모델은 규제기관의 관리용 방법으로 활용할 수 있는 가능성을 제기 할 수 있었다.
학습 방법 중에서 SVM방법은 가장 좋은 예측 결과를 나타내었고, MLR방법을 통해서는 어독성을 유발하는 반응성에 대한 구조적 특징과 지질 투과성 및 정전기적인 상호 작용의 영향 등을 모델에 사용된 표현자를 통해서 설명할 수 있었다. 특히 EU에서 규정한 규제 기준에 따라 농약류를 분류하여 87%의 정확도를 나타내므로, 이 모델은 규제기관의 관리용 방법으로 활용할 수 있는 가능성을 제기 할 수 있었다. 특히 규제기관에서 현재 어독성이 측정되지 않은 농약류에 대하여 어독성 실험의 우선순위를 결정하는 분야에 기여할 수 있을 것으로 예상한다.
학습방법으로 선형 모델(MLR), 비선형 모델(SVM, ANN)을 이용하였고, 2차원 화학 구조에서 쉽게 계산할 수 있는 표현자만을 이용하여 QSAR예측모델을 구현하였다. 본 연구에 사용된 모든 학습 방법은 5묶음 교차 검증 법과 Y-scrambling test 에 의해서 얻은 적합도(#, RMSECV, MAECV)를 통해서 모델의 예측 능력과 견고함을 확인 할 수 있었다. 학습 방법 중에서 SVM방법은 가장 좋은 예측 결과를 나타내었고, MLR방법을 통해서는 어독성을 유발하는 반응성에 대한 구조적 특징과 지질 투과성 및 정전기적인 상호 작용의 영향 등을 모델에 사용된 표현자를 통해서 설명할 수 있었다.
후속연구
특히 EU에서 규정한 규제 기준에 따라 농약류를 분류하여 87%의 정확도를 나타내므로, 이 모델은 규제기관의 관리용 방법으로 활용할 수 있는 가능성을 제기 할 수 있었다. 특히 규제기관에서 현재 어독성이 측정되지 않은 농약류에 대하여 어독성 실험의 우선순위를 결정하는 분야에 기여할 수 있을 것으로 예상한다.
질의응답
핵심어
질문
논문에서 추출한 답변
각 제도의 등록 시에 필요한 항목은 무엇이 있는가?
1 이를 필두로 CHINA-REACh (중국), Smart-REACh (대만), 화심법(일본), TSCA (미국)등의 국제적인 화학물질 관리제도들도 물질 규정에 대한 제정 또는 개정의 작업을 진행 하고 있다. 각 제도의 등록 시에 필요한 항목은 국가 또는 연간 생산량에 따라 차이가 있으나, 주로 물리 화학적 물성(녹는점, 끓는점, 용해도 등), 환경 수명 물성(가수분해, 생분해 등), 환경 독성(어류, 박테리아 등의 급성, 만성 독성 등), 인체 유해성(유전 독성, 발암성 등)이 있다.
REACh란 무엇인가?
EU의 신화학 물질 관리제도인 REACh (Registration, Evaluation, Authorization and Restriction of Chemicals)가 2007년부터 시행되면서, EU내에서 제조 및 수입되는 화학 물질, 혼합물, 완제품 포함 물질에 대해 등록, 평가, 허가 및 제한하도록 하였다.1 이를 필두로 CHINA-REACh (중국), Smart-REACh (대만), 화심법(일본), TSCA (미국)등의 국제적인 화학물질 관리제도들도 물질 규정에 대한 제정 또는 개정의 작업을 진행 하고 있다.
EU의 신화학 물질 관리제도인 REACh를 필두로 중국, 대만, 일본, 미국 등에서 진행된 화학물질 관리제도는 무엇인가?
EU의 신화학 물질 관리제도인 REACh (Registration, Evaluation, Authorization and Restriction of Chemicals)가 2007년부터 시행되면서, EU내에서 제조 및 수입되는 화학 물질, 혼합물, 완제품 포함 물질에 대해 등록, 평가, 허가 및 제한하도록 하였다.1 이를 필두로 CHINA-REACh (중국), Smart-REACh (대만), 화심법(일본), TSCA (미국)등의 국제적인 화학물질 관리제도들도 물질 규정에 대한 제정 또는 개정의 작업을 진행 하고 있다. 각 제도의 등록 시에 필요한 항목은 국가 또는 연간 생산량에 따라 차이가 있으나, 주로 물리 화학적 물성(녹는점, 끓는점, 용해도 등), 환경 수명 물성(가수분해, 생분해 등), 환경 독성(어류, 박테리아 등의 급성, 만성 독성 등), 인체 유해성(유전 독성, 발암성 등)이 있다.
참고문헌 (22)
J. Ahlers, F. Stock and B. Werschkun, Environ. Sci. Pollut. Res., 15(7), 565-572 (2008).
'Technical Guidance Document in support of Commission directive 93/67/EEC for new notified substances and Commission regulation (EC) No 1488/94 on risk assessment for existing substances', Brussels, 1996.
J. S. Jaworska, M. Comber, C. Auer and C. J. Van Leeuwen, Environ. Health Perspect, 111(10), 1358-1360 (2003).
'Development of Environmental Modules for Evaluation of Toxicity of pesticide Residues in Agriculture (DEMETRA)', project supported by the European Commission, Contract No. QLK5-CT-2002-00691.
A. Roncaglioni, E. Benfenati, E. Boriani and M. Clook, J. Environ. Sci. Health, Pt. B:Pestic., Food Contam., Agric. Wastes, 39(4), 641-652 (2004).
※ AI-Helper는 부적절한 답변을 할 수 있습니다.