당뇨병 치료제 후보약물 정보를 이용한 기계 학습 모델과 주요 분자표현자 도출
A machine learning model for the derivation of major molecular descriptor using candidate drug information of diabetes treatment 원문보기

한국융합학회논문지 = Journal of the Korea Convergence Society, v.10 no.3, 2019년, pp.23 - 30  

남궁윤 (연세대학교 융합기술경영공학과) ,  김창욱 (연세대학교 산업공학과) ,  이창준 ((주)닷매틱스)

본 연구는 당뇨병 치료제 후보약물 정보를 이용하여 항당뇨에 영향을 미치는 물질구조를 발견하는데 목적이 있다. 정량적구조 활성관계를 이용한 기계 학습 모델을 만들고 부분최소자승 알고리즘을 통해 실험데이터 별로 결정계수를 파악한 후 변수중요도척도를 활용하여 주요 분자표현자를 도출하였다. 연구 결과, 후보약물 구조정보를 반영한 molecular access system fingerprint 데이터로 분석한 결과가 in vitro 데이터를 이용한 분석 결과보다 설명력이 높았으며, 항당뇨에 영향을 미치는 주요 분자표현자 역시 다양하게 도출할 수 있었다. 제안된 항당뇨 예측 및 주요인자 분석 방법을 활용한다면 유사한 과정을 반복 실험하는 기존 신약개발 방식과는 달리, 많은 비용과 시간이 소요되는 후보물질 스크리닝 (screening) 기간을 최소화하고, 신약개발 탐색기간도 단축하는 계기가 될 수 있을 것으로 기대한다.

The purpose of this study is to find out the structure of the substance that affects antidiabetic using the candidate drug information for diabetes treatment. A quantitative structure activity relationship model based on machine learning method was constructed and major molecular descriptors were de...


문제 정의

  • 본 연구는 항당뇨 화합물 구조와 활성간의 관계를 PLS 기법을 이용해서 도출하였고, 변수 간 다중공선성이 존재할 때 변수선택 예측성능이 우수한 PLS-VIP 알고리즘을 통해 항당뇨에 영향을 미치는 주요 인자를 확인해 보았다. 연구 결과, 화합물 구조를 표현하는 MACCS fingerprint 방식의 검증데이터가 통계적으로 설명력( = 0.
  • 본 연구에서는 당뇨병 치료제 합성화합물 개발을 위해 실험용 쥐에 혈당 개선 효과를 측정한 in vivo 실험 결과 값과 화합물의 구조 및 구조에 따른 다양한 물리화학적 특성을 가지는 화합물 데이터를 확보하였으며[27-30], 총 세 가지 실험을 진행했다. 첫 번째 실험에서 독립변수는 in vitro 실험 값과 계산 값 (데이터집합)이며 자세한 설명은 Table 1과 같다.
  • PLS-VIP) 알고리즘을 사용하여 모델링하는 방법을 제안한다. 제안된 모델을 통해 당뇨병 치료제 유효물질 정보에 대한 주요 분자표현자를 도출하고 항당뇨에 미치는
    물질 구조에 대해 예측하여 많은 비용과 시간이 소요되는 후보물질 스크리닝 (screening) 기간 최소화와 신약개발 탐색기간 단축을 목적으로 한다
핵심어 질문 논문에서 추출한 답변
국내 2017년 당뇨병 환자 증가율과 진료비의 규모는 얼마인가? 2018년 건강보험 통계연보 보도자료에 따르면 2010년부터 2017년까지 만성질환 진료현황에서 당뇨병 진료인원은 286만 여명으로 평균 5.1%의 꾸준한 증가세를 보이고 있으며, 특히 2017년에는 전년 대비 5.9%의 증가율과 22,238억 원의 진료비가 발생하고 있다[3]. 본 연구는 식(1)과 같이 화합물 구조 (molecular structure)와 활성 (activity) 간의 관계를 데이터를 이용해서 설명하는 정량적구조 활성관계(quantitative structure activity relationship: QSAR) 접근 방식을 채택한다.
제약산업의 특징은 무엇인가? 제약산업은 국민의 생명과 건강을 책임지는 미래 성장 산업분야의 성격을 가지고 있다. 특히 신약개발 기간은 여러 단계를 거쳐 평균 13.
신약개발의 어려운 부분은 무엇인가? 제약산업은 국민의 생명과 건강을 책임지는 미래 성장 산업분야의 성격을 가지고 있다. 특히 신약개발 기간은 여러 단계를 거쳐 평균 13.7년이 소요되며 전임상까지의 개발 성공률은 3%[1]로 성공률이 매우 낮은 고위험 산업의 특징을 가지고 있다. 그 중 탐색기간은 2 ~ 4년[2]이 소요되며, Fig.
