켐아이넷(주) / 서울특별시 양천구 목동중앙로 **, *층 ***호(목동, 목동글로리파크)
대한민국 (식품의약품안전처장) / 충청북도 청주시 흥덕구 오송읍 오송생명*로 ***
대리인 / 주소
특허법인 아이퍼스
심사청구여부
있음 (2022-02-09)
심사진행상태
등록결정(일반)
법적상태
등록
초록▼
본 발명의 일 실시예에 따른 머신러닝 모형 기반 화학물질의 자동 분류 방법은, 학습용 DB 구성부가 화학물질 데이터베이스로부터 화학물질의 물질명이 포함된 화학물질 데이터를 수신하고, 상기 화학물질 데이터로부터 인공지능 학습 데이터를 추출하는 제1 단계; 상기 학습용 DB 구성부가 학습용 DB에 상기 인공지능 학습 데이터를 저장시켜 상기 학습용 DB를 구성하는 제2 단계; 알고리즘 학습부가 상기 인공지능 학습 데이터로부터 화학물질 구조를 수집하는 제1 머신러닝 알고리즘을 학습시키고, 상기 화학물질 구조를 이루는 각 화학물질에 대해 정
본 발명의 일 실시예에 따른 머신러닝 모형 기반 화학물질의 자동 분류 방법은, 학습용 DB 구성부가 화학물질 데이터베이스로부터 화학물질의 물질명이 포함된 화학물질 데이터를 수신하고, 상기 화학물질 데이터로부터 인공지능 학습 데이터를 추출하는 제1 단계; 상기 학습용 DB 구성부가 학습용 DB에 상기 인공지능 학습 데이터를 저장시켜 상기 학습용 DB를 구성하는 제2 단계; 알고리즘 학습부가 상기 인공지능 학습 데이터로부터 화학물질 구조를 수집하는 제1 머신러닝 알고리즘을 학습시키고, 상기 화학물질 구조를 이루는 각 화학물질에 대해 정량화된 독립변수 셋을 데이터셋 설정부로부터 수신한 후에 상기 각 화학물질에 상기 독립변수 셋의 독립변수를 적용시켜 상기 각 화학물질의 화학물질군을 분류하는 제2 머신러닝 알고리즘을 학습시키는 제3 단계; 인공지능모델 생성부가 상기 제1 머신러닝 알고리즘 기반의 제1 인공지능모델과 상기 제2 머신러닝 알고리즘 기반의 제2 인공지능모델을 생성하는 제4 단계; 성능 평가부가 상기 제2 인공지능모델의 화학물질군 분류 정확도를 기반으로 상기 제2 인공지능모델의 성능을 평가하는 제5 단계; 및 상기 제2 인공지능모델이 업로드되는 미지(Unknown) 데이터로부터 종속변수인 화학물질군을 자동 분류하는 제6 단계;를 포함할 수 있다.
대표청구항▼
머신러닝 모형 기반 화학물질의 자동 분류 코딩 시스템에서 화학물질을 자동 분류하는 방법에 있어서,학습용 DB 구성부가 화학물질 데이터베이스로부터 화학물질의 물질명이 포함된 화학물질 데이터를 수신하고, 상기 화학물질 데이터로부터 인공지능 학습 데이터를 추출하는 제1 단계;상기 학습용 DB 구성부가 학습용 DB에 상기 인공지능 학습 데이터를 저장시켜 상기 학습용 DB를 구성하는 제2 단계;알고리즘 학습부가 상기 인공지능 학습 데이터로부터 화학물질 구조를 수집하는 제1 머신러닝 알고리즘을 학습시키고, 상기 화학물질 구조를 이루는 각 화학
머신러닝 모형 기반 화학물질의 자동 분류 코딩 시스템에서 화학물질을 자동 분류하는 방법에 있어서,학습용 DB 구성부가 화학물질 데이터베이스로부터 화학물질의 물질명이 포함된 화학물질 데이터를 수신하고, 상기 화학물질 데이터로부터 인공지능 학습 데이터를 추출하는 제1 단계;상기 학습용 DB 구성부가 학습용 DB에 상기 인공지능 학습 데이터를 저장시켜 상기 학습용 DB를 구성하는 제2 단계;알고리즘 학습부가 상기 인공지능 학습 데이터로부터 화학물질 구조를 수집하는 제1 머신러닝 알고리즘을 학습시키고, 상기 화학물질 구조를 이루는 각 화학물질에 대해 정량화된 독립변수 셋을 데이터셋 설정부로부터 수신한 후에 상기 각 화학물질에 상기 독립변수 셋의 독립변수를 적용시켜 상기 각 화학물질의 화학물질군을 분류하는 제2 머신러닝 알고리즘을 학습시키는 제3 단계;인공지능모델 생성부가 상기 제1 머신러닝 알고리즘 기반의 제1 인공지능모델과 상기 제2 머신러닝 알고리즘 기반의 제2 인공지능모델을 생성하는 제4 단계;성능 평가부가 상기 제2 인공지능모델의 화학물질군 분류 정확도를 기반으로 상기 제2 인공지능모델의 성능을 평가하는 제5 단계; 및상기 제2 인공지능모델이 업로드되는 미지(Unknown) 데이터로부터 종속변수인 화학물질군을 자동 분류하는 제6 단계;를 포함하고,상기 인공지능 학습 데이터는,노출평가를 위하여 위해도 결정에 필요한 제반정보가 포함된 물질목록으로서 화학물질의 물질명, 화학물질군, 화학물질코드, 약어, Cas 등록번호, SMILES 코드, 독성정보, 독성수치가 포함되며,상기 제3 단계는,상기 제1 머신러닝 알고리즘이 상기 학습용 DB로부터 상기 인공지능 학습 데이터를 크롤링하는 단계;상기 제1 머신러닝 알고리즘이 자연어처리 기술을 통해 상기 크롤링된 인공지능 학습 데이터로부터 화학물질 구조를 문자열로 나타낸 SMILES 코드를 수집하는 단계;상기 데이터셋 설정부가 상기 알고리즘 학습부로부터 상기 제1 머신러닝 알고리즘이 수집한 SMILES 코드를 수신하는 단계;상기 데이터셋 설정부가 상기 SMILES 코드의 분석을 통해 상기 화학물질 구조를 이루는 화학물질을 판단하는 단계;상기 데이터셋 설정부가 상기 화학물질에 대해 정량화된 독립변수 셋을 생성하는 단계;상기 데이터셋 설정부가 상기 독립변수 셋을 알고리즘 학습부로 송신하는 단계;상기 알고리즘 학습부가 상기 데이터셋 설정부로부터 독립변수 셋을 수신하는 단계;상기 알고리즘 학습부가 상기 독립변수 셋을 전처리하는 단계; 및상기 제2 머신러닝 알고리즘이 상기 인공지능 학습 데이터의 각 화학물질마다 상기 전처리된 독립변수 셋의 독립변수를 적용하여 상기 인공지능 학습 데이터에 포함된 각 화학물질의 화학물질군을 분류하는 단계;를 포함하고,상기 독립변수 셋을 전처리하는 단계는,상기 알고리즘 학습부가 상기 독립변수 셋을 이루는 복수의 독립변수 중 결측치가 존재하는 일부 독립변수를 제외하여 상기 독립변수 셋의 독립변수를 1차 축소시키는 단계; 및상기 알고리즘 학습부가 결측치가 존재하는 일부 독립변수가 제외된 나머지 복수의 독립변수로부터 중요변수를 선정하여 상기 독립변수 셋의 독립변수를 2차 축소시키는 단계;를 포함하며,상기 알고리즘 학습부는,상기 일부 독립변수가 제외된 독립변수 셋을 화학물질군의 분류에 유효한 복수개의 머신러닝 모델에 적용하여, 상기 복수개의 머신러닝 모델 중 화학물질군 분류 정확도가 가장 높은 머신러닝 모델을 상기 제2 머신러닝 알고리즘에 적용될 최적의 후보 머신러닝 모델로 선정하고,상기 복수개의 머신러닝 모델은,랜덤 포레스트, 결정 트리, 다항 로지스틱 회귀, 서포트 벡터 머신 및 신경망을 포함하고,상기 성능 평가부는,상기 제2 인공지능모델의 화학물질군 분류 정확도가 기설정된 값 이상일 경우, 상기 제2 인공지능모델이 화학물질군을 자동 분류하기에 적합한 인공지능모델인 것으로 판단하며, 판단 결과를 사용자에게 제공하고,상기 제2 인공지능모델이 적합한 인공지능모델로 판단되는 기준인 기설정된 값은 85%의 화학물질군 분류 정확도이며, 상기 제2 인공지능모델은 화학물질군 분류 정확도가 기설정된 값인 85% 이상일 때 상기 성능 평가부로부터 적합한 인공지능모델로 판단되고,상기 미지 데이터는,상기 학습용 DB로 채택된 DB보다 확장된 인공지능 학습 데이터를 저장하는 데이터베이스에 저장되는 인공지능 학습 데이터이며,상기 제1 인공지능모델은,단말에 기저장된 애플리케이션 또는 프로그램의 실행을 통해 상기 단말의 디스플레이에 출력되어 사용자에게 제공되고, 상기 사용자가 화학물질을 검색하는 것이 가능한 검색 영역이 포함되며, 상기 검색 영역에는 입력된 화학물질에 대한 데이터가 포함된 인공지능 학습 데이터가 크롤링됨으로써, 상기 사용자에게 인공지능 학습 데이터를 제공하는 것을 특징으로 하는 머신러닝 모형 기반 화학물질의 자동 분류 방법.
연구과제 타임라인
LOADING...
LOADING...
LOADING...
LOADING...
LOADING...
이 특허에 인용된 특허 (2)
[한국]
인공지능에 기반한 대상 물질의 유해성과 위해성 예측 방법 |
이율희,
윤영선,
이혜정
※ AI-Helper는 부적절한 답변을 할 수 있습니다.