$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

자연어 처리 및 기계학습을 통한 동의보감 기반 한의변증진단 기술 개발
Donguibogam-Based Pattern Diagnosis Using Natural Language Processing and Machine Learning 원문보기

Journal of Korean Medicine = 대한한의학회지, v.41 no.3, 2020년, pp.1 - 8  

이승현 (한양대학교 공과대학 정보시스템학과) ,  장동표 (한양대학교 공과대학 생체공학과) ,  성강경 (원광대학교 한의과대학 한의학과 내과학교실)

Abstract AI-Helper 아이콘AI-Helper

Objectives: This paper aims to investigate the Donguibogam-based pattern diagnosis by applying natural language processing and machine learning. Methods: A database has been constructed by gathering symptoms and pattern diagnosis from Donguibogam. The symptom sentences were tokenized with nouns, ver...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 이러한 동의보감의 모든 증상과 변증을 데이터베이스화하고, 증상에 대한 표현 및 문장에 자연어 처리 기술과 워드2벡터 모델을 적용함으로써 변증과 증상과의 관계를 분석하고자 한다. 특히 증상과 변증의 관계분석에 머무르지 않고 더 나아가 증상에 기반한 변증예측 시스템을 구성함으로써 동의보감 고전에 기반한 객관적인 변증형 도출모델을 만들고자 한다.
  • 본 연구에서는 증상에 기반하여 변증을 예측하는 시스템을 구성함으로써, 동의보감에 기반한 객관적인 변증추측 모델을 만들었다. 인공지능 및 기계학습 분야에서 흔히 사용되는 워드2벡터 모델과 동의보감의 증상조합 및 변증 데이터에 기반하여 변증 예측하는 알고리즘을 구현함으로써 현재 75% 변증 예측률(6가지의 변증)을 보였다.
  • 본 논문에서는 이러한 동의보감의 모든 증상과 변증을 데이터베이스화하고, 증상에 대한 표현 및 문장에 자연어 처리 기술과 워드2벡터 모델을 적용함으로써 변증과 증상과의 관계를 분석하고자 한다. 특히 증상과 변증의 관계분석에 머무르지 않고 더 나아가 증상에 기반한 변증예측 시스템을 구성함으로써 동의보감 고전에 기반한 객관적인 변증형 도출모델을 만들고자 한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
워드2벡터 모델링 과정에서 중요하게 고려되는 하이퍼파라메터 3가지는 무엇인가? 워드2벡터 모델링 과정에서 중요하게 고려되는 하이퍼파라메터는 크게 세 가지이다. 첫 번째 파라메터인 벡터차원은 표현되어지는 단어의 벡터의 차원의 크기를 나타낸다. 벡터 차원크기를 10으로 설정하면 한 단어 당 갖는 고유의 벡터값은 10차원에 분포된다. 두 번째 파라메터인 윈도우(Window)는 증상 문장에서 연관성 학습시 고려되는 주변단어의 수를 의미한다. 예를 들어 윈도우1이라면 중심단어를 기준으로 앞의 한 단어와 뒤의 한 단어를 주변단어로 묶어서 함께 사용되어 높은 유사성을 갖는 것으로 학습시킨다. 마지막 파라메터로는 학습의 반복횟수이다. 훈련 데이터를 반복함으로써 모델의 학습횟수가 많아질수록 단어들이 더 정교하게 고유의 벡터값을 가지는 경향이 있게 된다. 증상을 입력하여 변증을 예측하는 시스템을 구성하기 위해서는 비슷한 의미의 단어들이 비슷한 벡터로 표현될 수 있도록 동의보감 기반의 정확한 워드2벡터 모델이 구축이 필수적이다.
자연어 처리란 무엇인가? 특히 인터넷상의 대량의 문서나 SNS 자료로부터 최신 동향을 파악하기 자연어 처리 기술이 많이 적용되고 있으며, 이에 대한 기술도 급속이 발전하고 있다. 자연어 처리는 컴퓨터가 인간이 사용하는 언어를 이해하고, 분석할 수 있게 하는 기술을 총칭하는 말이다. 자연어 처리를 위해서 사람이 사용하는 언어나 글의 문장을 해석하여 형태소 단위의 단어로 정리하고, 이러한 단어와의 관계를 이용하여 컴퓨터가 인식 분석할 수 있도록 숫자화 하는 작업이 필요하다.
변증 진단 지표들은 객관적이고 합리적 분석에 기반한 정확하고 재생 가능한 변증형(辨證形)을 도출하는 데 어려움이 있는 이유는 무엇인가? 한의진단에서 중요한 변증(辨證, Differentiation and Pattern Identification of Symptoms)은 정체적 관점에서 질병의 성질, 부위, 세력(勢力) 등과 환자의 상태를 변별하는 한의학적 진단방법으로, 보고, 묻고, 듣고, 맥을 짚는 사진과정을 통하여 수집된 증상들 사이에 내재하는 상호관계와 의미를 분석하는 과정을 통해서 이루어진다. 변증 진단 지표들은 임상적 유용성이 있음에도 불구하고 직관적 혹은 주관적인 방식으로 이루어져 왔기 때문에 객관적이고 합리적 분석에 기반한 정확하고 재생 가능한 변증형(辨證形)을 도출하는 데 어려움이 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (11)

  1. Kim JK, Seol IC, Lee I, Jo HK, Yu BC, Choi SM. Report on the Korean standard differentiation of the symptoms and signs for the stroke-1. J Physiol Pathol Korean Med. 2006;20(1):229-34. 

  2. Kang BK, Go HY, Kim JK, Kim BY, Ko MM, Kang KW, et al. Study of concordance rate to measure symptoms in interanl researchers. J Physiol Pathol Korean Med. 2006;20(6):1728-31. 

  3. Go HY, Kim JK, Kang BK, Kim BY, Ko MM, Kang KW, et al. Report on the Korean standard differentiation of the symptoms and signs for the stroke-1 (KSDSSS-1). J Physiol Pathol Korean Med. 2006;20(6):1789-92. 

  4. Go HY, Kim JK, Kang BK, Kim BY, Ko MM, Kang KW, et al. Survey of stroke subtype classification. J Physiol Pathol Korean Med. 2007;21(1):318-21. 

  5. Choi SM, Yang KS. Standardization and unification of the terms and conditions used for diagnosis in oriental medicine. Korean J Orient Med. 1995;1(1):101-25. 

  6. Yang KS, Choi SH, Choi SM, Park KM, Jeong WY, Ahn KS, et al. Standardization and unification of the terms and conditions used for diagnosis in oriental medicine. II. Korean J Orient Med. 1996;2(1):381-401. 

  7. Choi SM, Yang KS, Choi SH, Park KM, Park JH, Shim BS, et al. Standardization and unification of the terms and conditions used for diagnosis in oriental medicine III. Korean J Orient Med. 1997;3(1):41-65. 

  8. KOREA INSTITUTE OF ORIENTAL MEDICINE (KIOM). 한의학고전DB. 

  9. 서울대학교 IDS연구실. 꼬꼬마(KKMA) 세종 말뭉치 활용 시스템. 2010. Available from: http://kkma.snu.ac.kr/ 

  10. Eddie. 딥 러닝을 이용한 자연어 처리 입문. 대한민국. Wikidocs. 2020. 

  11. Yogatama. Learning Word Representations with Hierarchical Sparse Coding. ICML (International Conference on Machine Learning). 2015. 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로