보고서 정보
주관연구기관 |
가톨릭대학교 산학협력단 |
연구책임자 |
김석일
|
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 |
한국어
|
발행년월 | 2008-10 |
주관부처 |
보건복지부 |
연구관리전문기관 |
질병관리본부 Korea Center for Diease Control and Prevention |
등록번호 |
TRKO201300000642 |
DB 구축일자 |
2013-05-20
|
키워드 |
표준화.인체유래생물자원 용어.Standardization.terrns in biological resource.
|
초록
▼
의생물학 연구 분야에서 는 유전체 연구가 각광을 받고 있으며, 이들 자료를 특성상 새로 발생하는 정보의 양이 크게 증가하고 있다. 또한 이들 자료는 임상 및 역학정보 등과 서로 연계가 되어야 그 가치를 발할 수 있다.
질병관리본부에서는 의생물학적 연구에 필요한 기초 시료를 확보하기 위한 사업인체유래생물자원 중앙 및 지역거점은행을 시작하였다. 그 과정에서 유전체의 표현형에 해당하는 임상 및 역학정보와의 연계가 필요하게 되었다. 그러나 현재 상태에서는 같은 의미의 용어가 서로 다른 형태로 표현 되거나 각 사업에서 서로 상이하게
의생물학 연구 분야에서 는 유전체 연구가 각광을 받고 있으며, 이들 자료를 특성상 새로 발생하는 정보의 양이 크게 증가하고 있다. 또한 이들 자료는 임상 및 역학정보 등과 서로 연계가 되어야 그 가치를 발할 수 있다.
질병관리본부에서는 의생물학적 연구에 필요한 기초 시료를 확보하기 위한 사업인체유래생물자원 중앙 및 지역거점은행을 시작하였다. 그 과정에서 유전체의 표현형에 해당하는 임상 및 역학정보와의 연계가 필요하게 되었다. 그러나 현재 상태에서는 같은 의미의 용어가 서로 다른 형태로 표현 되거나 각 사업에서 서로 상이하게 활용되고 있어, 이에 대한 표준화가 필요한 실정이다.
본 연구는 인체유래생물자원에 관련된 전문용어를 표준화하여 향후 인체유래생물자원 관련정보를 효율적으로 수집, 활용 및 상호 교환할 수 있는 체계를 구축하기 위해 수행하였다.
연구 개발의 표준화 대상이 되는 인체유래생물자원 관련 전문용어는 임상 3106건 (약 27%), 역학 7194건 (약 63%),일반 445건 (약 4%),자원관리 764건 (약 6%)이었다. 연구는 원시자료 수집 및 정리, 가공자료 정리, 정보항목 목록 추출 및 코드 할당, 정보 항목 관계 설정, 정보항목 분류 적용, 표준화 처리용 서식 자료 작성,인체유래생물자원 지식 표준화 DB(가칭) 전환의 7단계로 진행되었다.
자료 테이블은 항목이름, 항목 값 세트, 항목 값, 항목이름-항목값세트 연결, 항목 값 세트, 항목 값 연결 테이블, 이를 통합한 테이블(구분, 분류, 그룹1,2,3차 상 하위 관계 표현으로 구성하였다. 자료의 각 필드(field) 구성은 구분, 분류, 그룹1,2, 3차, 항목이름, 항목 값 세트, 항목 값, 설명,동의어,테이터타입,단위,비고,표준용어(코드),대표용어(코드로 작정하였다. 연구 산출물의 최종 코드는 보건복지부에서 연구과제로 수행중인 표준용어 KOSTOM을 활용하였다.
표준화 적용된 인체유래생물자원 용어 체계를 효율적으로 관리하기 위해서 연구 개발 결과 자료를Apelon DTS Editor에 맞도록 정 리하였다. Apelon DTS Editor는 Apelon Inc.에서 Open Source로 제공하는 용어 관리 툴(tool)이다. 이는 용어 체계를 트리(tree) 구조로 보여줌으로써 사용자와 개발자가 용어구성을 쉽게 이해하고 관리할 수 있도록 하였다.
표준화 작업을 거친 본 연구 결과는 인체유래생물자원 용어 체계에서의 자료 교환과 활용 편의성을 증대시켜, 향후 인체유래생물자원을 수집, 활용하고자 하는 연구사업의 정보화에 중요 자료가 될 것이다.
Abstract
▼
The major trend in biomedical research is now focused on genes. The data per each gene from researches are huge in size and have much information(genotype). However, the information is useless with corresponding clinical and epidemiological information (phonotypeX The combinationof these two data in
The major trend in biomedical research is now focused on genes. The data per each gene from researches are huge in size and have much information(genotype). However, the information is useless with corresponding clinical and epidemiological information (phonotypeX The combinationof these two data into one is a new trend in the field of biomedical research and biomedical informatics.
KCDC (Korean Center of DiseaseControl) started central and local banks for biological resources derived from human beings to gather genomic data with clinical and/or epidemiological data that can be used for the biomedical researches. While treating the data from the clinicaland/or epidemiological data, standard terms based on concept were needed to improve the quality and to increase reusability because a concept was presented as different forms (synonym) and used differently by projects. The purpose of the studyis to standardize the terms from clinical and/or epidemiological data that are bound to biological resources derived from human beings.
There are four domains of datain terms about biological resources derived from human beings. The domains are consist of 1,934 clinical terms (33%), 3,292 epidemiological terms(55%), 345 general terms (6%), and343 terms for resource management (6%). Six tables were derived from the data of the domains: items-name, items-valueset, items-value,name-value set relationship, value set-value relation and integrated table including section,category, groupl, 2,3,items-name,items-value set, items-value,definition,synonym,note, standard term code, preferred term code.
The process was composed of7 consecutive steps: collecting and organizing of KCDC data,items and arrangement of standardization code, setting relations of information items, classification application of information items, filling forms about standardization process, and conversion into DB of biological resource knowledge representation derived from human beings.
Apelon DTS Editor, an open source terminology management software, was introduced to present the final product in concept tree so that the final users and developers can share the common concepts.
The final product will be beneficial for the future biomedical researches by increasing the interoperability and usability of terms based on concept orientation that are tight connected to the biological resources derived from human beings.
목차 Contents
- 표 목차 ... 4
- 그림 목차 ... 5
- I. 연구개발결과 요약문 ... 6
- II. 학술연구용역사업 연구결과 ... 8
- 제1장 최종 연구개발 목표 ... 8
- 제1절 목표 ... 8
- 1. 연구 배경 ... 8
- 2. 연구개발 목적 ... 9
- 3. 연구개발 필요성 ... 9
- 4. 연구개발 범위 ... 9
- 제2절 목표 달성도 ... 10
- 1. 연구 목표의 달성도 ... 10
- 2. 관련 분야 연구에의 기여 ... 10
- 제3절 국내·외 기술개발 현황 ... 10
- 1. 국내·외 관련분야 기술개발 현황 ... 10
- 제2장 최종 연구개발 내용 및 방법 ... 15
- 제1절 세부 연구개발 내용 ... 15
- 1. 인체유래생물자원 관련 용어 표준화 ... 15
- 2. 표준용어 코드체계 표준화 ... 15
- 제2절 연구개발 대상 ... 15
- 1. 임상정보 ... 15
- 2. 역학정보 ... 16
- 3. 일반정보 ... 16
- 4. 자원관리정보 ... 16
- 제3절 연구개발 방법 ... 17
- 1. 원시자료 수집 및 정리 ... 17
- 2. 가공자료 정리 ... 17
- 3. 정보항목 목록 추출 및 코드 할당 ... 18
- 4. 정보항목 관계 설정 ... 18
- 5. 정보항목 분류 적용 ... 18
- 6. 표준화 처리용 서식 자료 작성 ... 18
- 7. 인체유래생물자원 지식 표준화 DB(가칭) 전환 ... 19
- 제3장 최종 연구개발 결과 ... 20
- 제1절 연구개발 결과 자료 설명 ... 20
- 1. 연구개발 결과 자료의 필드(field) 구성 및 설명 ... 20
- 2. 연구 개발 결과 자료 현황 ... 25
- 3. Genoterm을 이용한 문장 형태 정보 항목 처리 ... 27
- 4. 연구개발 결과 자료의 XML 이용 ... 28
- 제2절 연구개발 표준화 적용 결과 ... 32
- 1. 용어 개념 정리 ... 32
- 2. 정보항목 정제 및 수정 ... 33
- 3. 용어코드 할당 ... 35
- 4. 기타 분류(체계) 적용 ... 36
- 제3절 자료 테이블의 구성 ... 37
- 1. 구분 테이블(SE, Separation) ... 39
- 2. 분류 테이블(CG, Category) ... 40
- 3. 그룹1차 테이블(GR1, Group 1) ... 41
- 4. 항목이름 테이블(IN, Item Name) ... 42
- 5. 항목값세트 테이블(IS, Item Set) ... 43
- 6. 항목값 테이블(IV, Item Value) ... 44
- 7. 통합 테이블 ... 45
- 제4장 연구결과 고찰 및 결론 ... 46
- 제1절 연구결과 고찰 ... 46
- 1. 연구결과 해석 ... 46
- 2. 다른 결과와의 비교 분석 ... 46
- 3. 연구 결과에 대한 향후 고려 사항 ... 48
- 제2절 연구결과 결론 ... 49
- 참고문헌 ... 50
※ AI-Helper는 부적절한 답변을 할 수 있습니다.