[논문]암유전자 연구주제 네트워크 분석

장혜란; 강길원; 이은정; 김승렬; 이영성

문제 정의

그러나 논문의 특성상 연구가 종료되고 시간이 경과된 후 논문이 출판되므로 후향적인 동향분석이라는 한계를 가지고 있다. 따라서 국제적인 연구동향과의 시기별 키워드 네트워크 비교 분석으로 국내 연구단계를확인하고 향후 활발하게 연구될 주제분야를 모색하였다. 또한 국내외 상위 주제의 시기별 표준화된 연결정도 중심성 값의 기울기를 구하여 연구추세를 파악함으로서 그 한계를 극복 하고자 하였다.
국내의 경우 손대경(2011)이 MeSH 용어에 기반하여 대장암 분야의 키워드를 추출하여 연구동향을 파악한 예가 있었으나 기초의학 분야에서 MeSH 용어를 사용하여 세부주제별 키워드 네트워크를 분석한 연구는 없었다. 따라서 본 연구는 기초의학 분야인 암유전자 분야의 논문을 대상으로 MeSH 용어를 추출하여 키워드 네트워크 분석을 하였으며, 이를 통해 국내외 연구동향을 비교 분석함으로서 국내 암유전자 분야의 연구현황을 파악하고자 하였다.
따라서 제외된 키워드가 많고 이러한 키워드 중에 향후 활발하게 연구될 중요한 연구주제가 포함되어 있을 수도 있다. 따라서 이런 단점을 보완하고 정확한 결과 해석을 위해서는 반드시 전문가의 검토가 요구되며 본 연구는 전문가의 자문을 바탕으로 결과를 해석하였다.
따라서 국제적인 연구동향과의 시기별 키워드 네트워크 비교 분석으로 국내 연구단계를확인하고 향후 활발하게 연구될 주제분야를 모색하였다. 또한 국내외 상위 주제의 시기별 표준화된 연결정도 중심성 값의 기울기를 구하여 연구추세를 파악함으로서 그 한계를 극복 하고자 하였다.
암유전자가 밝혀짐에 따라 암을 정복하기 위한 노력으로 수천 종에 이르는 악성종양의 DNA염기 서열을 밝혀내는 암 게놈(암유전체)프로젝트가 전 세계적으로 활발하게 진행되고 있다. 이 프로젝트는 악성종양 조직의 DNA염기 서열을 밝혀 암을 유발하는 돌연변이 유전자의 염기서열과 인체의 건강한 조직 유전자 DNA 염기서열을 비교 분석함으로서 암 유발 유전자 변이를 발견하여 암 치료에 적용하기 위한 것이다. 세계적으로 암에 대한 원인을 규명하고 이를 위한 맞춤형 치료방법을 찾기 위한 노력이 지속적이고 빠르게 진행되고 있다.
또한 논문의 키워드를 분석 대상으로 할 경우 PubMed 데이터베이스의 MeSH 색인어 중 주요 주제어(Major topic)가 표시되므로 주요 주제어에 가중치를 주어 분석하는 것도 대안이 될 수 있다. 이러한 분석이 가지는 한계를 보완하기 위해서는 전문가의 검토가 반드시 필요하며 본 연구는 전문가의 검토를 통해 결과를 해석하였다. 향후 다양한 가중치가 부여된 추가적인 분석을 함으로서 본 연구에서 나타난 결과와의 비교로 그 유용성이 확인되어야 할 것이다.

제안 방법

‘Oncogene’을 검색어로 입력한 후 MeSH 용어로 제한 검색하여 논문을 추출하였다(2011년 3월).
구간별 키워드 네트워크를 관찰한 결과, 전체 네트워크의 경우에 초기 암의 원인과 기전을 밝혀내는 시기, 암의 원인되는 암유전자가 밝혀지면서 암유전자의 분석(Base Sequence, Amino Acid Sequence)을 통해 정보(Molecular Sequence Data)를 축적해 가는 시기, 세포생리학적 연구를 통한 암의 발병 기전에 대한 연구와 축적된 정보를 활용하여 항암제를 연구하는 단계로 진행되었다. 그리고 치료제를 개발한 후 임상에 실제로 적용하면서 치료 결과(Treatment Outcome)를 분석하는 시기, 치료의 효과를 높이기 위해 질환 단계별(Staging) 정확한 진단(Diagnosis)을 통해 질환의 진행을 예측하는 시기, 위험인자(Risk Factor)에 대한 연구로 질환을 예방(Prevention)하고자 하는 연구로 이어지고 있었다.
국내외 키워드 중 양의 값을 가지며 기울기가 큰 ‘Gene, ras’, ‘Apoptosis’, ‘Genes, erbB-2’, ‘Antineoplastic Agents’를 몇 개의 회귀함수를 적용시켜 가장 근접한 추세선을 그렸다.
선정된 키워드 대상으로 연구주제 네트워크를 구현하기 위해 사회네트워크 분석(Social Network Analysis) 소프트웨어인 NetMiner Verson 3(사이람, 한국)를 사용하였다. 네트워크 구축은 논문에 출현한 키워드를 노드(node)로 하고 서로 다른 논문에 동일한 키워드가 출현하는 경우 이들 키워드 사이에 연결(link)이 있는 것으로 간주하여 키워드 간 매트릭스를 구축하였다. 매트릭스는 사회네트워크 데이터를 표현하는 가장 기본적인 방법으로 암유전체의 경우 224개 키워드들 사이의 네트워크 구성을 위해서는 [224(키워드) × 224(키워드)]로 이루어진 매트릭스가 만들어졌다.
보건의료분야의 세부연구주제인 암유전자의 연구동향을 PubMed 데이터 분석을 통하여 지식지도로 작성하였다. 선행 연구들이 단기간의 국내 연구동향을 파악한 것과 달리 시계열적인 연구주제 네트워크 분석과 국내외 연구주제 비교를 통해 국내 연구수준의 확인과 향후 활발하게 연구될 연구주제를 확인할 수 있었다.
연결정도 중심성은 네트워크에서 중심으로서의 역할에 대한 정도를 지수화한 것으로 각 노드와 연결된 다른 노드의 수를 기준으로 한 노드에 직접적으로 연결된 노드들의 합인 연결정도(degree)를 이용하여 중심성을 계산하는 지수이다(Freeman, 1979). 본 연구에서는 연결빈도가 증가할수록 중심성이 증가하도록 가중치(weight)가 반영되는 연결정도 중심성에 의해 네트워크를 구축하였다. 따라서 연결정도 중심성 값이 클수록 키워드는 주요 키워드이며 또한 활발하게 연구되는 키워드로 해석될 수 있다(손동원, 2010).
이러한 방법으로 최종 검색된 논문은 46,019건이며 이 논문 중 한국논문은 교신저자 소속이 한국인인 논문을 대상으로 국내 연구자가 발표한 논문 467건을 분리하여 추출하였다. 분석대상 논문에서 키워드를 년도 별로 분류하여 추출하였으며, 이후 5년 단위로 나누어 단위기간별로 빈도수 상위 100위까지의 모든 키워드를 대상으로 하여 키워드를 정제하였다. 정제과정은 중복 키워드 및 서지정보 분류를 위한 문헌유형 및 연구 설계 방법론 색인어와 체크태그(check tag)를 제외 하였다.
암유전자 분야의 연구주제 동향을 살펴보기 위해 PubMed 데이터베이스로부터 ‘oncogene’을 주제로 하는 논문을 추출하였다.
연결정도 중심성에 의해 구성된 네트워크의 국내외 차이를 비교하기 위해 구간별 네트워크의 크기를 보정한 표준화된 연결정도 중심성 값을 산출하였다. PubMed 데이터베이스에서 추출된 전체논문의 키워드와 한국소속 연구자의 논문에서 추출된 키워드에서 각각 연결정도 중심성 값 상위 10개의 키워드를 추출하였다.
직선화된 기울기로는 그 변화정도를 정확하게 예측하기 어려우므로 현상을 가장 잘 설명하는 함수를 적용하여 연구주제의 추세를 예측해 보았다. 일차함수 기울기가 상승하는 키워드라 하더라도 기울기 형태에 차이가 나타났다.
시기별 표준화된 연결정도 중심성 값을 구한 후 그 기울기의 변화를 관찰하기 위해 Microsoft Office Excel 2007 프로그램의 일반선형모형 회귀분석 방법인 LINEST 함수를 이용하여 개별 키워드가 갖는 연결정도 중심성 변화를 직선화된 모형의 기울기 값을 산출하여 비교하였다. 직선화된 기울기로는 그 변화정도를 정확하게 예측하기 어려우므로 현상을 가장 잘 설명하는 함수를 적용하여 연구주제의 추세를 예측해 보았으며 그 추세가 유사한 그룹으로 분류하여 직선기울기와 비교하였다.
키워드 네트워크는 전체 키워드 네트워크와 키워드의 구간별 변화를 관찰하기 위해 5년 구간으로 나누어 구간별 키워드 네트워크를 구성하였다. 네트워크 상 구간별 주요 키워드 간 연결정도의 변화를 관찰하기 위해 가지치기 기법(pruning method)을 적용하였다.

대상 데이터

이러한 과정을 통하여 전체논문 46,019건으로 부터 680,420개의 키워드가 추출되었으며 5년 단위별 상위 100위의 키워드를 합하여 10,518개의 키워드가 추출되었다. 10,518개의 키워드를 대상으로 중복제거 및 유사어 통일, 체크태그(check tag)를 제외 하여 224개의 키워드가 최종적으로 선정되었다. 국내의 경우도 467건의 논문으로부터 7,898개의 키워드가 추출되었으며 전체 키워드와 동일한 방법으로 분석 키워드 247개를 선정하여 네트워크 분석을 하였다.
연결정도 중심성에 의해 구성된 네트워크의 국내외 차이를 비교하기 위해 구간별 네트워크의 크기를 보정한 표준화된 연결정도 중심성 값을 산출하였다. PubMed 데이터베이스에서 추출된 전체논문의 키워드와 한국소속 연구자의 논문에서 추출된 키워드에서 각각 연결정도 중심성 값 상위 10개의 키워드를 추출하였다. 이 키워드를 대상으로 중복 키워드를 제거하여 PubMed 전체 논문에서 33개 키워드, 한국 논문에서 36개의 키워드를 선정하였다.
10,518개의 키워드를 대상으로 중복제거 및 유사어 통일, 체크태그(check tag)를 제외 하여 224개의 키워드가 최종적으로 선정되었다. 국내의 경우도 467건의 논문으로부터 7,898개의 키워드가 추출되었으며 전체 키워드와 동일한 방법으로 분석 키워드 247개를 선정하여 네트워크 분석을 하였다.
본 연구는 출판된 논문을 분석대상으로 하였다. 논문은 학술정보의 유통뿐 아니라 학술매체로서 정보를 기록하고 제공하는 기능, 사회제도로서 연구실적을 발표하고 인정하는 기능 등 학술정보로서의 가치가 높은 자료이므로(김상준, 2006) 대부분의 연구동향 분석 자료로 사용된다.
하지만 네트워크상에 나타나지 않거나 연결정도가 약한 키워드일지라도 주요한 연구주제가 아니라고 단정 지을 수는 없다. 본 연구에서는 모든 키워드를 대상으로 연구주제 네트워크를 구현한 것이 아니고 빈도수 상위 키워드를 대상으로 하였다. 따라서 제외된 키워드가 많고 이러한 키워드 중에 향후 활발하게 연구될 중요한 연구주제가 포함되어 있을 수도 있다.
암유전자 연구주제 네트워크 분석을 위한 자료는 미국국립의학도서관(National Library of Medicine: 이하 NLM)의 PubMed 데이터베이스를 활용하였다. ‘Oncogene’을 검색어로 입력한 후 MeSH 용어로 제한 검색하여 논문을 추출하였다(2011년 3월).
PubMed 데이터베이스에서 추출된 전체논문의 키워드와 한국소속 연구자의 논문에서 추출된 키워드에서 각각 연결정도 중심성 값 상위 10개의 키워드를 추출하였다. 이 키워드를 대상으로 중복 키워드를 제거하여 PubMed 전체 논문에서 33개 키워드, 한국 논문에서 36개의 키워드를 선정하였다. 선정된 개별 키워드의 구간별 표준화된 연결정도 중심성 값을 산출하였으며(손대경, 2011) 그 산출식은 아래와 같다(1).
체크태그란 MeSH 용어로 논문의 키워드를 색인할 때 개별 논문에 관례적으로 부여되는 속성들로 연구대상 연령, 성별, 인종, 지역, 연구 방법론 등이 포함된다(김수영, 2007). 이러한 과정을 통하여 전체논문 46,019건으로 부터 680,420개의 키워드가 추출되었으며 5년 단위별 상위 100위의 키워드를 합하여 10,518개의 키워드가 추출되었다. 10,518개의 키워드를 대상으로 중복제거 및 유사어 통일, 체크태그(check tag)를 제외 하여 224개의 키워드가 최종적으로 선정되었다.
‘Oncogene’을 MeSH 용어로 검색할 경우 ‘Cancer Gene’, ‘Cancer Genome’, ‘Neoplasm Gene’, ‘Neoplasm Genome’ 등 유사어로 표기된 논문 모두가 검색된다. 이러한 방법으로 최종 검색된 논문은 46,019건이며 이 논문 중 한국논문은 교신저자 소속이 한국인인 논문을 대상으로 국내 연구자가 발표한 논문 467건을 분리하여 추출하였다. 분석대상 논문에서 키워드를 년도 별로 분류하여 추출하였으며, 이후 5년 단위로 나누어 단위기간별로 빈도수 상위 100위까지의 모든 키워드를 대상으로 하여 키워드를 정제하였다.
전체 224개의 키워드로 네트워크를 구축하여 절삭값 1,300을 기준으로 가지치기하여 41개의 키워드를 대상으로 네트워크를 구성하였다(그림 1). 연결정도 중심성이 높은 키워드는 대표적인 암유전자의 하나인 ‘Genes, ras’를 포함하여 ‘Molecular sequence data’, ‘Proto-Oncogenes’, ‘Base Sequence’ 였다.
전체 키워드의 시기별 변화를 보기 위해 5년 구간별로 나누어 네트워크를 구성하였으며 구간별 키워드의 비교는 각 구간별 최대 연결정도가 0.6%이상의 키워드를 대상으로 하였다. 구간별 연결정도 중심성 상위 20개 키워드는 다음과 같다(<표 1>).
암유전자 분야의 연구주제 동향을 살펴보기 위해 PubMed 데이터베이스로부터 ‘oncogene’을 주제로 하는 논문을 추출하였다. 추출된 전체 논문 46,019건의 224개 키워드, 교신저자 소속이 한국인인 논문 467건에서 247개 키워드를 대상으로 키워드 네트워크 분석을 하였다. 전체 키워드 네트워크 분석결과 대표적인 암유전자의 하나인 ‘Genes, ras’는 국내와 해외에서 공통적으로 연결정도 중심성이 높았다.

데이터처리

선정된 키워드 대상으로 연구주제 네트워크를 구현하기 위해 사회네트워크 분석(Social Network Analysis) 소프트웨어인 NetMiner Verson 3(사이람, 한국)를 사용하였다. 네트워크 구축은 논문에 출현한 키워드를 노드(node)로 하고 서로 다른 논문에 동일한 키워드가 출현하는 경우 이들 키워드 사이에 연결(link)이 있는 것으로 간주하여 키워드 간 매트릭스를 구축하였다.
시기별 표준화된 연결정도 중심성 값을 구한 후 그 기울기의 변화를 관찰하기 위해 Microsoft Office Excel 2007 프로그램의 일반선형모형 회귀분석 방법인 LINEST 함수를 이용하여 개별 키워드가 갖는 연결정도 중심성 변화를 직선화된 모형의 기울기 값을 산출하여 비교하였다. 직선화된 기울기로는 그 변화정도를 정확하게 예측하기 어려우므로 현상을 가장 잘 설명하는 함수를 적용하여 연구주제의 추세를 예측해 보았으며 그 추세가 유사한 그룹으로 분류하여 직선기울기와 비교하였다.
연구주제 네트워크를 생성하여 연구주제의 흐름을 확인하고 주요 연구주제의 파악을 위해 키워드의 빈도를 기준으로 사회네트 분석을 하였다. 사회네트워크를 분석하기 위해 개발된 중심성 척도는 노드(키워드)들의 연결에 대한 가중치를 반영하지 않는 단점이 있다(이재윤, 2006).

이론/모형

매트릭스는 사회네트워크 데이터를 표현하는 가장 기본적인 방법으로 암유전체의 경우 224개 키워드들 사이의 네트워크 구성을 위해서는 [224(키워드) × 224(키워드)]로 이루어진 매트릭스가 만들어졌다. 네트워크 내의 핵심 키워드의 변화를 관찰하기 위해 Freeman의 중심성 지수 중 연결정도 중심성(degree centrality)지수를 사용하였다. 연결정도 중심성은 네트워크에서 중심으로서의 역할에 대한 정도를 지수화한 것으로 각 노드와 연결된 다른 노드의 수를 기준으로 한 노드에 직접적으로 연결된 노드들의 합인 연결정도(degree)를 이용하여 중심성을 계산하는 지수이다(Freeman, 1979).
키워드 네트워크는 전체 키워드 네트워크와 키워드의 구간별 변화를 관찰하기 위해 5년 구간으로 나누어 구간별 키워드 네트워크를 구성하였다. 네트워크 상 구간별 주요 키워드 간 연결정도의 변화를 관찰하기 위해 가지치기 기법(pruning method)을 적용하였다. 가지치기 기법이란 일정수준 이상의 연결정도를 가지는 키워드를 대상으로 네트워크를 재구성하는 방법으로 절삭 값(cut off)을 기준으로 네트워크의 경계를 설정하는 것이다.
저자마다 다르게 색인하는 동일한 개념을 누락없이 모두 검색할 수 있으며 서지데이터베이스의 키워드와 같은 개념으로 의학문헌의 색인과 목록에 통일성과 일관성을 부여한다는 점에서(김수영, 2007) 타 데이터베이스와 구별되는 독창성을 가지고 있다. 본 논문에서는 키워드 색인에 일관성이 있으며 저자의 주관성이 배제된 키워드의 선정을 위해 MeSH 용어를 사용하였다. 국내의 경우 손대경(2011)이 MeSH 용어에 기반하여 대장암 분야의 키워드를 추출하여 연구동향을 파악한 예가 있었으나 기초의학 분야에서 MeSH 용어를 사용하여 세부주제별 키워드 네트워크를 분석한 연구는 없었다.

성능/효과

‘Genes, ras’와 ‘Apoptosis’가 연결정도 중심성이 현저히 높았으며 네트워크에서 두 개의 중심축을 형성하고 있었다.
그 결과 각종 암유전자 서열분석으로 ‘Molecular sequence data’가 풍부하게 축적되고 있음을 알 수 있었다.
선행 연구들이 단기간의 국내 연구동향을 파악한 것과 달리 시계열적인 연구주제 네트워크 분석과 국내외 연구주제 비교를 통해 국내 연구수준의 확인과 향후 활발하게 연구될 연구주제를 확인할 수 있었다. 네트워크 분석을 통해 연결정도 중심성이 높은 연구주제가 시간이 지남에 따라 중심성이 감소되어 네트워크에서 사라지고 주변 네트워크에서 있던 연구주제가 중심성이 증가하여 중심 네트워크에 편입되는 현상을 관찰함으로서 사회네트워크 분석이 보건의료분야에서도 적용이 가능함을 확인할 수 있었다. 또한 연구주제의 구간별 중심성 값의 변화 추이를 관찰함으로서 향후 활발하게 연구될 연구주제를 확인하였다.
또한 연결정도 중심성이 가장 높았고 직선상에서 기울기의 값이 가장 컸던 ‘Gene, ras’, ‘Apoptosis’를 최적 회귀함수로 나타냈을 경우 상승 추세는 국내외 모두 시기가 경과함에 따라 ‘Genes, erbB-2’, ‘Antineoplastic Agents’ 보다는 둔화되는 형태를 보였다.
그리고 치료제를 개발한 후 임상에 실제로 적용하면서 치료 결과(Treatment Outcome)를 분석하는 시기, 치료의 효과를 높이기 위해 질환 단계별(Staging) 정확한 진단(Diagnosis)을 통해 질환의 진행을 예측하는 시기, 위험인자(Risk Factor)에 대한 연구로 질환을 예방(Prevention)하고자 하는 연구로 이어지고 있었다. 또한 치료 결과 나타난 질환의 예후(Prognosis) 연구를 통해 질환의 다양한 발병기전을 동시에 차단하여 예후를 증진시키기 위한 연구, 이와 병행하여 암을 조기진단 하거나 생체표지자 등의 새로운 진단법의 개발 그리고 맞춤치료를 위한 유전자 프로파일 연구 등이 순차적으로 진행됨을 확인할 수 있었다. 이러한 국제적인 연구 흐름은 향후 국내 암유전자 연구 경로를 예측할 수 있는 하나의 객관적인 자료로 활용될 수 있을 것이다.
사회네트워크를 분석하기 위해 개발된 중심성 척도는 노드(키워드)들의 연결에 대한 가중치를 반영하지 않는 단점이 있다(이재윤, 2006). 본 연구는 연구주제의 중심성을 파악하기 위해 키워드 빈도뿐만 아니라 연결된 횟수에 따라 가중치를 반영하여 가중치가 높을수록 연결정도 중심성이 상승하도록 하였으며 이 결과 활발하게 연구되는 주제를 확인 할 수 있었다. 하지만 가중치가 부여된 연결정도 중심성이 높은 키워드라 할지라도 단순 빈도수에 의한 결과만으로는 핵심 키워드라고 단정하긴 어렵다.
이 후 ‘Monoclonal Antibody’ 등 치료제 연구, ‘예후(Prognosis)’등과 관련된 다양한 키워드와 연결되며 그 영역이 확장되는 것을 관찰할 수 있었다.
반면 동일한 시기에 중심성이 높았던 ‘Molecular Sequence Data’는 시간이 지남에 따라 연결정도가 약화되다가 네트워크상에서 사라졌다. 이는 연구주제도 유기체와 같이 진화와 소멸을 반복하는 현상을 보여줌으로서 사회네트워크가 연구주제의 변화를 관찰하기에 적당한 도구임을 확인할 수 있었다. 하지만 네트워크상에 나타나지 않거나 연결정도가 약한 키워드일지라도 주요한 연구주제가 아니라고 단정 지을 수는 없다.
전체 키워드 33개 중 양의 값을 가지며 표준화 연결정도 중심성 기울기가 큰 키워드는 ‘Genes, ras’, ‘Apoptosis’, ‘Gene Expression Regulation, Neoplastic’, ‘Cell Line, Tumor’ 등이었고(표 3), 한국의 경우는 36개의 키워드 중 ‘Apoptosis’, ‘Genes, ras’, ‘Signal Transduction’,‘Genes, bcl-2’, ‘Cell Line, Tumor’ 등이었다().
전체 키워드 네트워크 분석결과 대표적인 암유전자의 하나인 ‘Genes, ras’는 국내와 해외에서 공통적으로 연결정도 중심성이 높았다.
전체 키워드 중 음의 값을 가지며 표준화 연결정도 중심성 기울기가 감소되는 키워드는 ‘Cell Line’, ‘Cell Transformation, Neoplastic’, ‘Base Sequence’, ‘Genes, Viral’, ‘Proto-Oncogenes였고(), 한국의 경우 ‘Proto-Oncogenes’, ‘Gene Amplification’, ‘Blotting, Southern’, ‘Blotting,Northern’ 등이었다().
직선 기울기가 가장 컸던 ‘Gene, ras’, ‘Apoptosis’는 회귀함수 상의 상승 추세는 국내외 모두 시기가 경과함에 따라 ‘Genes, erbB-2’, ‘Antineoplastic Agents’ 보다는 둔화되는 형태를 보였다(그림 16, 17).

후속연구

국내의 한 벤처회사에서 ‘HER-2’의 치료제인 ‘Monoclonal Antibody’를 개발 중에 있으므로 국제적인 경쟁력을 가지기 위해 키워드 네트워크 결과를 Bottom-up 형태의 정책 결정 도구로서 활용하여 결과에 대한 전문가의 심층 검토를 거쳐 국가적 차원에서 연구개발을 선제적으로 지원하는 시도도 필요할 것이다.
또한 국립보건연구원의 의과학도서관도 MeSH 전문가 양성 교육을 하고 있으며 향후 MeSH 색인을 의무화할 예정이다. 따라서 MeSH 용어를 활용한 본 연구가 국내 보건의료분야의 MeSH활용을 위한 하나의 근거로서 제공될 수 있을 것이다.
또한 연구주제의 구간별 중심성 값의 변화 추이를 관찰함으로서 향후 활발하게 연구될 연구주제를 확인하였다. 따라서 다양한 세부 주제별로 연구주제 네트워크 분석이 진행되어 세부 주제별 연구단계가 확인된다면 연구자나 정책 입안가에게 연구방향이나 연구개발 투자를 위한 객관적인 자료로 활용될 수 있을 것이다. 이러한 분석을 위해서는 키워드의 추출 및 정제가 중요하며 MeSH 용어의 사용은 저자 색인 키워드에 의학 분석 방법의 한계를 보완할 수 있을 것이다.
반면 기울기 값이 상대적으로 작았던 ‘Genes, erbB-2’, ‘Antineoplastic Agents’는 회귀함수에서 보다 강한 상승추세를 보였다. 따라서 향후 활발하게 연구될 키워드는 키워드 네트워크를 구축하여 연결정도 중심성에 의해 주요 연구주제를 확인하고, 표준화된 연결정도 중심성 기울기나 최적 회귀함수의 적용 등 다양한 접근을 통해 결과를 비교 분석하는 과정을 거쳐야 보다 정확한 결과를 예측할 수 있을 것이다.
최근 대한의학회 회원 학술지에 투고하는 논문의 키워드 부여 시 MeSH 용어의 색인을 권장하고 있다. 또한 국립보건연구원의 의과학도서관도 MeSH 전문가 양성 교육을 하고 있으며 향후 MeSH 색인을 의무화할 예정이다. 따라서 MeSH 용어를 활용한 본 연구가 국내 보건의료분야의 MeSH활용을 위한 하나의 근거로서 제공될 수 있을 것이다.
네트워크 분석을 통해 연결정도 중심성이 높은 연구주제가 시간이 지남에 따라 중심성이 감소되어 네트워크에서 사라지고 주변 네트워크에서 있던 연구주제가 중심성이 증가하여 중심 네트워크에 편입되는 현상을 관찰함으로서 사회네트워크 분석이 보건의료분야에서도 적용이 가능함을 확인할 수 있었다. 또한 연구주제의 구간별 중심성 값의 변화 추이를 관찰함으로서 향후 활발하게 연구될 연구주제를 확인하였다. 따라서 다양한 세부 주제별로 연구주제 네트워크 분석이 진행되어 세부 주제별 연구단계가 확인된다면 연구자나 정책 입안가에게 연구방향이나 연구개발 투자를 위한 객관적인 자료로 활용될 수 있을 것이다.
보건의료분야의 세부연구주제인 암유전자의 연구동향을 PubMed 데이터 분석을 통하여 지식지도로 작성하였다. 선행 연구들이 단기간의 국내 연구동향을 파악한 것과 달리 시계열적인 연구주제 네트워크 분석과 국내외 연구주제 비교를 통해 국내 연구수준의 확인과 향후 활발하게 연구될 연구주제를 확인할 수 있었다. 네트워크 분석을 통해 연결정도 중심성이 높은 연구주제가 시간이 지남에 따라 중심성이 감소되어 네트워크에서 사라지고 주변 네트워크에서 있던 연구주제가 중심성이 증가하여 중심 네트워크에 편입되는 현상을 관찰함으로서 사회네트워크 분석이 보건의료분야에서도 적용이 가능함을 확인할 수 있었다.
연구주제 네트워크 분석 결과가 정책적 차원의 연구개발사업 방향 제시를 위한 하나의 방법론으로 활용되기 위해서는 네트워크 분석에 대한 전문가의 심층적인 검토가 이루어져 객관성이 보완되어야 할 것이다. 향후 보건의료분야의 다양한 상설 전문가 집단의 구성을 통해 필요시 다양한 채널을 통해 검토 받을 수 있는 제도적인 장치가 보완된다면 근거중심적인 연구개발사업 방향제시 및 선정을 위한 지표로서 적용이 가능할 것이다.
또한 치료 결과 나타난 질환의 예후(Prognosis) 연구를 통해 질환의 다양한 발병기전을 동시에 차단하여 예후를 증진시키기 위한 연구, 이와 병행하여 암을 조기진단 하거나 생체표지자 등의 새로운 진단법의 개발 그리고 맞춤치료를 위한 유전자 프로파일 연구 등이 순차적으로 진행됨을 확인할 수 있었다. 이러한 국제적인 연구 흐름은 향후 국내 암유전자 연구 경로를 예측할 수 있는 하나의 객관적인 자료로 활용될 수 있을 것이다. 예를 들어 해외의 경우 ‘Breast Neoplasms’에 특이성이 있는 암유전자 ‘Genes, erbB-2’ 키워드는 1996년-2000년 구간에 중심 네트워크와 분리되어 새롭게 등장하였고 2000-2005년 구간에는 ‘Gene Expression Regulation, Neoplastic’를 매개로 중심네트워크로 편입되었다.
이러한 기준은 네트워크상 30-40개의 키워드를 볼 수 있으며, 명확한 키워드 간의 관계를 관찰할 수 있는 절삭 값이기 때문이었다. 이러한 방법으로 구간별 상위 키워드의 변화를 관찰함으로서 시간이 지남에 따라 네트워크에서 키워드의 출몰을 관찰하고 향후 활발하게 연구될 키워드를 확인하였다.
따라서 다양한 세부 주제별로 연구주제 네트워크 분석이 진행되어 세부 주제별 연구단계가 확인된다면 연구자나 정책 입안가에게 연구방향이나 연구개발 투자를 위한 객관적인 자료로 활용될 수 있을 것이다. 이러한 분석을 위해서는 키워드의 추출 및 정제가 중요하며 MeSH 용어의 사용은 저자 색인 키워드에 의학 분석 방법의 한계를 보완할 수 있을 것이다. 최근 대한의학회 회원 학술지에 투고하는 논문의 키워드 부여 시 MeSH 용어의 색인을 권장하고 있다.
이러한 분석이 가지는 한계를 보완하기 위해서는 전문가의 검토가 반드시 필요하며 본 연구는 전문가의 검토를 통해 결과를 해석하였다. 향후 다양한 가중치가 부여된 추가적인 분석을 함으로서 본 연구에서 나타난 결과와의 비교로 그 유용성이 확인되어야 할 것이다.
연구주제 네트워크 분석 결과가 정책적 차원의 연구개발사업 방향 제시를 위한 하나의 방법론으로 활용되기 위해서는 네트워크 분석에 대한 전문가의 심층적인 검토가 이루어져 객관성이 보완되어야 할 것이다. 향후 보건의료분야의 다양한 상설 전문가 집단의 구성을 통해 필요시 다양한 채널을 통해 검토 받을 수 있는 제도적인 장치가 보완된다면 근거중심적인 연구개발사업 방향제시 및 선정을 위한 지표로서 적용이 가능할 것이다.

핵심어	질문	논문에서 추출한 답변
	최근 크게 대두되고 있는 암의 원인을 규명하고자 하는 가설은 무엇인가?	국가암정복 연구개발은 암의 원인과 기전을 밝히고 효과적인 암 예방, 진단, 치료제 개발에 집중하고 있다(보건복지부, 2012). 암의 원인에 대해서는 여러가지 학설이 주장되었으나 최근 들어 암유전자설이 가장 크게 대두되고 있다(Bishop, 1983). 발암물질이 암을 일으키는 메커니즘은 몸속에서 발암물질의 대사로 활성화된 물질이 세포의 유전자에 결합하여 단백질 발현의 변화로 일어나는 것으로 알려져 있다.
	암 게놈(암유전체)프로젝트의 목적은 무엇인가?	암유전자가 밝혀짐에 따라 암을 정복하기 위한 노력으로 수천 종에 이르는 악성종양의 DNA염기 서열을 밝혀내는 암 게놈(암유전체)프로젝트가 전 세계적으로 활발하게 진행되고 있다. 이 프로젝트는 악성종양 조직의 DNA염기 서열을 밝혀 암을 유발하는 돌연변이 유전자의 염기서열과 인체의 건강한 조직 유전자 DNA 염기서열을 비교 분석함으로서 암 유발 유전자 변이를 발견하여 암 치료에 적용하기 위한 것이다. 세계적으로 암에 대한 원인을 규명하고 이를 위한 맞춤형 치료방법을 찾기 위한 노력이 지속적이고 빠르게 진행되고 있다.
	국가암정복 연구개발은 무엇에 집중하고 있는가?	따라서 정부는 암으로 인한 사망률을 감소시킴으로서 국민의 보건복지 및 삶의 질을 향상시키기 위해 국가암정복사업에 많은 예산을 투자하고 있다. 국가암정복 연구개발은 암의 원인과 기전을 밝히고 효과적인 암 예방, 진단, 치료제 개발에 집중하고 있다(보건복지부, 2012). 암의 원인에 대해서는 여러가지 학설이 주장되었으나 최근 들어 암유전자설이 가장 크게 대두되고 있다(Bishop, 1983).

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

[국내논문] 암유전자 연구주제 네트워크 분석
Analysis of Research Subject Network in the Field of Oncogene 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약
AI-Helper

문제 정의

제안 방법

대상 데이터

데이터처리

이론/모형

성능/효과

후속연구

질의응답

이 논문을 인용한 문헌

저자의 다른 논문 :

연구과제 타임라인

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

[국내논문] 암유전자 연구주제 네트워크 분석 Analysis of Research Subject Network in the Field of Oncogene 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

제안 방법

대상 데이터

데이터처리

이론/모형

성능/효과

후속연구

질의응답

이 논문을 인용한 문헌

저자의 다른 논문 :

장혜란 (1) 강길원 (13) 이영성 (8)

연구과제 타임라인

전체(0) 논문(0) 특허(0) 보고서(0)

전체(0) 논문(0) 특허(0) 보고서(0)

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

[국내논문] 암유전자 연구주제 네트워크 분석
Analysis of Research Subject Network in the Field of Oncogene 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper