[국내논문] 논문 인용에 따른 학술지 군집화 방법의 비교
Comparison of journal clustering methods based on citation structure 원문보기

Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지, v.26 no.4, 2015년, pp.827 - 839  

김진광 (영남대학교 통계학과) ,  김소형 (한국연구재단 학술기반진흥팀) ,  오창혁 (영남대학교 통계학과)

학술지 인용 데이터베이스에서 네트워크 구조분석을 통해 학술지의 공동체를 추출하는 것은 인용관계에 따른 학술지의 집단을 파악하는 유용한 수단이다. 전 세계적으로 널리 활용되는 학술지 인용데이터베이스인 Thomson Reuters의 SCI나 Elsevier의 SCOPUS가 제공하는 자료를 활용하여 인용관계에 따른 공동체 구조를 파악하는 시도가 이루어진 바 있으나, 국내 학술지 인용 데이터베이스인 KCI에서는 이러한 연구가 현재까지는 이루어지지 않은 것으로 알려져 있다. 따라서 본 연구에서는 기존의 여러 가지 네트워크 군집화 알고리즘을 이용하여 KCI에 등재되어 있는 자연과학 분야 학술지를 대상으로 인용관계에 따른 공동체를 파악하고 KCI에 등록된 학술지 분류와 비교하여 보았다. 적용된 군집화 방법 중 인포맵 알고리즘에 의한 분류가 KCI 등재 자연과학 분야 학술지의 인용관계 구조를 잘 반영하며, 기존의 KCI 분류와 가장 유사한 것으로 나타났다. 본 연구를 통해 얻은 KCI의 기존 분류와 차이점들은 장차 KCI 학술지의 재분류가 이루어질 시 고려의 대상이 될 수도 있을 것이다.

Extraction of communities from a journal citation database by the citation structure is a useful tool to see closely related groups of the journals. SCI of Thomson Reuters or SCOPUS of Elsevier have had tried to grasp community structure of the journals in their indices according to citation relatio...


문제 정의

  • 본 연구의 관심은 KCI 등재 자연과학분야 학술지를 대상으로 한 인용관계에 따른 군집화 즉, 공동체 검출에 있다. KCI는 한국연구재단 (National Research Foundation of Korea)에서 구축한 국내 학술지 인용데이터베이스로서 2011년 현재 1,408개의 학술지가 등재되어 있으며, 8개의 대분류 학문 분야와 146개의 중분류 학문분야가 있다.
  • KCI의 학술지의 분류는 인용관계에 의한 분류가 아니므로 학술지 간의 인용관계에 따르는 공동체의 구조에 관심을 가지게 된다. 그러므로 본 연구에서는 KCI 등재 자연과학 분야 학술지 간 인용관계에 따른 공동체 검출 결과와 KCI 분류에 의한 공동체와의 차이가 어떠한지를 알아보고자 한다.
  • 본 연구에서는 KCI에 등재되어 있는 자연과학 분야 학술지를 대상으로 네트워크 군집화 방법을 적용하고 인용관계에 따른 공동체를 파악하여 학술지를 분류하였으며, 기존 KCI에 등록된 학술지 분류와의 차이를 알아보았다. 인포맵 알고리즘을 사용한 분류 결과는 KCI의 기존 분류와 유사한 형태를 보였으나 일부 학술지의 경우 차이가 존재하였으며 이러한 차이점들은 KCI 학술지의 재분류시 고려의 대상이 될 수 있을 것이다.
핵심어 질문 논문에서 추출한 답변
소프트군집화는 어떤 경우를 말하는가? 군집화 방법으로 네트워크의 공동체 형태를 추출할 때 하나의 노드가 두 개 이상의 군집에 속할 수 있는 경우에 소프트군집화라고 하며, 그렇지 않은 경우에는 하드군집화라고 한다.
네트워크는 무엇으로 구성되어 있는가? 네트워크는 노드의 집합과 링크의 집합으로 구성된 집합이다. 네트워크는 그래프, 노드는 정점, 링크는 변이라고도 불린다.
군집화의 계층적 방법과 비계층적 방법은 각각 무엇인가? 군집화 방법은 계층적 방법과 비계층적 방법으로 분류되기도한다. 계층적 방법은 유사성 척도에 기초해 밀접한 관계를 가진 노드를 단계적으로 묶어 나가면서 공동체를 형성해 나가는 반면, 비계층적 방법은 사전에 정해진 공동체의 숫자에 따라 노드들이 공동체에 할당된다. 계층적 군집화는 군집의 수에 대한 사전지식을 필요로 하지 않지만, 예외적 특이노드가 제거되지 않고 반드시 어느 군집에 속하게 되는 문제가 발생된다.
