[논문]키워드 네트워크의 클릭 분석을 이용한 특허 데이터 분석

김현; 김동건; 조진남

doi:10.7465/jkdi.2016.27.5.1273

문제 정의

본 연구에서는 기계 학습 분야의 특허 경향을 알아보기 위해서 2005년도와 2015년도에 출원된 특허들을 수집하여 키워드 네트워크를 구축하고 분석을 시행하였다. 먼저 키워드 네트워크 구축을 위해 TF-IDF 가중치를 이용하여 중요 키워드를 선정하고 동시에 등장한 연관 키워드들을 추출하여 비방향 그래프를 생성하였다.
본 연구의 목적은 특허 문서의 키워드 네트워크를 구축하여 네트워크 구조 분석을 통해 특허를 이루는 키워드들의 상호 작용을 파악하고 중요한 키워드를 추출하여 출원된 특허 기술의 구체적인 분야를 찾는 것이다. 분석을 위해 최근 많은 관심을 받고 있는 기계 학습 관련 미국 특허를 특허 포털 사이트인 KIPRIS (http://www.
또한 2005년도와 2015년도에 나타난 키워드들의 가중치 값이 상이하므로, 양해년도에서 중요도가 높은 키워드를 동일하게 추출하기 위해서 TF-IDF 값의 상위 10%에 해당하는 값을 기준으로 그 값보다 큰 값을 갖는 단어들만을 선정하였다. 이렇게 선정된 키워드만 독립적으로 보면 서로 다른 특허 분야에서 어떤 의미로 사용되었는지 알기 어려우므로 선정된 키워드들과 동시에 사용된 키워드들을 추출하여 키워드간의 상호 관계를 파악하고자 하였다. 문서-단어 행렬에서 사용된 키워드들은 전처리 과정을 거쳐서 명사로만 한정하였으며, 이는 분석 결과로 나타난 키워드들을 기준으로 특정 기술 영역을 해석하고자 할 때 형용사나 부사와 같은 품사들은 구체적으로 기술 영역을 나타낼 수 없기 때문이다.
키워드 네트워크에서 중요한 역할을 담당한 키워드들을 찾아보고 이를 통해 기계 학습 특허 동향을 파악하고자 하였다. Table 4.

제안 방법

“machine learning”을 검색 키워드로 사용하였으며 소프트웨어 분야의 특허 동향으로 한정하기 위하여 IPC 코드 G06과 G08로 제한하여 검색하였다.
산출된 TFIDF 가중치 값을 정렬하여 상위 10%에 해당하는 가중치 값을 선정한다 (3). (3)에서 선정된 TF-IDF가중치 값보다 큰 값을 갖는 단어들을 선별한 다음 (4), 이 단어들과 동시에 사용된 단어들을 상관 계수를 기준으로 하여 재추출하였다 (5). 마지막으로 <선정된 키워드, 연관 키워드>로 표현하여 이를 기반으로 키워드 네트워크를 구축한다 (6).
키워드 네트워크 분석은 네트워크의 전체적인 구조를 분석하기 위한 그래프 레벨 분석과 키워드 자체의 중심성을 분석하기 위한 노드 레벨 분석으로 나누어 실시하였다. 그래프 레벨 분석을 위해 네트워크 중앙성 (centralization), 밀도 (density) 및 군집 계수 (clustering coefficient)를 측정하였으며, 노드 레벨 분석을 위해 각 키워드의 연결정도 중심성 (degree centrality), 근접 중심성 (closeness centrality), 그리고 매개 중심성(betweenness centrality)을 측정하였다.
먼저 전체적인 키워드네트워크의 구조를 비교하고자 양해년도 키워드 네트워크의 중앙성, 밀도 그리고 군집 계수 (Freeman,1979)를 분석하였다. 다음으로 각 키워드 네트워크에서 연결 중심성, 매개 중심성, 그리고 근접 중심성이 높은 키워드를 분석하여 그래프 내에서 중요 역할을 담당하는 키워드 및 관련 기술을 파악하였다. 마지막으로 중요한 기술 분야를 파악하기 위해서 클릭 분석을 실시하여 서로 연관성이 높은 키워드 집합을 추출하고 이를 기반으로 기술 분야를 찾아내었다.
또한 2005년도와 2015년도에 나타난 키워드들의 가중치 값이 상이하므로, 양해년도에서 중요도가 높은 키워드를 동일하게 추출하기 위해서 TF-IDF 값의 상위 10%에 해당하는 값을 기준으로 그 값보다 큰 값을 갖는 단어들만을 선정하였다. 이렇게 선정된 키워드만 독립적으로 보면 서로 다른 특허 분야에서 어떤 의미로 사용되었는지 알기 어려우므로 선정된 키워드들과 동시에 사용된 키워드들을 추출하여 키워드간의 상호 관계를 파악하고자 하였다.
즉, 본 연구에서 제안하는 키워드 네트워크의 클릭은 특허 문서 집합에서 함께 사용된 횟수가 많은 키워드들의 집합으로서 연관 키워드 집합을 의미한다. 또한 클릭에 속하는 노드가 다른 클릭에도 동시에 포함되는 공유 멤버쉽 노드를 추출하여 특허 주제를 파악하는데 활용하였다.
다음으로 각 키워드 네트워크에서 연결 중심성, 매개 중심성, 그리고 근접 중심성이 높은 키워드를 분석하여 그래프 내에서 중요 역할을 담당하는 키워드 및 관련 기술을 파악하였다. 마지막으로 중요한 기술 분야를 파악하기 위해서 클릭 분석을 실시하여 서로 연관성이 높은 키워드 집합을 추출하고 이를 기반으로 기술 분야를 찾아내었다.
키워드 네트워크 분석은 전체적인 네트워크의 구조를 파악하기 위해 중앙성, 밀도 및 군집 계수를 비교하였으며, 중요 키워드를 알아보기 위하여 연결정도 중심성, 근접 중심성, 그리고 매개 중심성이 높은 상위 15개의 키워드를 조사하였다. 마지막으로 키워드 네트워크의 최대 완전 연결 그래프인 클릭을 찾아내어 강한 연결 관계를 갖는 키워드 집합을 확인하였다.
양해년도의 특허 동향을 파악하기 위해서 키워드 네트워크 구조 분석, 키워드 분석, 그리고 클릭 분석을 실시하였다. 먼저 전체적인 키워드네트워크의 구조를 비교하고자 양해년도 키워드 네트워크의 중앙성, 밀도 그리고 군집 계수 (Freeman,1979)를 분석하였다. 다음으로 각 키워드 네트워크에서 연결 중심성, 매개 중심성, 그리고 근접 중심성이 높은 키워드를 분석하여 그래프 내에서 중요 역할을 담당하는 키워드 및 관련 기술을 파악하였다.
본 연구에서는 기계 학습 분야의 특허 경향을 알아보기 위해서 2005년도와 2015년도에 출원된 특허들을 수집하여 키워드 네트워크를 구축하고 분석을 시행하였다. 먼저 키워드 네트워크 구축을 위해 TF-IDF 가중치를 이용하여 중요 키워드를 선정하고 동시에 등장한 연관 키워드들을 추출하여 비방향 그래프를 생성하였다. 키워드 네트워크 분석은 전체적인 네트워크의 구조를 파악하기 위해 중앙성, 밀도 및 군집 계수를 비교하였으며, 중요 키워드를 알아보기 위하여 연결정도 중심성, 근접 중심성, 그리고 매개 중심성이 높은 상위 15개의 키워드를 조사하였다.
먼저 특허 문서의 내용을 고려하면서 전체적인 연결 관계를 파악하고자 키워드 네트워크를 구축하고 키워드 네트워크 분석 및 클릭 분석을 시행하였다. 먼저, 키워드 네트워크를 구축하는 데 있어 성패를 좌우하는 것이 키워드 선정이라는 것에 주목하여 TF-IDF (Term Frequency - Inverse Document Frequency) 가중치를 기준으로 중요 키워드를 추출한 다음, 각 중요 키워드와 동시에 사용된 키워드를 연결 관계로 하여 키워드 네트워크를 구축하였다.
먼저 특허 문서의 내용을 고려하면서 전체적인 연결 관계를 파악하고자 키워드 네트워크를 구축하고 키워드 네트워크 분석 및 클릭 분석을 시행하였다. 먼저, 키워드 네트워크를 구축하는 데 있어 성패를 좌우하는 것이 키워드 선정이라는 것에 주목하여 TF-IDF (Term Frequency - Inverse Document Frequency) 가중치를 기준으로 중요 키워드를 추출한 다음, 각 중요 키워드와 동시에 사용된 키워드를 연결 관계로 하여 키워드 네트워크를 구축하였다. 네트워크 구축 방식은 Kim 등 (2016)의 논문에서 제안한 방식을 일반화한 것이다.
특허 문서는 발명의 명칭, 출원번호/출원일, 등록번호/등록일, 출원인, 발명자, 요약문 그리고 명세서로 구성된다. 발명의 구체적인 내용은 명세서에 기술되어 있으나 발명의 핵심 키워드들은 요약문에 나타나므로 본 연구에서는 요약문만을 처리하였다. “machine learning”을 검색 키워드로 사용하였으며 소프트웨어 분야의 특허 동향으로 한정하기 위하여 IPC 코드 G06과 G08로 제한하여 검색하였다.
Kim 등 (2016)의 연구에서는 키워드 네트워크의 커뮤니티 분석 결과에 소셜 네트워크 분석을 재적용하여 영향력이 큰 커뮤니티를 찾아내고 이에 속하는 키워드들을 중심으로 사물 인터넷 특허 분야의 동향을 파약하였다. 본 연구는 키워드 네트워크에 클릭 분석을 적용하여 서로 연관성이 높은 키워드 집합을 추출함으로써 기계학습 분야 특허의 시기별 특허 동향을 분석하였다.
이러한 특성 때문에 클릭 분석은 일반적인 소셜 네트워크에서 강한 연결 정도를 갖는 커뮤니티를 찾는데 활용되어 왔다. 본 연구에서는 클릭 분석을 키워드 네트워크에 적용하여 강한 상관관계를 갖는 키워드 집합을 추출하는데 활용하였다. 즉, 본 연구에서 제안하는 키워드 네트워크의 클릭은 특허 문서 집합에서 함께 사용된 횟수가 많은 키워드들의 집합으로서 연관 키워드 집합을 의미한다.
본 연구에서는 클릭 분석을 활용하여 강한 연결성을 갖는 연관 키워드 집합을 추출하였다. 클릭 분석은 일반적인 소셜 네트워크에 적용되어 커뮤니티를 탐지하는데 주로 사용되었으므로 키워드 네트워크에 적용된 예는 드물다.
본 연구의 목적은 특허 문서의 키워드 네트워크를 구축하여 네트워크 구조 분석을 통해 특허를 이루는 키워드들의 상호 작용을 파악하고 중요한 키워드를 추출하여 출원된 특허 기술의 구체적인 분야를 찾는 것이다. 분석을 위해 최근 많은 관심을 받고 있는 기계 학습 관련 미국 특허를 특허 포털 사이트인 KIPRIS (http://www.kipris.or.kr)로부터 수집하였으며, 2005년도와 2015년도에 출원된 특허 전체를 각각 분석하여 해당년도에서 나타난 특허 동향을 이해할 뿐만 아니라 양해년도 특허 기술의 비교를 통하여 기계 학습 특허의 경향을 파악하고자 하였다.
양해년도 기계 학습 특허가 구체적으로 어떤 기술 분야의 특허인지 비교하기 위해서 클릭 분석을 수행하였다. 네트워크에서 클릭은 클릭 내의 모든 노드가 서로 직접 연결되고 네트워크 내의 다른 어떤 노드도 클릭 내의 노드와는 직접 연결 관계를 갖지 않는다는 특성을 갖는다.
텍스트 마이닝을 위해서 사용된 언어는 R이며, R에서 제공하는 tm 패키지와 sna 패키지를 활용하여 키워드 추출, 키워드 네트워크 구축 및 분석을 수행하였다. 양해년도의 특허 동향을 파악하기 위해서 키워드 네트워크 구조 분석, 키워드 분석, 그리고 클릭 분석을 실시하였다. 먼저 전체적인 키워드네트워크의 구조를 비교하고자 양해년도 키워드 네트워크의 중앙성, 밀도 그리고 군집 계수 (Freeman,1979)를 분석하였다.
클릭의 크기는 서로 연결되어 있는 키워드 수에 따라서 3개부터 7개까지 나타났다. 이 중 최대 클릭을 이루는 클릭의 크기가 7인 키워드 집합과 그 다음 크기인 6인 키워드 집합을 분석하였다. 한 클릭에 소속된 키워드들이 다른 클릭에도 중복되어 소속될 수 있는데 특히 이러한 공유 멤버쉽에 속하는 키워드는 (comembership keywords) 전체 문서 집합에서 응집력이 강한 키워드들로서 다른 그룹과의 매개 역할을 수행할 수 있다.
먼저 각 특허 초록 당 등장한 키워드 중에서 명사만을 추출하여 문서-단어 간 행렬을 생성한다 (1). 이 중에서 중요한 키워드를 선별하기 위하여 각 단어마다 TF-IDF 가중치 값을 계산한다. TF-DF 가중치 산출 방식은 식 (3.
#는 최대 중심성값과 모든 노드의 중심성의 차들의 합이고, #은 논리적으로 가장 큰 차이를 합한 것이다. 중앙성은 연결정도 중심성, 근접 중심성, 그리고 매개 중심성에 대해 분석하였다.
문서-단어 행렬에서 사용된 키워드들은 전처리 과정을 거쳐서 명사로만 한정하였으며, 이는 분석 결과로 나타난 키워드들을 기준으로 특정 기술 영역을 해석하고자 할 때 형용사나 부사와 같은 품사들은 구체적으로 기술 영역을 나타낼 수 없기 때문이다. 즉 동일한 형용사는 다양한 명사와 함께 쓰일 수 있으나 이 형용사가 기술 영역을 해석하는데 직접적인 영향을 주지는 않으므로 명사만을 고려하여 분석하였다.
본 연구에서는 클릭 분석을 키워드 네트워크에 적용하여 강한 상관관계를 갖는 키워드 집합을 추출하는데 활용하였다. 즉, 본 연구에서 제안하는 키워드 네트워크의 클릭은 특허 문서 집합에서 함께 사용된 횟수가 많은 키워드들의 집합으로서 연관 키워드 집합을 의미한다. 또한 클릭에 속하는 노드가 다른 클릭에도 동시에 포함되는 공유 멤버쉽 노드를 추출하여 특허 주제를 파악하는데 활용하였다.
그림에서 보이는 바와 같이 연결이 되지 않고 분리된 그래프 집합이 많았고, 이러한 분리된 그래프들은 키워드 네트워크 구조 분석에 활용되지 않으므로 분석에서 제외하였다. 즉, 키워드 네트워크의 구조 분석을 위해서 생성된 네트워크의 최대 연결 그래프만을 활용하였다. 각 키워드 네트워크로부터 최대 연결 그래프를 추출한 네트워크는 Figure 4.
네트워크 구축 방식은 Kim 등 (2016)의 논문에서 제안한 방식을 일반화한 것이다. 키워드 네트워크 분석은 네트워크의 전체적인 구조를 분석하기 위한 그래프 레벨 분석과 키워드 자체의 중심성을 분석하기 위한 노드 레벨 분석으로 나누어 실시하였다. 그래프 레벨 분석을 위해 네트워크 중앙성 (centralization), 밀도 (density) 및 군집 계수 (clustering coefficient)를 측정하였으며, 노드 레벨 분석을 위해 각 키워드의 연결정도 중심성 (degree centrality), 근접 중심성 (closeness centrality), 그리고 매개 중심성(betweenness centrality)을 측정하였다.
먼저 키워드 네트워크 구축을 위해 TF-IDF 가중치를 이용하여 중요 키워드를 선정하고 동시에 등장한 연관 키워드들을 추출하여 비방향 그래프를 생성하였다. 키워드 네트워크 분석은 전체적인 네트워크의 구조를 파악하기 위해 중앙성, 밀도 및 군집 계수를 비교하였으며, 중요 키워드를 알아보기 위하여 연결정도 중심성, 근접 중심성, 그리고 매개 중심성이 높은 상위 15개의 키워드를 조사하였다. 마지막으로 키워드 네트워크의 최대 완전 연결 그래프인 클릭을 찾아내어 강한 연결 관계를 갖는 키워드 집합을 확인하였다.
키워드 네트워크의 구조를 파악하기 위해 키워드 네트워크의 중앙성, 밀도, 그리고 군집 계수를 각각 분석하였다. 중앙성이란 전체 네트워크의 형태가 얼마나 중앙에 집중되어 있는지를 나타내는 개념으로 네트워크의 전체적인 특성을 파악하기 위하여 사용되고 있다.
텍스트 마이닝을 위해서 사용된 언어는 R이며, R에서 제공하는 tm 패키지와 sna 패키지를 활용하여 키워드 추출, 키워드 네트워크 구축 및 분석을 수행하였다. 양해년도의 특허 동향을 파악하기 위해서 키워드 네트워크 구조 분석, 키워드 분석, 그리고 클릭 분석을 실시하였다.

대상 데이터

“machine learning”을 검색 키워드로 사용하였으며 소프트웨어 분야의 특허 동향으로 한정하기 위하여 IPC 코드 G06과 G08로 제한하여 검색하였다. 2005년도에 출원된 소프트웨어 분야 기계 학습 특허는 560개 그리고 2015년도에 출원된 2,000개 특허를 수집하였다.
기계 학습은 인공 지능의 한분야로서 최근 그 관심이 폭발적으로 증가하였다. 따라서 과거 출원된 특허와 최근 출원된 특허의 동향을 비교하고자 2005년도와 2015년도에 각각 출원된 특허 전체를 수집하였다. 특허 문서는 발명의 명칭, 출원번호/출원일, 등록번호/등록일, 출원인, 발명자, 요약문 그리고 명세서로 구성된다.
10% 보다 하위로 선정할 경우 일반적으로 사용되는 키워드들이 자주 등장하였으며 15%, 20%, 25%를 기준으로 키워드들을 선정하여 실험한 결과 가장 적절한 값으로 나타났다. 마지막으로 437개의 단어에 각각 상관계수 값이 0.4 이상인 단어들을 재추출하여 전체 네트워크를 구축하였으며, 이때 사용된 전체 단어는 1, 118개이다. 2015년도의 경우, 수집된 특허 초록문이 2,000개이며 문서-단어 행렬에서 선정된 명사는 4,644개이다.
본 연구에서는 기계 학습 관련 미국 특허 정보를 수집하여 분석하였다. 기계 학습은 인공 지능의 한분야로서 최근 그 관심이 폭발적으로 증가하였다.
2015년도의 경우, 수집된 특허 초록문이 2,000개이며 문서-단어 행렬에서 선정된 명사는 4,644개이다. 여기에 TF-IDF 가중치 값의 상위 10%에 해당하는 값 이상을 갖는 단어들을 선정하면 1,143개이고 네트워크 구축에 사용된 전체 노드 수는 1,365개이다.

이론/모형

먼저, 키워드 네트워크를 구축하는 데 있어 성패를 좌우하는 것이 키워드 선정이라는 것에 주목하여 TF-IDF (Term Frequency - Inverse Document Frequency) 가중치를 기준으로 중요 키워드를 추출한 다음, 각 중요 키워드와 동시에 사용된 키워드를 연결 관계로 하여 키워드 네트워크를 구축하였다. 네트워크 구축 방식은 Kim 등 (2016)의 논문에서 제안한 방식을 일반화한 것이다. 키워드 네트워크 분석은 네트워크의 전체적인 구조를 분석하기 위한 그래프 레벨 분석과 키워드 자체의 중심성을 분석하기 위한 노드 레벨 분석으로 나누어 실시하였다.

성능/효과

여기서 TF-IDF 가중치 값을 상위 10% 이상으로 지정하여 선정된 단어 수는 437개이다. 10% 보다 하위로 선정할 경우 일반적으로 사용되는 키워드들이 자주 등장하였으며 15%, 20%, 25%를 기준으로 키워드들을 선정하여 실험한 결과 가장 적절한 값으로 나타났다. 마지막으로 437개의 단어에 각각 상관계수 값이 0.
먼저 2005년도와 2015년도의 키워드 네트워크 구조는 연결정도 중앙성, 밀도, 군집 계수에 있어서는 큰 차이를 보이지 않았다. 단 2005년도에 비해서 2015년도의 근접 중앙성이 크게 감속하였고 매개 중앙성은 크게 증가함을 알 수 있었다. 이는 2005년도보다 2015년도의 기계 학습 특허의 주제가 보다 다양해졌으며, 서로 상호간의 연결이 긴밀한 것으로 해석할 수 있다.
분석 결과 기계 학습 특허의 키워드 네트워크는 밀도와 군집 계수가 낮은 것으로 드러났으며 이는 기계 학습 기법 자체에 대한 특허보다는 다양한 응용 영역에 기계학습을 적용한 특허들이 다수이기 때문으로 판단된다. 또한 클릭 분석을 통해 추출된 키워드들 역시 같은 결과를 나타냈다.
Noh 등 (2015)은 키워드의 빈도수, 분산, 그리고 TF-IDF 가중치를 이용하여 특허 문서로부터 키워드를 추출한 다음, k-means 클러스터링과 엔트로피 값을 계산하여 세 가지 방법의 성능을 비교하였다. 비교 결과 TF-IDF 가중치를 적용하여 키워드를 추출한 방법이 가장 성능이 좋음을 보여주었다. Noh 등 (2015)에서 사용된 키워드 추출 방법은 세 가지 모두 빈도수가 높은 키워드에 중요도가 있음을 기반으로 한 방법이지만, Li 등 (2009)은 빈도수가 상대적으로 낮은 키워드 중에서 중요한 키워드를 찾을 수 있는 알고리즘을 제안하였다.
1은 기계 학습 특허 키워드 네트워크의 구조 분석 결과이다. 전반적으로 양해년도에서 모두 네트워크 밀도와 군집계수가 매우 낮게 나타났다. 이는 기계 학습 분야의 특허에서 사용된 키워드들이 서로 긴밀한 관계를 맺고 있지 않음을 나타낸다.
한 클릭에 소속된 키워드들이 다른 클릭에도 중복되어 소속될 수 있는데 특히 이러한 공유 멤버쉽에 속하는 키워드는 (comembership keywords) 전체 문서 집합에서 응집력이 강한 키워드들로서 다른 그룹과의 매개 역할을 수행할 수 있다. 클릭의 크기가 7인 클릭은 총 4개가 발견되었으며, 그 중 3개는 공유 멤버쉽 키워드를 갖고, 다른 1개는 다른 클릭과 연결되지 않은 독립적인 클릭으로 나타났다. 그룹 1은 공유 멤버쉽 키워드를 갖는 클릭으로 뉴스메이커 검증에 관한 키워드 집합이며, 공유 멤버쉽에 속하지 않는 키워드는 각각 names, aggregator, 그리고 news이다.
그래프에 연관 규칙을 적용할 경우 노드의 빈도수만을 고려하므로 빈도수가 높은 노드들의 집합을 찾게 된다. 특허 문서의 경우 핵심 기술에 대한 키워드는 오히려 드물게 등장하므로 본 연구에서 제안한 클릭 분석을 활용하면 중요도가 높으면서 반드시 동시에 등장하는 키워드 집합을 찾을 수 있다는 잇점이 있다.

후속연구

현 연구에서는 지정된 상관 계수 이상을 갖는 키워드는 모두 동일하게 중요한 키워드로 보고 네트워크를 구축하고 분석하였으나, 상관 계수가 높은 키워드일수록 중요도가 높은 키워드로 보고 방향성 가중치 그래프를 구축하고 이에 적절한 분석 방법을 제시할 예정이다. 또한 본 연구에서는 단음절로 된 명사만을 고려하여 키워드 네트워크를 구축하였는데 명사와 명사로 구성된 이음절 이상의 키워드를 다루는 방안에 대해서도 연구를 진행할 예정이다.
특히 구글 특허 검색 시스템이나 특허청 특허 검색 시스템에 클릭에 의해 발견된 키워드를 입력하면 해당 키워드를 모두 포함하는 특허 문서를 바로 찾아낼 수 있다. 이러한 클릭의 특성은 키워드 검색을 기반으로 하는 다양한 검색 시스템에서 연관 검색어 추천과 같은 방식으로 다양하게 활용될 수 있을 것으로 기대된다.
클릭 분석은 클릭을 형성하는 키워드 집합을 해석하여 주제를 파악하는데 활용될 수 있을 뿐만 아니라 추출된 공유 멤버쉽 키워드 집합은 특허 검색 시스템과 같이 키워드 검색 기반의 시스템에서 검색 키워드로 활용될 수 있을 것이다. 특히 구글 특허 검색 시스템이나 특허청 특허 검색 시스템에 클릭에 의해 발견된 키워드를 입력하면 해당 키워드를 모두 포함하는 특허 문서를 바로 찾아낼 수 있다.
클릭 분석은 주로 사람들의 관계망에서 파벌과 같은 결속이 강한 그룹을 찾는데 활용되어 왔고 키워드 네트워크에 적용된 예는 드물다. 키워드 네트워크에서 클릭의 의미는 중요도가 높은 키워드들 중에서도 반드시 연결되어 등장하는 키워드 집합으로서 매우 전문화된 영역에서 그 활용도가 높을 것으로 기대된다.
현재 상관 계수를 가중치로 한 가중치 네트워크를 분석하는 작업을 진행하고 있다. 현 연구에서는 지정된 상관 계수 이상을 갖는 키워드는 모두 동일하게 중요한 키워드로 보고 네트워크를 구축하고 분석하였으나, 상관 계수가 높은 키워드일수록 중요도가 높은 키워드로 보고 방향성 가중치 그래프를 구축하고 이에 적절한 분석 방법을 제시할 예정이다. 또한 본 연구에서는 단음절로 된 명사만을 고려하여 키워드 네트워크를 구축하였는데 명사와 명사로 구성된 이음절 이상의 키워드를 다루는 방안에 대해서도 연구를 진행할 예정이다.

핵심어	질문	논문에서 추출한 답변
	텍스트 마이닝 기반 특허 분석의 장점은 무엇인가?	이후 추출된 키워드들을 클러스터링 하거나 분류하여 특허 정보에서 중요한 키워드들을 파악하는 것이 그 핵심기술이다. 이 방법은 방대한 특허 정보의 내용을 핵심 키워드로 나타냄으로써 특허의 내용 및 동향을 예측할 수 있다는 장점이 있다. 반면에 특허들 간의 연관성 파악이 어려우므로 특허 간의 연결 구조를 이해하는데 제약점이 있다.
	클릭이란 무엇인가?	클릭은 세 개 이상의 노드로 구성된 최대 완전 서브그래프 (maximal complete subgraph)로서 클릭에 속하는 모든 노드가 서로 직접적으로 연결되어 있다 (Kwahk, 2014). 이러한 특성 때문에 클릭 분석은 일반적인 소셜 네트워크에서 강한 연결 정도를 갖는 커뮤니티를 찾는데 활용되어 왔다.
	키워드 네트워크 분석은 어떻게 나누어 실시하였는가?	네트워크 구축 방식은 Kim 등 (2016)의 논문에서 제안한 방식을 일반화한 것이다. 키워드 네트워크 분석은 네트워크의 전체적인 구조를 분석하기 위한 그래프 레벨 분석과 키워드 자체의 중심성을 분석하기 위한 노드 레벨 분석으로 나누어 실시하였다. 그래프 레벨 분석을 위해 네트워크 중앙성 (centralization), 밀도 (density) 및 군집 계수 (clustering coefficient)를 측정하였으며, 노드 레벨 분석을 위해 각 키워드의 연결정도 중심성 (degree centrality),근접 중심성 (closeness centrality), 그리고 매개 중심성(betweenness centrality)을 측정하였다.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

키워드 네트워크의 클릭 분석을 이용한 특허 데이터 분석
Patent data analysis using clique analysis in a keyword network 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약
AI-Helper

문제 정의

제안 방법

대상 데이터

이론/모형

성능/효과

후속연구

질의응답

참고문헌 (18)

이 논문을 인용한 문헌

저자의 다른 논문 :

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

키워드 네트워크의 클릭 분석을 이용한 특허 데이터 분석 Patent data analysis using clique analysis in a keyword network 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

제안 방법

대상 데이터

이론/모형

성능/효과

후속연구

질의응답

참고문헌 (18)

이 논문을 인용한 문헌

저자의 다른 논문 :

김동건 (34) 조진남 (30)

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

키워드 네트워크의 클릭 분석을 이용한 특허 데이터 분석
Patent data analysis using clique analysis in a keyword network 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper