빅데이터의 활용은 비즈니스 가치를 높이는데 필수요소가 됨에 따라 빅데이터 시장의 규모가 점점 더 커지고 있다. 이에 따라 빅데이터 시장을 선점하기 위해서는 경쟁력 있는 특허를 선점하는 것이 중요하다. 본 연구에서는 빅데이터 특허의 동향을 분석하기 위하여 영문 키워드 네트워크 기반 특허분석을 수행하였다. 분석 절차는 빅데이터 수집 및 전처리, 네트워크 구성, 네트워크 분석으로 구성되어 있다. 연구 결과는 다음과 같다. 빅데이터 특허 대다수는 예측 등을 위한 데이터 처리를 위한 특허이며, analysis, process, information, data, prediction, server, service, construction 키워드가 연결정도 중심성 및 매개 중심성이 높았다. 본 연구의 분석결과는 향후 빅데이터 특허 출원 시 참고할 수 있는 유용한 정보로 활용될 수 있다.
빅데이터의 활용은 비즈니스 가치를 높이는데 필수요소가 됨에 따라 빅데이터 시장의 규모가 점점 더 커지고 있다. 이에 따라 빅데이터 시장을 선점하기 위해서는 경쟁력 있는 특허를 선점하는 것이 중요하다. 본 연구에서는 빅데이터 특허의 동향을 분석하기 위하여 영문 키워드 네트워크 기반 특허분석을 수행하였다. 분석 절차는 빅데이터 수집 및 전처리, 네트워크 구성, 네트워크 분석으로 구성되어 있다. 연구 결과는 다음과 같다. 빅데이터 특허 대다수는 예측 등을 위한 데이터 처리를 위한 특허이며, analysis, process, information, data, prediction, server, service, construction 키워드가 연결정도 중심성 및 매개 중심성이 높았다. 본 연구의 분석결과는 향후 빅데이터 특허 출원 시 참고할 수 있는 유용한 정보로 활용될 수 있다.
As the use of big data is necessary for increasing business value, the size of the big data market is getting bigger. Accordingly, it is important to apply competitive patents in order to gain the big data market. In this study, we conducted the patent analysis based keyword network to analyze the t...
As the use of big data is necessary for increasing business value, the size of the big data market is getting bigger. Accordingly, it is important to apply competitive patents in order to gain the big data market. In this study, we conducted the patent analysis based keyword network to analyze the trend of big data patents. The analysis procedure consists of big data collection and preprocessing, network construction, and network analysis. The results of the study are as follows. Most of big data patents are related to data processing and analysis, and the keywords with high degree centrality and between centrality are "analysis", "process", "information", "data", "prediction", "server", "service", and "construction". we expect that the results of this study will offer useful information in applying big data patent.
As the use of big data is necessary for increasing business value, the size of the big data market is getting bigger. Accordingly, it is important to apply competitive patents in order to gain the big data market. In this study, we conducted the patent analysis based keyword network to analyze the trend of big data patents. The analysis procedure consists of big data collection and preprocessing, network construction, and network analysis. The results of the study are as follows. Most of big data patents are related to data processing and analysis, and the keywords with high degree centrality and between centrality are "analysis", "process", "information", "data", "prediction", "server", "service", and "construction". we expect that the results of this study will offer useful information in applying big data patent.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
그러나 이러한 양적 분석은 근본적으로 기술에 대한 핵심 내용을 파악하지 못하는 문제점이 있다[9]. 따라서 본 연구에서는 기존의 연구의 문제점을 해결하기 위하여 빅데이터 관련 특허에 대한 양적 분석뿐만 아니라 빅데이터 특허의 키워드를 분석하고, 동시 사용된 키워드를 이용하여 네트워크 분석을 수행하여 빅데이터 기술에 대한 동향과 핵심 기술을 파악하고 시사점을 제공하고자 한다. 이러한 키워드 네트워크 기반 특허 분석은 텍스트 마이닝을 통해 특허 내용에 대한 핵심기술을 파악할 수 있는 장점을 지니고 있다[9].
이러한 빅데이터의 시장을 선점하기 위해서는 우선 기술 동향을 파악하는 것이 중요하다. 본 연구에서는 빅데이터 기술의 동향을 파악하기 위하여 네트워크 분석에 기반을 둔 특허분석을 수행하였다.
본 연구에서는 빅데이터 특허의 특징을 파악하고 시사점을 제공하기 위하여 2016년도까지 빅데이터 특허를 분석하였다.
본 연구에서는 빅데이터의 다양한 연구 분야 중에서 특허와 관련하여 국내에 출원한 빅데이터 특허의 특징을 파악하기 위하여 빅데이터 특허의 제목의 키워드를 이용한 네트워크를 구축한 후, 구축된 네트워크의 밀도 및 중 심성 등을 분석함으로써 시사점을 제공하고자 한다. 이를 위한 네트워크 분석 절차는 Fig.
제안 방법
예로서 지능형 시스템의 연구 동향을 분석하기 위하여 주성분을 이용한 K-평균 군집을 통해 공백기술을 분석하였고[12], 휴대폰 유저 인터페이스(User Interface, UI)의 기술 흐름을 분석하기 위하여 한국, 미국, 일본, 유럽에 대해 연도별, 기술별, 출 원인별로 빈도분석을 수행하였다[13]. 그리고 한국, 미국, 중국의 핀테크 기술 동향을 파악하기 위하여 LDA(Latent Dirichlet Allocation) 알고리즘을 통해 토픽을 구분한 후 시계열 분석 및 네트워크 분석을 수행하였다[14]. 이러한 특허 정보는 기술적 활용도와 경제적 가치로서 인식이 더욱 중요해 지고 있다.
또한 254 한국융합학회논문지 제9권 제2호 수집된 특허를 이용한 네트워크를 구성하기 위해 명사의 단·복수에 대한 수 일치(예를 들면 e-bills를 e-bill로 변환), 하이픈(hyphen) 및 띄어쓰기 일치(예를 들면, real-time을 realtime으로 변환, health care를 healthcare로 변환), 이음동의어에 대해 동일 단어 처리(예를 들면, vehicle을 car로 변환), 전치사 및 대명사 삭제(예를 들면, a, an, the, about, at, in 등 삭제) 등 키워드에 대해 전처리를 수행한다.
두 번째 단계는 동일 특허에 동시 출현한 키워드를 연결하여 빅데이터 특허의 키워드 네트워크를 구성한다. 마지막 단계에서는 빅데이터 특허의 키워드 네트워크의 특징을 파악하기 위해 밀도 등 네트워크 구조, 연결정도 중심성 및 매개 중심성을 분석한다.
대상 데이터
첫 번째 단계는 Table 1과 같이 특허정보넷 키프리스 (www.kipris.or.kr)에서 특허의 영문 명칭에 bigdata, big data, big-data를 포함하는 출원 특허를 수집한다. 또한 254 한국융합학회논문지 제9권 제2호 수집된 특허를 이용한 네트워크를 구성하기 위해 명사의 단·복수에 대한 수 일치(예를 들면 e-bills를 e-bill로 변환), 하이픈(hyphen) 및 띄어쓰기 일치(예를 들면, real-time을 realtime으로 변환, health care를 healthcare로 변환), 이음동의어에 대해 동일 단어 처리(예를 들면, vehicle을 car로 변환), 전치사 및 대명사 삭제(예를 들면, a, an, the, about, at, in 등 삭제) 등 키워드에 대해 전처리를 수행한다.
데이터처리
이러한 특허 데이터는 여러 분야에서 기술 동향을 분석하기 위하여 사용되고 있다. 예로서 지능형 시스템의 연구 동향을 분석하기 위하여 주성분을 이용한 K-평균 군집을 통해 공백기술을 분석하였고[12], 휴대폰 유저 인터페이스(User Interface, UI)의 기술 흐름을 분석하기 위하여 한국, 미국, 일본, 유럽에 대해 연도별, 기술별, 출 원인별로 빈도분석을 수행하였다[13]. 그리고 한국, 미국, 중국의 핀테크 기술 동향을 파악하기 위하여 LDA(Latent Dirichlet Allocation) 알고리즘을 통해 토픽을 구분한 후 시계열 분석 및 네트워크 분석을 수행하였다[14].
성능/효과
첫째, 빅데이터 특허의 주요 IPC는 G06F와 G06Q로 예측 등 데이터 처리를 위한 특허이다. 둘째, 빅데이터 특허의 키워드 네트워크는 낮은 밀도를 가지고 있을 뿐만 아니라 대부분 키워드는 하나의 큰 하위 네트워크로 구성되어 있다. 따라서 빅데이터의 키워드는 간접적으로 연결되어 있음을 알 수 있다.
따라서 빅데이터의 키워드는 간접적으로 연결되어 있음을 알 수 있다. 셋째, 연결정도 중심성과 매개 중심성이 공통적으로 높은 키워드는 analysis(분석), process(처리), information(정보), data (데이터), prediction(예측), server(서버), service(서비스), construction(구축)이다. 따라서 이러한 키워드가 빅데이터 특허의 주요 주제일 뿐만 아니라 다른 분야와 융합을 하기 위해 중요하다.
후속연구
첫째, 빅데이터 특허의 특징을 살펴보기 위하여 미국 등 빅데이터 선도 국가의 특허를 살펴봐야 함에도 불구하고 한국에 출원된 특허만을 대상으로 하였기 때문에 연구결과를 일반화하는 데 한계가 있다. 둘째, 소셜 네트워크 분석을 위해 포괄성, 군집계수 등 다양한 지표가 존재함에도 불구하고 본 연구에서는 밀도, 연결정도 중심성 및 매개 중심성 지표만을 사용한 한계점이 존재한다. 마지막으로 특허요약, 청구 항 등을 통해 특허의 키워드를 추출할 수 있음에도 불구하고 특허의 제목을 이용하여 키워드를 추출한 한계점이 있다.
마지막으로 특허요약, 청구 항 등을 통해 특허의 키워드를 추출할 수 있음에도 불구하고 특허의 제목을 이용하여 키워드를 추출한 한계점이 있다. 따라서 이러한 한계점을 고려하여 후속연구를 진행하고 실제 사례 중심의 실험결과를 반영한다면 좋은 연구가 될 수 있을 것으로 판단된다.
둘째, 소셜 네트워크 분석을 위해 포괄성, 군집계수 등 다양한 지표가 존재함에도 불구하고 본 연구에서는 밀도, 연결정도 중심성 및 매개 중심성 지표만을 사용한 한계점이 존재한다. 마지막으로 특허요약, 청구 항 등을 통해 특허의 키워드를 추출할 수 있음에도 불구하고 특허의 제목을 이용하여 키워드를 추출한 한계점이 있다. 따라서 이러한 한계점을 고려하여 후속연구를 진행하고 실제 사례 중심의 실험결과를 반영한다면 좋은 연구가 될 수 있을 것으로 판단된다.
따라서 이러한 키워드가 빅데이터 특허의 주요 주제일 뿐만 아니라 다른 분야와 융합을 하기 위해 중요하다. 본연구가 가지는 시사점은 첫째, 네트워크 기반의 분석 방법과 키워드 기반분석 방법이 가지고 있는 문제점을 해결하기 위하여 특허 정보를 활용하여 학문적으로 키워드 네트워크 기반 특허 분석 방법 이용을 제시하였으며 둘째, 실무적으로 본 연구의 분석결과는 빅데이터 특허 출원 시 참고할 수 있는 유용한 정보로 활용될 수 있으며 향후 키워드를 이용하여 다른 주제들과 융합한 새로운 특허를 출원하는데 용이하게 활용할 수 있다.
그러나 본 연구는 다음과 같은 한계점을 지니고 있다. 첫째, 빅데이터 특허의 특징을 살펴보기 위하여 미국 등 빅데이터 선도 국가의 특허를 살펴봐야 함에도 불구하고 한국에 출원된 특허만을 대상으로 하였기 때문에 연구결과를 일반화하는 데 한계가 있다. 둘째, 소셜 네트워크 분석을 위해 포괄성, 군집계수 등 다양한 지표가 존재함에도 불구하고 본 연구에서는 밀도, 연결정도 중심성 및 매개 중심성 지표만을 사용한 한계점이 존재한다.
질의응답
핵심어
질문
논문에서 추출한 답변
소셜 네트워크 분석이란?
소셜 네트워크 분석(Social Network Analysis)은 개체들 간의 관계를 네트워크로 구성하여 네트워크에 대한 구조 및 개체 특성에 대해 계량적으로 분석하는 방법이 다[15-18]. 일반적으로 네트워크는 노드와 링크로 구성되어 있다.
빅데이터 기술은 어떻게 나눌 수 있는가?
빅데이터 기술은 크게 수집 기술, 저장 및 관리 기술, 처리 기술, 분석 기술, 표현 및 활용 기술 등으로 나눌 수 있다[4]. 빅데이터 수집을 위한 대표적인 방법으로는 크롤링(Crawling), 오픈 API 등의 활용이 있으며, 빅데이터 저장 및 관리 기술은 No-SQL 등이 있다.
기업들이 빅데이터 시장을 선점하려는 이유로 시장규모의 추이는 어떠한가?
이와 같이 다양한 빅데이터의 기술을 활용한 비즈니스 모델이 개발되고 상업적으로 활용됨에 따라 빅데이터 시장은 점점 커지고 있다. IDC 보고서[5]에 의하면 2017년 기준 빅데이터 시장규모는 약 1,500억 달러이며, 2020년까지 연간 약 12% 성장할 것으로 예상되고 있다. 이에 따라 많은 기업들이 빅데이터 시장을 선점하기 위해 다양한 솔루션을 제공하고 있다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.