$\require{mediawiki-texvc}$
  • 검색어에 아래의 연산자를 사용하시면 더 정확한 검색결과를 얻을 수 있습니다.
  • 검색연산자
검색연산자 기능 검색시 예
() 우선순위가 가장 높은 연산자 예1) (나노 (기계 | machine))
공백 두 개의 검색어(식)을 모두 포함하고 있는 문서 검색 예1) (나노 기계)
예2) 나노 장영실
| 두 개의 검색어(식) 중 하나 이상 포함하고 있는 문서 검색 예1) (줄기세포 | 면역)
예2) 줄기세포 | 장영실
! NOT 이후에 있는 검색어가 포함된 문서는 제외 예1) (황금 !백금)
예2) !image
* 검색어의 *란에 0개 이상의 임의의 문자가 포함된 문서 검색 예) semi*
"" 따옴표 내의 구문과 완전히 일치하는 문서만 검색 예) "Transform and Quantization"

논문 상세정보

기술예측을 위한 특허 키워드 네트워크 분석

Keyword Network Analysis for Technology Forecasting

초록

특허의 중요성이 커짐에 따라 특허분석의 중요성 또한 점점 커지고 있다. 특허분석은 네트워크 기반 방법과 키워드 기반 방법으로 나눠지는데 네트워크 기반은 특허 내부에 존재하는 세부 기술정보에 대한 분석이 불가능하다는 단점이 있고 키워드 기반은 기술정보간의 상호관계를 규명하지 못한다는 단점이 있다. 기존에 제시된 네트워크 기반 특허 분석과 키워드 기반 분석의 한계를 극복하기 위해서 두 방법을 혼합한 방법으로서 본 연구에서는 특허 키워드 네트워크 기반 분석 방법론을 제시하였다. 본 연구에서는 LED 분야의 특허들을 대상으로 텍스트 마이닝을 통해 중요한 기술정보를 추출한 다음, 키워드 네트워크를 구축하고, 이를 대상으로 커뮤니티 네트워크 분석을 수행하였다. 분석 결과는 다음과 같다. 첫째, 특허 키워드 네트워크는 매우 낮은 밀도와 매우 높은 클러스터링 지수를 나타내었다. 밀도가 높다는 것은 LED 분야내 특허 키워드 네트워크 내 노드(키워드)들이 산발적으로 연결되어 있다는 것을 의미하며, 클러스터링 지수가 높다는 것은 해당 키워드 네트워크 내 노드, 즉 키워드들이 각각의 커뮤니티로 매우 긴밀하게 연결되어 있음을 나타낸다. 둘째, 특허 키워드 네트워크도 다른 지식네트워크와 마찬가지로 명확한 멱함수 분포를 따른다는 사실을 알 수 있었다. 이는 기존에 활발히 연구, 활용되어 많은 연결고리를 갖고 있는 특허개념(키워드)수록 지속적으로 다른 연구자들에 의해 선택되고 이 키워드를 바탕으로 새로운 키워드들이 연결되어서 이들 키워드간의 조합으로 새로운 기술이 발명된다는 것이다. 셋째, 특허가 개발될 때 특정 분야에 유입된 키워드 중 새로운 링크가 생긴 키워드의 대부분이 기존에 연결되어 있던 커뮤니티 내의 키워드들과 결합되어 새로운 특허 개념을 구성한다는 사실을 발견하였다. 이러한 사실은 단기(4년) 장기(10년) 두 기간 모두 동일하게 나타났다. 나아가 본 연구에서 제시한 방법론을 통해 도출된 특허 키워드 조합 정보를 활용하면 미래에 어떤 개념들이 합쳐져서 새로운 특허 단위로 만들어 질지 가늠해볼 수 있고, 새로운 특허를 개발할 때 참고할 수 있는 유용한 정보로 활용할 수 있다.

Abstract

New concepts and ideas often result from extensive recombination of existing concepts or ideas. Both researchers and developers build on existing concepts and ideas in published papers or registered patents to develop new theories and technologies that in turn serve as a basis for further development. As the importance of patent increases, so does that of patent analysis. Patent analysis is largely divided into network-based and keyword-based analyses. The former lacks its ability to analyze information technology in details while the letter is unable to identify the relationship between such technologies. In order to overcome the limitations of network-based and keyword-based analyses, this study, which blends those two methods, suggests the keyword network based analysis methodology. In this study, we collected significant technology information in each patent that is related to Light Emitting Diode (LED) through text mining, built a keyword network, and then executed a community network analysis on the collected data. The results of analysis are as the following. First, the patent keyword network indicated very low density and exceptionally high clustering coefficient. Technically, density is obtained by dividing the number of ties in a network by the number of all possible ties. The value ranges between 0 and 1, with higher values indicating denser networks and lower values indicating sparser networks. In real-world networks, the density varies depending on the size of a network; increasing the size of a network generally leads to a decrease in the density. The clustering coefficient is a network-level measure that illustrates the tendency of nodes to cluster in densely interconnected modules. This measure is to show the small-world property in which a network can be highly clustered even though it has a small average distance between nodes in spite of the large number of nodes. Therefore, high density in patent keyword network means that nodes in the patent keyword network are connected sporadically, and high clustering coefficient shows that nodes in the network are closely connected one another. Second, the cumulative degree distribution of the patent keyword network, as any other knowledge network like citation network or collaboration network, followed a clear power-law distribution. A well-known mechanism of this pattern is the preferential attachment mechanism, whereby a node with more links is likely to attain further new links in the evolution of the corresponding network. Unlike general normal distributions, the power-law distribution does not have a representative scale. This means that one cannot pick a representative or an average because there is always a considerable probability of finding much larger values. Networks with power-law distributions are therefore often referred to as scale-free networks. The presence of heavy-tailed scale-free distribution represents the fundamental signature of an emergent collective behavior of the actors who contribute to forming the network. In our context, the more frequently a patent keyword is used, the more often it is selected by researchers and is associated with other keywords or concepts to constitute and convey new patents or technologies. The evidence of power-law distribution implies that the preferential attachment mechanism suggests the origin of heavy-tailed distributions in a wide range of growing patent keyword network. Third, we found that among keywords that flew into a particular field, the vast majority of keywords with new links join existing keywords in the associated community in forming the concept of a new patent. This finding resulted in the same outcomes for both the short-term period (4-year) and long-term period (10-year) analyses. Furthermore, using the keyword combination information that was derived from the methodology suggested by our study enables one to forecast which concepts combine to form a new patent dimension and refer to those conc

본문요약 

문제 정의
  • 그 다음 커뮤니티 네트워크 분석을 통해서 새로 유입된 키워드가 기존의 어떤 커뮤니티와 링크를 하고 있는지 확인한다.

    먼저 현시점에서 새로 출원된 특허에서 특허를 구성하는 주요 개념정보인 키워드들을 추출한다. 그 다음 커뮤니티 네트워크 분석을 통해서 새로 유입된 키워드가 기존의 어떤 커뮤니티와 링크를 하고 있는지 확인한다. 마지막으로 링크를 맺고 있는 커뮤니티 내의 키워드를 추출하여, 새로이 유입된 키워드와 조합한다.

  • 나아가 두 분야 이상의 특허정보들이 결합하여 새로운 특허가 만들어지는 과정에서도 본 연구방법론의 적용 가능성 여부를 분석하고자 한다.

    차후 연구주제로는 본 연구에서 제시한 방법론을 LED 이외의 다른 특허분야를 선택하여 해당 분야에서도 동일한 연구결과를 제시함으로써 본 연구방법론의 타당성을 검증한다. 나아가 두 분야 이상의 특허정보들이 결합하여 새로운 특허가 만들어지는 과정에서도 본 연구방법론의 적용 가능성 여부를 분석하고자 한다.

  • 단기 및 장기 두 가지에 대해 분석한 이유는 본 연구에서 제시하는 분석 방법론이 시간적 간격에 상관없이 유의한 결과를 도출함을 보이기 위해서이다.

    이를 통해 새로 유입된 키워드들이 기존에 관계를 맺고 있던 커뮤니티 내 키워드들과 연결될 확률을 파악하고자 하였다. 단기 및 장기 두 가지에 대해 분석한 이유는 본 연구에서 제시하는 분석 방법론이 시간적 간격에 상관없이 유의한 결과를 도출함을 보이기 위해서이다.

  • 본 연구에서는 앞서 언급한 두 방법론의 한계점을 해결하기 위해 두 방법론을 통합한 기술분석 및 예측 방법론을 제시하고자 한다.

    반면 키워드 기반 특허분석은 특허 내용을 기반으로 분석을 수행하기 때문에 특허 내의 핵심기술 정보를 파악할 수는 있지만, 다른 특허에서 사용되는 기술정보들과의 상호관계를 규명하지는 못하는 한계점이 있다. 본 연구에서는 앞서 언급한 두 방법론의 한계점을 해결하기 위해 두 방법론을 통합한 기술분석 및 예측 방법론을 제시하고자 한다. 즉, 개별 특허를 대상으로 텍스트 마이닝을 통해 중요한 기술정보를 추출한 다음, 키워드 네트워크를 구축하고, 이를 대상으로 커뮤니티 네트워크 분석을 수행한다.

  • 이를 통해 새로 유입된 키워드들이 기존에 관계를 맺고 있던 커뮤니티 내 키워드들과 연결될 확률을 파악하고자 하였다.

    반면 장기분석은 <그림 2>에 제시된 것처럼, 2000~2005년(6년) 구간을 테스트기간으로 두고, 이 기간 대비 2005년에 새로 유입된 키워드들에 대해, 검증기간(2006~2010년)동안 다른 키워드들과의 모든 연결 수 대비 테스트 기간에 형성된 커뮤니티 내 키워드들과의 연결수의 비율을 분석하였다. 이를 통해 새로 유입된 키워드들이 기존에 관계를 맺고 있던 커뮤니티 내 키워드들과 연결될 확률을 파악하고자 하였다. 단기 및 장기 두 가지에 대해 분석한 이유는 본 연구에서 제시하는 분석 방법론이 시간적 간격에 상관없이 유의한 결과를 도출함을 보이기 위해서이다.

  • 이에 본 연구에서는 기존의 특허분석 방법론인 네트워크 기반 특허분석과 키워드기반 특허 분석의 한계점을 해결하기 위해 두 방법론을 통합한 기술분석 및 예측 방법론을 제시하였다.

    이에 본 연구에서는 기존의 특허분석 방법론인 네트워크 기반 특허분석과 키워드기반 특허 분석의 한계점을 해결하기 위해 두 방법론을 통합한 기술분석 및 예측 방법론을 제시하였다. 특히 본 연구에서는 LED 분야의 특허들을 대상으로 텍스트 마이닝을 통해 중요한 기술정보를 추출한 다음, 키워드 네트워크를 구축하고, 이를 대상으로 커뮤니티 네트워크 분석을 수행하고, 이를 통해 특허 각각이 지니는 핵심기술요소에 대한 구체적인 정보를 파악할 수 있고, 해당분야 전문가들에게 미래에 개발 가능한 특허 키워드 조합을 제시하는 방법론을 제안하였다.

  • 이에 본 연구에서는 전문가의 자문을 얻어서 대상 분야를 좁혀서 분석하였다.

    본 연구 대상 분야인 LED의 경우도 검색어를 LED로 할 경우 수만 개의 특허가 출원되기에 추출된 모든 특허들을 대상으로 하기에는 한계가 있었다. 이에 본 연구에서는 전문가의 자문을 얻어서 대상 분야를 좁혀서 분석하였다.

본문요약 정보가 도움이 되었나요?

질의응답 

키워드에 따른 질의응답 제공
핵심어 질문 논문에서 추출한 답변
네트워크 기반
네트워크 기반 방법은 어떠한 단점이 있는가?
특허 내부에 존재하는 세부 기술정보에 대한 분석이 불가능하다는 단점

특허의 중요성이 커짐에 따라 특허분석의 중요성 또한 점점 커지고 있다. 특허분석은 네트워크 기반 방법과 키워드 기반 방법으로 나눠지는데 네트워크 기반은 특허 내부에 존재하는 세부 기술정보에 대한 분석이 불가능하다는 단점이 있고 키워드 기반은 기술정보간의 상호관계를 규명하지 못한다는 단점이 있다. 기존에 제시된 네트워크 기반 특허 분석과 키워드 기반 분석의 한계를 극복하기 위해서 두 방법을 혼합한 방법으로서 본 연구에서는 특허 키워드 네트워크 기반 분석 방법론을 제시하였다.

특허분석
특허분석은 무슨 방법으로 나누어 지는가?
네트워크 기반 방법과 키워드 기반 방법

특허의 중요성이 커짐에 따라 특허분석의 중요성 또한 점점 커지고 있다. 특허분석은 네트워크 기반 방법과 키워드 기반 방법으로 나눠지는데 네트워크 기반은 특허 내부에 존재하는 세부 기술정보에 대한 분석이 불가능하다는 단점이 있고 키워드 기반은 기술정보간의 상호관계를 규명하지 못한다는 단점이 있다. 기존에 제시된 네트워크 기반 특허 분석과 키워드 기반 분석의 한계를 극복하기 위해서 두 방법을 혼합한 방법으로서 본 연구에서는 특허 키워드 네트워크 기반 분석 방법론을 제시하였다.

LED 분야의 특허들을 대상으로 텍스트 마이닝
본 논문에서 LED 분야의 특허들을 대상으로 텍스트 마이닝을 통해 추출한 정보를 분석을 한 결과는 무엇인가?
첫째, 특허 키워드 네트워크는 매우 낮은 밀도와 매우 높은 클러스터링 지수를 나타내었다. 밀도가 높다는 것은 LED 분야내 특허 키워드 네트워크 내 노드(키워드)들이 산발적으로 연결되어 있다는 것을 의미하며, 클러스터링 지수가 높다는 것은 해당 키워드 네트워크 내 노드, 즉 키워드들이 각각의 커뮤니티로 매우 긴밀하게 연결되어 있음을 나타낸다. 둘째, 특허 키워드 네트워크도 다른 지식네트워크와 마찬가지로 명확한 멱함수 분포를 따른다는 사실을 알 수 있었다. 이는 기존에 활발히 연구, 활용되어 많은 연결고리를 갖고 있는 특허개념(키워드)수록 지속적으로 다른 연구자들에 의해 선택되고 이 키워드를 바탕으로 새로운 키워드들이 연결되어서 이들 키워드간의 조합으로 새로운 기술이 발명된다는 것이다. 셋째, 특허가 개발될 때 특정 분야에 유입된 키워드 중 새로운 링크가 생긴 키워드의 대부분이 기존에 연결되어 있던 커뮤니티 내의 키워드들과 결합되어 새로운 특허 개념을 구성한다는 사실을 발견하였다.

분석 결과는 다음과 같다. 첫째, 특허 키워드 네트워크는 매우 낮은 밀도와 매우 높은 클러스터링 지수를 나타내었다. 밀도가 높다는 것은 LED 분야내 특허 키워드 네트워크 내 노드(키워드)들이 산발적으로 연결되어 있다는 것을 의미하며, 클러스터링 지수가 높다는 것은 해당 키워드 네트워크 내 노드, 즉 키워드들이 각각의 커뮤니티로 매우 긴밀하게 연결되어 있음을 나타낸다. 둘째, 특허 키워드 네트워크도 다른 지식네트워크와 마찬가지로 명확한 멱함수 분포를 따른다는 사실을 알 수 있었다. 이는 기존에 활발히 연구, 활용되어 많은 연결고리를 갖고 있는 특허개념(키워드)수록 지속적으로 다른 연구자들에 의해 선택되고 이 키워드를 바탕으로 새로운 키워드들이 연결되어서 이들 키워드간의 조합으로 새로운 기술이 발명된다는 것이다. 셋째, 특허가 개발될 때 특정 분야에 유입된 키워드 중 새로운 링크가 생긴 키워드의 대부분이 기존에 연결되어 있던 커뮤니티 내의 키워드들과 결합되어 새로운 특허 개념을 구성한다는 사실을 발견하였다. 이러한 사실은 단기(4년) 장기(10년) 두 기간 모두 동일하게 나타났다.

질의응답 정보가 도움이 되었나요?

저자의 다른 논문

참고문헌 (25)

  1. 1. Agami, N. M. E., A. M. A. Omran, M. M. Saleh, and H. E. E. E. Shishiny, "An enhanced approach for Trend Impact Analysis", Technological Forecasting and Social Change, Vol.75, No.9(2008), 1439-1450. 
  2. 2. Albert, R., I. Albert, and G. L. Nakarado, "Structural vulnerability of the North American power grid", Physical Review E, Vol.58, No.2 (2004). 
  3. 3. Bagler, G., "Analysis of the airport network of India as a complex weighted network", Physica A:Statistical Mechanics and its Applications, Vol.387, No.12(2008), 2972-2980. 
  4. 4. Bengisu, M. and R. Nekhili, "Forecasting emerging technologies with the aid of science and technology databases", Technological Forecasting and Social Change, Vol.73, No.7(2006), 835-844. 
  5. 5. Borner, K., J. T. Maru, and R. L. Goldstone, "The simultaneous evolution of author and paper networks", Proceedings of the National Academy of Sciences of the United State of America, Vol.101, No.1(2004), 5266-5273. 
  6. 6. Buchanan, M., "Nexus:small worlds and the groundbreaking theory of networks", Local : Norton, 2002. 
  7. 7. Campbell, R. S., "Patent trends as a technological Forecasting Tool", World Patent Information, Vol.5, No.3(1983), 137-143. 
  8. 8. Cancho, R. F. and V. S. Richard, "The small world of human language", Proceedings of the royal society, Vol.268, No.1482(2001), 2261-2265. 
  9. 9. Frantzi, K., S. Ananiadou, and H. Mima, "Automatic recognition of multi-word terms", International J ournal of Digital Libraries, Vol.3, No.2(2002), 117-132. 
  10. 10. Girvan, M. and M. E. J. Newman, "Community structure in social and biological networks", Proceedings of the National Academy of Sciences of the United states of America, Vol.99, No.12(2002), 7821-7826. 
  11. 11. Jeong, H., Z. Neda, and A. L. Barabasi, "Measuring preferential attachment for evolving networks", Europhysics Letters, Vol.61, No. 4(2003), 1-4. 
  12. 12. Lee, S. J., B. G. Yoon, and Y. T. Park, "An approach to discovering new technology opportunities: Keyword-based patent map approach", Technovation, Vol.29, No.6/7(2009), 481-497. 
  13. 13. Lee, S. J., S. H. Lee, H. J. Seol, and Y. T. Park, "Using patent information for designing new product and technology:keyword based technology roadmapping", R&D Management, Vol.38, No.2(2008), 169-188. 
  14. 14. Li, M., Y. Fana, J. Chena, L. Gaoa, Z. Dia, and J. Wua, "Weighted networks of scientific communication : the measurement and topological role of weight", Physica A : Statistical Mechanics and its Applications, Vol.350, No.2/4(2005), 643-656. 
  15. 15. Li, X., H. Chen, Z. Huang, and M. C. Roco, "Patent citation network in nanotechnology (1976-2004)", Journal of Nanoparticle Research, Vol.9(2007), 337-352. 
  16. 16. Narin, F., "Patent bibliometrics", Scientometrics, Vol.30, No.1(1994), 147-155 
  17. 17. Raghavan, U. N., R. Albert, and S. Kumara, "Near linear time algorithm to detect community structures in large-scale networks", Physical Review E, Vol.76, No.5(2007). 
  18. 18. Tseng, Y. H. and C. J. Lin, "Text mining techniques for patent analysis", Information Processing and Management, Vol.43, No.4(2007), 1216-1247. 
  19. 19. Vandewalle, N., F. Brisbois, and X. Tordoir, "Non-random topology of stock markets", Quantitative Finance, Vol.1, No.3(2001), 372 -374. 
  20. 20. Wanga, M. and G. D. Yua, "Measuring the preferential attachment mechanism in citation networks", Physica A:Statistical Mechanics and its Applications, Vol.387, No.18(2008), 4692-4698. 
  21. 21. Wartburg, I. V., T. Teichert, and K. Rost, "Inventive progress measured by multi-stage patent citation analysis", Research Policy, Vol.34, No.10(2005), 1591-1607. 
  22. 22. Weaver, W. T., "The Delphi forecasting method," The Phi Delta Kappan, Vol.52, No.5 (1971), 267-271. 
  23. 23. Yoon, B. G. and Y. T. Park, "A text-mining- based patent network:Analytical tool for high-technology trend", Journal of High Technology Management Research, Vol.15, No.1(2004), 37-50. 
  24. 24. Yoon, B. G. and Y. T. Park, "Development of new technology forecasting algorithm:hybrid approach for morphology analysis and conjoint analysis of patent information", IEEE Transactions on Engineering Management, Vol.54, No.3(2007), 588-599. 
  25. 25. Yoon, B. U., C. B. Yoon, and Y. T. Park, "On the development and application of a self-organizing feature map-based patent map", R&D Management, Vol.32, No.4(2002), 29 1-300. 

문의하기 

궁금한 사항이나 기타 의견이 있으시면 남겨주세요.

Q&A 등록

DOI 인용 스타일

"" 핵심어 질의응답