$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 특허문서 필드의 기능적 특성을 활용한 IPC 다중 레이블 분류
IPC Multi-label Classification based on Functional Characteristics of Fields in Patent Documents 원문보기

Journal of Internet Computing and Services = 인터넷정보학회논문지, v.18 no.1, 2017년, pp.77 - 88  

임소라 (Dept. of Telecommunication and Information Engineering, Korea Aerospace University) ,  권용진 (Dept. of Telecommunication and Information Engineering, Korea Aerospace University)

초록
AI-Helper 아이콘AI-Helper

최근 지식과 정보가 가치를 생산하는 지식기반사회로 접어들면서 지식재산권의 대표적인 형태인 특허에 대한 중요성이 매우 높아지고 있으며 출원되는 특허의 양도 매년 증가하고 있다. 방대한 양의 특허정보를 효과적으로 이용하기 위해서 특허문서를 그 발명의 기술적 주제에 따라 적절하게 분류하는 것이 필요하며 이를 위해 IPC(International Patent Classification)가 주로 사용되고 있다. 현재 주로 사람의 손으로 이뤄지는 특허문서의 IPC 분류과정의 효율성을 높이기 위하여 다양한 데이터마이닝기계학습 알고리즘을 기반으로 IPC 자동분류에 관한 연구들이 수행되어 왔다. 하지만 기존의 IPC 자동분류에 관한 연구의 대부분은 특허문서의 구조적 특징과 같은 특허문서 고유의 데이터 특성에 대한 고려보다는 다양한 기계학습 알고리즘을 특허문서로 적용하는 것에 초점을 맞춰왔다. 이에 본 논문에서는 IPC 자동분류를 위해 특허문서의 특징과 구조적 필드의 역할을 기반으로 특허문서 분류에 영향을 끼치는 두 가지 필드, 기술분야 및 배경기술 필드의 활용을 제안한다. 그리고 특허문서가 동시에 다수의 IPC 분류코드를 가지는 점을 반영하여 다중 레이블 분류(multi-label classification) 모델을 구축한다. 또한 IPC 다중 레이블 분류의 실제 현장에서의 적용 가능성 확인을 위해 630개의 범주를 가지는 IPC 서브클래스 레벨까지 분류 가능한 수법을 제안한다. 이를 위해 국내에서 등록된 564,793건의 특허문서를 대상으로 특허문서의 구조적 필드의 영향을 확인하기 위한 IPC 다중 레이블 분류 실험을 수행하였고, 그 결과 제목, 요약, 청구항, 기술분야 및 배경기술 필드를 활용한 실험에서 87.2%의 싱글매치 정확도를 얻었다. 이를 통해 기술분야 및 배경기술 두 필드가 IPC 서브클래스 레벨까지의 다중 레이블 분류의 정확도를 향상시키는데 중요한 역할을 하고 있음을 확인하였다.

Abstract AI-Helper 아이콘AI-Helper

Recently, with the advent of knowledge based society where information and knowledge make values, patents which are the representative form of intellectual property have become important, and the number of the patents follows growing trends. Thus, it needs to classify the patents depending on the te...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문은 특허문서에 대하여 효과적인 IPC 분류를 위하여 기계학습 기법 등과 같은 분류 모델에 중심을 두는 것이 아니라 특허문서의 데이터 구조 그 자체에 보다 집중하는 분류 방법을 제안하였다. 특허문서의 데이터 특징과 IPC 분류구조의 분석을 통해 IPC 서브클래스 레벨에서의 분류 수행에 있어서 의미있는 필드로 기술분야 및 배경기술 필드를 제시하였으며, 이를 확인하기 위해 특허문서의 구조적 필드가 IPC 서브클래스 레벨까지의 분류에 미치는 영향을 살펴보기 위한 특허문서의 각 필드의 조합으로 구성한 비교실험을 수행하였다.
  • 본 연구에서는 사람의 의사결정에 보조수단으로 활용될 수 있는 실용성 있는 분류기를 목적으로 한다. 따라서 특허문서의 각 필드를 대상으로 수행한 분류의 성능을 평가하기 위하여 다음과 같은 두 가지 정확도 척도를 사용한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
IPC는 어떤것인가? IPC는 국제특허분류(International Patent Classification)의 약자로서, 특허문서들을 고유의 분류코드로 할당한다. 이 분류코드는 특허문서에 대하여 국제적으로 통일된 분류를 하기위한 수단으로, 특허 문서가 속한 기술 분야에 따라 세분화 되어있다.
특허문서의 적절한 분류는 어떻게 사용되는가? [1] 또한 특허의 누적 등록건수가 향후 폭발적으로 증가할 것으로 예상되는 상황에서 특허 조사를 효과적으로 수행할 수 있도록 특허를 기술 및 산업분야에 따라 적절하게 분류하는 것이 중요해 지고 있다. 특허문서의 적절한 분류는1) 특허출원 명세서의 신규성이나 진보성을 평가하기 위하여 기존 특허문헌을 효과적으로 조사(선행기술 검색)하는데 활용되고 2) 특허문서에 포함되어 있는 기술 및 권리 정보에 용이하게 접근하기 위해 특허문서를 정연하게 배열하고 보급하는데 활용되며 3) 여러 분야에 대한 기술 발전 평가 및 통계 작성에 활용 및 4) 특허분류의 정확성 및 일관성 확보와 검색 효율성을 제고하여 특허업무의 질적 수준 향상 등을 목적으로 유용하게 사용되고 있다.[2]
신규성(novelty),비자명성 (또는 진보성, non-obviousness), 유용성 (utility)이 대변되는 것은 무엇인가? 여기서 신규성은 발명의 내용이 종래의 기술에 알려져 있지 않는 새롭고 독창적인 것을 의미하며, 비자명성은 선행기술에 비해 진보한 점이 있는 것, 그리고 유용성은 산업 상에서 이용 가능한 현실적 가치를 가지는 것을 의미한다. 이 세 가지 요건은 주로 특허문서의 청구항으로 대변된다. 즉 새로운 발명에 대하여 그 아이디어의 가치를 나타내는 부분이 청구항이다.
질의응답 정보가 도움이 되었나요?

참고문헌 (13)

  1. "Intellectual Property Statistics for 2014," Korean Intellectual Property Office, ISSN 2092-5417, 2015. 

  2. International Patent Classification Guide, http://www.kipo.go.kr/kpo/user.tdf?auser.html.HtmlApp&c4030 4&catmenum06_07_02_05&year2015&ver01 

  3. "Guidelines for Examination," Korean Intellectual Property Office, ISSN 2092-8866. 

  4. C.J. Fall, A. Torcsvari, K.Benzineb, G. Karetka, "Automated Categorization in the International Patent Classification," In ACM SIGIR forum, April 2003, vol. 37(1), pp. 10-25. http://dx.doi.org/10.1145/945546.945547 

  5. LS. Larkey, "A Patent Search and Classification System," In the 4th ACM Conference on Digital Libraries, pages 19-87, Berkeley, CA, August 99. http://dx.doi.org/10.1145/313238.313304 

  6. D. Tikk, G. Biro, A. Torcsvari, "A Hierarchical Online Classifier for Patent Categorization," In Emerging Technologies of Text mining: Techniques and Applications (2007), pp. 244-267. https://doi.org/10.4018/9781599043739.ch012 

  7. Y.-L. Chen, Y.-C. Chang, "A three-phase method for patent classification," Information Processing and Management, Vol. 48, no. 6, pp. 1017-1030, 2012. https://doi.org/10.1016/j.ipm.2011.11.001 

  8. D. Seneviratne, S. Geva, G. Zuccon, and G. Ferraro, "A Signature Approach to Patent Classification," Information Retrieval Technology Vol. 9460, pp. 413-419, 2016. https://doi.org/10.1007/978-3-319-28940-3_35 

  9. C. Park, K. Kim, and D. Seong, "Automatic IPC Classification for Patent Documents of Convergence Technology Using KNN," Journal of KIIT. Vol. 12, no. 3, pp. 175-185, Mar. 2014. https://doi.org/10.14801/kiitr.2014.12.3.175 

  10. J. Kim, K. Choi, "Patent Document Categorization based on Semantic Structural Information," In Proc. of the 17th Annual Conference on Human and Cognitive Language Technology, pp. 28-34, 2005. http://www.dbpia.co.kr/Article/NODE01065130 

  11. KIPRIS (Korea Intellectual Property Rights Information Service) plus, http://plus.kipris.or.kr/ 

  12. KLT2000, Korean Morphologigal Analyzer, http://nlp.kookmin.ac.kr/ 

  13. A. M. Kibriya, E. Frank, B. Pfahringer, and G. Holmes, "Multinomial naive bayes for text categorization revisited," In Seventh Australian joint conference on artificial intelligence, Springer, Berlin, pp. 488-499, 2004. https://doi.org/10.1007/978-3-540-30549-1_43 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로