보고서 정보
주관연구기관 |
건국대학교 산학협력단 |
연구책임자 |
윤장혁
|
참여연구자 |
김무진
,
김정욱
,
정병기
,
박영진
,
최하영
,
고남욱
|
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 |
한국어
|
발행년월 | 2015-10 |
주관부처 |
미래창조과학부 KA |
사업 관리 기관 |
한국과학기술정보연구원 Korea Institute of Science and Technology Information |
등록번호 |
TRKO201600000571 |
DB 구축일자 |
2016-04-16
|
키워드 |
기술기회발굴,기술인지,제품-특허매칭,기술추출 알고리즘Technology Opportunidy Discovery,Technology Recognition,Product-Patent Matching,Technology Extraction Algorithm
|
초록
▼
특허 문서 내 타겟 제품 판별에 있어서,
• 특허 문서 내 타겟 제품을 판별하는 모델은, 제품-특허간 IPC 분포 유사도 추출하여 제품 특허간의 유사도를 기반으로 제품과 특허를 매칭함
• 개발된 모델을 기반으로 본 연구는 Basic 모형, Basic + Rep.claim 모형, Basic + sentence 모형, Basic + word 모형의 총 4가지 모형을 개발함
• 본 연구에서 정성적인 방법으로 본 연구에서 제한한 4가지 모델과 기존의 단순 제품명 출현 모델을 통계적으로 검증한 결과, 본 연구에서 제시한 방법
특허 문서 내 타겟 제품 판별에 있어서,
• 특허 문서 내 타겟 제품을 판별하는 모델은, 제품-특허간 IPC 분포 유사도 추출하여 제품 특허간의 유사도를 기반으로 제품과 특허를 매칭함
• 개발된 모델을 기반으로 본 연구는 Basic 모형, Basic + Rep.claim 모형, Basic + sentence 모형, Basic + word 모형의 총 4가지 모형을 개발함
• 본 연구에서 정성적인 방법으로 본 연구에서 제한한 4가지 모델과 기존의 단순 제품명 출현 모델을 통계적으로 검증한 결과, 본 연구에서 제시한 방법과 ‘제목과 초록에 제품명 출현 시 해당 제품과 특허를 매칭 한다.’는 룰을 적용한 Basic + 1st sentece 모형이 가장 제품-특허 매칭을 우수하게 한 것으로 파악됨
기존의 기술을 추출하고 정의하는 방법 검증에 있어서,
• 기술-IPC 매트릭스를 구축하고, 기술별 빈도수가 높은 5개의 IPC들과 추출된 기술들 간의 정성적인 분석을 통해 기술 추출 결과의 정확도를 검증함
• 본 연구는 125개의 표본 데이터를 기반으로 본 연구에서 제시하는 모형을 적용하여 검증한 결과, 표본 125개중 92개의 기술이 적합하게 정의되었음을 확인하였으며, 이는 73.6%임
Abstract
▼
IV. Research results
○ This study, first of all, modified the TOD knowledge base developed in our previous research project, as the basis of the current research project.
• This study found that our existing TOD knowledge base has some limitations in the usability of patent data and processed
IV. Research results
○ This study, first of all, modified the TOD knowledge base developed in our previous research project, as the basis of the current research project.
• This study found that our existing TOD knowledge base has some limitations in the usability of patent data and processed data, so we renewed the existing scheme of the TOD knowledge base by adding new tables and relations.
• The occurrence information of product names in patent textual sections, in particular, is incorporated in the modified TOD knowledge base for the patent-product connection recognition model development.
○ Regarding developing the patent-product connection recognition algorithm,
• The research procedure consists of 1) extracting the occurrences of product names in patent textual sections, 2) identifying product-international patent classification (IPC) distribution vectors, 3) identifying patent-IPC distribution vectors, and 4) recognizing valid connections between patents and products by measuring the similarities between patent- and product-IPC distribution vectors.
• By the proposed procedure, this study established four patent-product connection recognition models: models “Basic”, “Basic + Rep.claim”,
“Basic + 1st sentence”,
“Basic + Nthword”.
• Compared to the existing models, or KISTIs’ simple occurrence-based model, our proposed models were overall found to show improved patent-product connection recognition performance, and model “Basic + 1st sentence” showed a dramatic improvement in detecting valid patent-product connections.
○ Regarding verifying the AO-based technology concept definition algorithm,
• The research procedure consists of 1) identifying an AO-IPC relationship matrix using main group-level IPC codes, 2) representing each technology as an array of IPC distribution vector and selecting its top five contributing IPC codes, 3) examining whether or not each AO-based technology can be well described by the composition of the five IPC codes.
• This study sampled a total of 125 technologies, and then examined that each AO-based technology is appropriately represented by the composition of its top five IPC codes through human manual analysis of sampled technologies.
• As a result of validity analysis, this research found that the AO-based technology concept definition algorithm showed the accuracy of 73.5%, that is, 92 proper AO-based technology representations among 125 technologies.
목차 Contents
- 표지 ... 1
- 제출문 ... 3
- 보고서 요약서 ... 5
- 요약문 ... 7
- Summary ... 11
- Contents ... 17
- 목차 ... 19
- 표목차 ... 21
- 그림목차 ... 23
- 수식목차 ... 25
- 제 1 장. 서론 ... 27
- 제 1 절. 연구의 배경 ... 27
- 제 2 절. 연구의 필요성 ... 28
- 제 3 절. 연구의 목표 및 내용 ... 35
- 제 2 장. 문헌연구 ... 37
- 제 1 절. KITSTI 기술기회발굴 시스템 ... 37
- 제 2 절 Patents classification system ... 42
- 제 3 절 Similarity measure ... 52
- 제 3 장. TOD kBase 개선 ... 57
- 제 1 절. 기존 TOD kBase ... 57
- 제 2 절. 개선된 TOD kBase ... 65
- 제 4 장. 특허-제품 매칭 모형 ... 70
- 제 1 절. 기존 특허-제품 매칭 모형 ... 70
- 제 2 절. 개선된 특허-제품 매칭 모형 로직 ... 71
- 제 3 절. 개선된 특허-제품 매칭 모형 ... 75
- 제 4 절. 개선된 특허-제품 매칭 모형 분석 결과 ... 77
- 제 5 장. 기술인지모형 검증 ... 104
- 제 1 절. 기존 기술인지 모형 ... 104
- 제 2 절. 기술 추출 정확도 검증 모형 ... 110
- 제 3 절. 기술 추출 정확도 검증 결과 ... 113
- 제 6 장. 결론 ... 118
- 제 1 절. 연구의 결과 ... 118
- 제 2 절. 연구의 한계점 및 추후과제 ... 121
- 참고 문헌 ... 123
- <참고 1> SObM모형의 정답 결과 ... 127
- <참고 2> threshold별 Basic, Basic+Rep.claim모형 결과 ... 134
- <참고 3> threshold별 Basic+1st sentence, N=5 모형 결과 ... 137
- <참고 4> BONE ANCHOR 검증 데이터 ... 140
- <참고 5> 기술과 관련성이 높은 상위 5개의 IPC 및 검증 결과 ... 143
- 끝페이지 ... 152
※ AI-Helper는 부적절한 답변을 할 수 있습니다.