* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
기법을 사용했다. 또한 추가적인 조치로서, 특정 IPC 항목들에 대해서는 몇 개의 산업분류 항목을 후보군으로 선정하고, 그 IPC 항목으로 분류되어 있는 특허 문서는 해당 후보군 내에서만 자동 분류가 실시되도록 함으로써, 전혀 관련성이 없는 산업분야로 분류되는 것과 같은 유형의 오류를 최소화하고자 하였다. 연계확률을 계산하기 위해 사용한 데이터는 2001년부터 2006 년까지 국내 특허와 실용신안 데이터를 합성하여 정리된 900, 604건의 출원정보였으며, [표 4]는 이렇게 작성된 연계표의 일부를 보여주고 있다.
이번 글에서는 이러한 문제를 해결하기 위해 지금까지 이루어진 다양한 노력들을 소개하고, 2008년에 특허청과 한국특허정보원이 작성한 특허와 산업분류 간의 연계표를 사용해 지난 20년 간 한국과 미국의 산업별 특허활동의 특징을 간략히 살펴보기로 한다.
제안 방법
이연 계표는 미국 특허청의 전문가들이 USPC의 분류 항목별 정 의와 SIC의 분류 항목별 정의를 상호 비교하여 양 분류체계의 분류 항목들을 직접 연결시키는 방식으로 작성되었다. 현재 이 연계표는 미국 특허청의 특허기술 동향조사팀(PTMT)이 관리하고 있으며, USPC의 개정내용을 반영하기 위해 보통 1년의 주기로 개정이 이루어지고 있다.
특허분류와 산업분류를 연계시키는 방법에 있어서는 개념적으로 YTC 및 OTC와 동일하게 IPC 항목들이 여 러 산업분류에 연결되는 확률을 계산함으로써, 두 분류 간의 연계 확률표를 작성하는 방식을 채택하였다. 그러나 YTC와 OTC는 과거 캐나다 특허청에서 개별 특허마다 부여한 산업분류 정보를 이용할 수 있었으나, 그 밖의 국가들에서는 이러한 작업을 한 사례가 없었으며, 이는 한국의 경우에도 마찬가지라는 점이 문제였다.
대상 데이터
또한 추가적인 조치로서, 특정 IPC 항목들에 대해서는 몇 개의 산업분류 항목을 후보군으로 선정하고, 그 IPC 항목으로 분류되어 있는 특허 문서는 해당 후보군 내에서만 자동 분류가 실시되도록 함으로써, 전혀 관련성이 없는 산업분야로 분류되는 것과 같은 유형의 오류를 최소화하고자 하였다. 연계확률을 계산하기 위해 사용한 데이터는 2001년부터 2006 년까지 국내 특허와 실용신안 데이터를 합성하여 정리된 900, 604건의 출원정보였으며, [표 4]는 이렇게 작성된 연계표의 일부를 보여주고 있다.
이론/모형
우선 연계표 작성을 위해 KSIC를 바탕으로 61개의 산업분류 항목을 선정하였다. 이 항목들을 선정하는 과정에서는 첫째, 연구자들이 특허 데이터와 함께 사용할 가능성이 높은 통계자료들의 분류기준과 가급적 유사해야 한다는 점, 둘째, 기술적 관점에서는 구분이 극히 어려운 산업분류항목들의 경우, 연구목적을 크게 해치지 않는 범위 내에서는 상위 항목으로 묶음으로써, 연계표 내에 존재할 수 있는 잠재적 인 오류를 가능한 줄여야 한다는 점에 주안점을 두었다.
이러한 문제를 해결하기 위한 방법으로 본 연계표 작성과정 에서는 자동문서 분류(Automatic Text Classification) 기법을 사용했다. 또한 추가적인 조치로서, 특정 IPC 항목들에 대해서는 몇 개의 산업분류 항목을 후보군으로 선정하고, 그 IPC 항목으로 분류되어 있는 특허 문서는 해당 후보군 내에서만 자동 분류가 실시되도록 함으로써, 전혀 관련성이 없는 산업분야로 분류되는 것과 같은 유형의 오류를 최소화하고자 하였다.
성능/효과
즉, 하나의 기술분류 항목이 여러 개의 생산물 분야에 관계되는 것으로 파악되는 경우, 해당 기술분류 항목은 각각의 생산물 분야에 모두 연결되어 있다. 그 결과, 일부 산업분야에서 왜곡된 통계 결과를 낳게 되는더L 일례로, 과거 일본의 항공산업이 걸음마 단계였을 때, 이 연계표를 이용해 나온 특허통계는 항공기 산업분야에서 일본의 급격한 성장을 나타내고 있었다. 이해되지 않는 이러한 결과는 엔진 기술에 대한 분류가 연계표 내에서 자동차와 항공기 분야 양쪽에 모두 연결되어 있었고, 실제로는 일본이 소유한 엔진과 관련된 대부분의 특허들이 자동차 엔진에 관한 것이었음에도 불구하고, 이들이 항공산업 분야의 성과로 나타난 데 원인이 있었다.
[그림 1]의 2008년 차트를 살펴보면. 반도체 제조업과 통신 및 방송장비 제조업 분야의 출원은 지속적으로 증가했음을 확인할 수 있다. 이에 비해, 자동차 제조업의 출원은 90 년대 중반에 비해 오히려 감소한 반면, 일반기계와 특수기계 제조업 분야의 출원은 증가했다.
후속연구
이러한 문제들을 해결하기 위한 근본적인 대책은 과거 캐나다 특허청이 했던 것과 마찬가지로 개별 특허마다 고유의 산업분류 정보를 부여하는 것이겠지만, 현재 발생되고 있는 특허출원량을 고려해 볼 때, 막대한 인력과 시간자원의 투입이 예상된다는 현실적인 어려움을 고려하지 않을 수 없을 것이다. 따라서, 이러한 주제에 대해서는 앞으로도 많은 연구들이 이루어져야 할 것으로 생각되며, 그 방향은 개별 특허에 대해 산업분류 정보를 보다 효율적으로 생성시키는 방법에 관한 것이 되어야 하지 않을까 조심스럽게 예상해 본다.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.