$\require{mediawiki-texvc}$
  • 검색어에 아래의 연산자를 사용하시면 더 정확한 검색결과를 얻을 수 있습니다.
  • 검색연산자
검색연산자 기능 검색시 예
() 우선순위가 가장 높은 연산자 예1) (나노 (기계 | machine))
공백 두 개의 검색어(식)을 모두 포함하고 있는 문서 검색 예1) (나노 기계)
예2) 나노 장영실
| 두 개의 검색어(식) 중 하나 이상 포함하고 있는 문서 검색 예1) (줄기세포 | 면역)
예2) 줄기세포 | 장영실
! NOT 이후에 있는 검색어가 포함된 문서는 제외 예1) (황금 !백금)
예2) !image
* 검색어의 *란에 0개 이상의 임의의 문자가 포함된 문서 검색 예) semi*
"" 따옴표 내의 구문과 완전히 일치하는 문서만 검색 예) "Transform and Quantization"

논문 상세정보

온톨로지와 토픽모델링 기반 다차원 연계 지식맵 서비스 연구

A Study on Ontology and Topic Modeling-based Multi-dimensional Knowledge Map Services

초록

미래 핵심 가치 기술 발굴 및 탐색을 위해서는 범국가적인 국가R&D정보와 과학기술정보의 연계 융합이 필요하다. 본 논문에서는 국가R&D정보와 과학기술정보를 온톨로지와 토픽모델링을 사용하여 연계 융합하여 지식베이스를 구축한 방법론을 소개하고, 이를 기반으로 한 다차원 연계 지식맵 서비스를 소개한다. 국가R&D정보는 국가R&D과제와 참여인력, 해당 과제에 대한 성과 정보, 논문, 특허, 연구보고서 정보들을 포함한다. 과학기술정보는 논문, 특허, 동향 등의 과학기술연구에 대한 기술 문서를 일컫는다. 본 논문에서는 지식베이스에서의 지식 처리 및 관리의 효율성을 높이기 위해 Lightweight 온톨로지를 사용한다. Lightweight 온톨로지는 국가R&D과제 참여자와 성과정보, 과학기술정보를 과제-성과 관계, 문서-저자 관계, 저자-소속기관 관계 등의 단순한 연관관계를 이용하여 국가R&D정보와 과학기술정보를 융합한다. 이러한 단순한 연관관계만을 이용함으로써 지식 처리의 효율성을 높이고 온톨로지 구축 과정을 자동화한다. 보다 구체적인 Concept 레벨에서의 온톨로지 구축을 위해 토픽모델링을 활용한다. 토픽모델링을 활용하여 국가R&D정보와 과학기술정보 문서들의 토픽 주제어를 추출하고 각 문서 간 연관관계를 추출한다. 일반적인 Concept 레벨에서의 Fully-Specified 온톨로지를 구축하기 위해서는 거의 100% 수동으로 해야 하기 때문에, 많은 시간과 비용이 소모된다. 본 연구에서는 이러한 수동적인 온톨로지 구축이 아닌 자동화된 온톨로지 구축을 위해 토픽모델링을 활용한다. 토픽모델링을 활용하여 온톨로지 구축에 필요한 문서와 토픽 키워드 간의 관계, 문서 간 의미 상 연관관계를 자동으로 추출한다. 마지막으로, 이와 같이 구축된 지식베이스의 트리플(Triple) 정보를 활용하여, 연구자들의 공동저자관계, 문서간의 공통주제어관계 등을 연구자, 주제어, 기관, 저널 등의 다차원 연관관계를 방사형 네트워크 형식을 이용하여 시각화한 지식맵 서비스들을 소개한다.

Abstract

Knowledge map is widely used to represent knowledge in many domains. This paper presents a method of integrating the national R&D data and assists of users to navigate the integrated data via using a knowledge map service. The knowledge map service is built by using a lightweight ontology and a topic modeling method. The national R&D data is integrated with the research project as its center, i.e., the other R&D data such as research papers, patents, and reports are connected with the research project as its outputs. The lightweight ontology is used to represent the simple relationships between the integrated data such as project-outputs relationships, document-author relationships, and document-topic relationships. Knowledge map enables us to infer further relationships such as co-author and co-topic relationships. To extract the relationships between the integrated data, a Relational Data-to-Triples transformer is implemented. Also, a topic modeling approach is introduced to extract the document-topic relationships. A triple store is used to manage and process the ontology data while preserving the network characteristics of knowledge map service. Knowledge map can be divided into two types: one is a knowledge map used in the area of knowledge management to store, manage and process the organizations' data as knowledge, the other is a knowledge map for analyzing and representing knowledge extracted from the science & technology documents. This research focuses on the latter one. In this research, a knowledge map service is introduced for integrating the national R&D data obtained from National Digital Science Library (NDSL) and National Science & Technology Information Service (NTIS), which are two major repository and service of national R&D data servicing in Korea. A lightweight ontology is used to design and build a knowledge map. Using the lightweight ontology enables us to represent and process knowledge as a simple network and it fits in with the knowledge navigation and visualization characteristics of the knowledge map. The lightweight ontology is used to represent the entities and their relationships in the knowledge maps, and an ontology repository is created to store and process the ontology. In the ontologies, researchers are implicitly connected by the national R&D data as the author relationships and the performer relationships. A knowledge map for displaying researchers' network is created, and the researchers' network is created by the co-authoring relationships of the national R&D documents and the co-participation relationships of the national R&D projects. To sum up, a knowledge map-service system based on topic modeling and ontology is introduced for processing knowledge about the national R&D data such as research projects, papers, patent, project reports, and Global Trends Briefing (GTB) data. The system has goals 1) to integrate the national R&D data obtained from NDSL and NTIS, 2) to provide a semantic & topic based information search on the integrated data, and 3) to provide a knowledge map services based on the semantic analysis and knowledge processing. The S&T information such as research papers, research reports, patents and GTB are daily updated from NDSL, and the R&D projects information including their participants and output information are updated from the NTIS. The S&T information and the national R&D information are obtained and integrated to the integrated database. Knowledge base is constructed by transforming the relational data into triples referencing R&D ontology. In addition, a topic modeling method is employed to extract the relationships between the S&T documents and topic keyword/s representing the documents. The topic modeling approach enables us to extract the relationships and topic keyword/s based on the semantics, not based on the simple keyword/s. Lastly, we show an experiment on the construction of the integrated knowledge base using the lightweight ontology and topic mode

질의응답 

키워드에 따른 질의응답 제공
핵심어 질문 논문에서 추출한 답변
전통적인 지식 분류 체계
전통적인 지식 분류 체계의 문제점은?
맥락 (Context)에 따라 변할 수 있는 지식을 고정적으로만 분류한다는 데에 문제점이 있다.

기존의 지식 기반 시스템은 주로 카테고리 (Category)나 택사노미 (Taxonomy) 같은 전통적인 지식 분류 체계를 이용한다. 이러한 전통적인 지식 분류 체계는 맥락 (Context)에 따라 변할 수 있는 지식을 고정적으로만 분류한다는 데에 문제점이 있다. 반면, 지식맵은 지식을 네트워크 형태의 유연한 구조로 표현하기 때문에 다양한 맥락 상에서의 지식을 표현할 수 있다.

지식맵
지식맵의 두 개의 형태는 어떻게 분류되는가?
첫번째는 한 기업이나 기관의 데이터를 지식기반으로 저장/관리/처리 하는 일반적인 지식관리시스템 (Knowledge Management System) 에서 사용되는 형태이고, 두번째는 과학기술지식정보를 분석하고 표현하기 위해 사용된 형태이다.

지식맵은 일반적으로 두 개의 형태로 분류된다. 첫번째는 한 기업이나 기관의 데이터를 지식기반으로 저장/관리/처리 하는 일반적인 지식관리시스템 (Knowledge Management System) 에서 사용되는 형태이고, 두번째는 과학기술지식정보를 분석하고 표현하기 위해 사용된 형태이다. 지식관리시스템에서 사용되는 지식맵은 일반적으로 Business Process의 효율성을 높이기 위해 기업이나 기관의 내부 데이터나 프로세스를 표현하는 데 집중하는 반면(Businska et al.

지식맵
지식맵의 장점은?
지식을 네트워크 형태의 유연한 구조로 표현하기 때문에 다양한 맥락 상에서의 지식을 표현할 수 있다.

이러한 전통적인 지식 분류 체계는 맥락 (Context)에 따라 변할 수 있는 지식을 고정적으로만 분류한다는 데에 문제점이 있다. 반면, 지식맵은 지식을 네트워크 형태의 유연한 구조로 표현하기 때문에 다양한 맥락 상에서의 지식을 표현할 수 있다. 또한, 지식맵은 네트워크와 맵 형태로 지식을 표현할 수 있는 사용자 인터페이스 (User Interface) 또는 시각화 (Visualization)체계로 정의될 수 있다(Howard, 1989; McCagg and Dansereau, 1991; Eppler, 2001; Kang et al.

질의응답 정보가 도움이 되었나요?

저자의 다른 논문

참고문헌 (18)

  1. 1. Ahmad, M. N. and R. M. Colomb, "Managing ontologies: a comparative study of ontology servers," Proceedings of the eighteenth conference on Australasian database, Vol.63 (2007), 13-22. 
  2. 2. Blei, D. M., A. Y. Ng and M. I. Jordan, "Latent dirichlet allocation," The Journal of machine Learning research, Vol.3(2003), 993-1022. 
  3. 3. Blei, D. M., "Probabilistic topic models," Communications of the ACM, Vol.55, No.4(2012), 77-84. 
  4. 4. Brickley, D. and R. V. Guha, RDF Schema 1.1, W3C, 2014, Available at http://www.w3.org/TR/rdf-schema/ (Downloaded 14 December, 2015). 
  5. 5. Businska, L., I. Supulniece and M. Kirikova, "On data, information, and knowledge representation in business process models," Information Systems Development, Springer New York, 2013, 613-627. 
  6. 6. Eppler, M. J., "Making knowledge visible through intranet knowledge maps: concepts, elements, cases," Proceedings of the 34th Annual Hawaii International Conference on System Sciences, (2001), 9-18. 
  7. 7. Hofmann, T., "Probabilistic latent semantic indexing," Proceedings of the 22nd annual international ACM SIGIR conference on Research and development in information retrieval, (1999), 50-57. 
  8. 8. Howard, R. A., "Knowledge maps," Management science, Vol.35, No.8(1989), 903-922. 
  9. 9. Kang, I., Y. Park, and Y. Kim, "A framework for designing a workflow-based knowledge map," Business process management journal, Vol.9, No.3(2003), 281-294. 
  10. 10. Klavans, R. and K. W. Boyack, "Toward a consensus map of science," Journal of the American Society for information science and technology, Vol.60, No.3(2009), 455-476. 
  11. 11. Leydesdorff, L. and I. Rafols, "A global map of science based on the ISI subject categories," Journal of the American Society for Information Science and Technology, Vol.60, No.2(2009), 348-362. 
  12. 12. McCagg, E. C. and D. F. Dansereau, "A convergent paradigm for examining knowledge mapping as a learning strategy," The Journal of Educational Research, Vol.84, No.6(1991), 317-324. 
  13. 13. Morbach, J., A. Wiesner, and W. Marquardt, "OntoCAPE-A (re) usable ontology for computer-aided process engineering," Computers & Chemical Engineering, Vol.33, No.10 (2009), 1546-1556. 
  14. 14. W3C RDF Working Group, Resource Description Framework (RDF) 1.1, W3C, 2014, Available at http://www.w3.org/RDF/(Downloaded14 December,2015). 
  15. 15. Prud'hommeaux, E. and A. Seaborne, SPARQL Query Language for RDF, W3C, 2008, Available at http://www.w3.org/TR/rdfsparql-query/ (Downloaded 14 December, 2015). 
  16. 16. Rao, L., G. Mansingh and K. M. Osei-Bryson, "Building ontology based knowledge maps to assist business process re-engineering," Decision Support Systems, Vol.52, No.3(2012), 577-589. 
  17. 17. Salton, G. and M. J. Mcgill, Introduction to modern information retrieval, McGraw-Hill, New York, 1986. 
  18. 18. W3C OWL Working Group, OWL2 Web Ontology Language (Second Edition), W3C, 2012, Available at http://www.w3.org/TR/2012/RECowl2-overview-20121211/ (Downloaded 14 December, 2015). 

문의하기 

궁금한 사항이나 기타 의견이 있으시면 남겨주세요.

Q&A 등록

원문보기

원문 PDF 다운로드

  • ScienceON :
  • KCI :

원문 URL 링크

원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다. (원문복사서비스 안내 바로 가기)

DOI 인용 스타일

"" 핵심어 질의응답