본고는 링크드데이터를 위한 도서관 분야의 온톨로지BIBFRAME 개발에 따라 국내에서 BIBFRAME 적용을 위한 구체적인 방안을 마련하는 것이다. 이를 위해 문헌연구, 사례조사, 설문조사를 실시하였고, 사례조사로 BIBFRAME을 개발한 미의회도서관과 BIBFRAME 프로젝트를 진행하는 LD4P를 분석하고, 설문조사에서는 국내 목록사서를 대상으로 링크드데이터 관련 용어의 이해도, 링크드데이터 구축을 위해 필요한 조건 등에 대해 조사하였다. 이를 바탕으로 국내에서 BIBFRAME을 도입하기 위한 적용방안을 다음과 같이 제시하였다. 첫째, 이름전거, 주제명 등의 기존 전거데이터를 링크드데이터로 출판하는 것뿐만 아니라 도서관에서 통제어휘로 사용하거나 데이터 값으로 사용하는 용어집도 링크드데이터로 생성해야 한다. 둘째, 국내에서 BIBFRAME의 적합성을 판단하고, 확장 모델링을 개발할 필요가 있으며, KORMARC과의 매핑 테이블 작성과 변환기 및 입력기의 시스템 개발도 요구된다. 셋째, BIBFRAME과 같은 링크드데이터 구축이 사서의 고유 업무가 될 수 있도록 사서를 대상으로 한 체계적인 교육프로그램이 개발되어야 한다. 따라서 본 연구는 국내에서 BIBFRAME 구축을 위한 실질적인 적용방안을 모색하였다는 점에서 그 의의가 있다.
본고는 링크드데이터를 위한 도서관 분야의 온톨로지 BIBFRAME 개발에 따라 국내에서 BIBFRAME 적용을 위한 구체적인 방안을 마련하는 것이다. 이를 위해 문헌연구, 사례조사, 설문조사를 실시하였고, 사례조사로 BIBFRAME을 개발한 미의회도서관과 BIBFRAME 프로젝트를 진행하는 LD4P를 분석하고, 설문조사에서는 국내 목록사서를 대상으로 링크드데이터 관련 용어의 이해도, 링크드데이터 구축을 위해 필요한 조건 등에 대해 조사하였다. 이를 바탕으로 국내에서 BIBFRAME을 도입하기 위한 적용방안을 다음과 같이 제시하였다. 첫째, 이름전거, 주제명 등의 기존 전거데이터를 링크드데이터로 출판하는 것뿐만 아니라 도서관에서 통제어휘로 사용하거나 데이터 값으로 사용하는 용어집도 링크드데이터로 생성해야 한다. 둘째, 국내에서 BIBFRAME의 적합성을 판단하고, 확장 모델링을 개발할 필요가 있으며, KORMARC과의 매핑 테이블 작성과 변환기 및 입력기의 시스템 개발도 요구된다. 셋째, BIBFRAME과 같은 링크드데이터 구축이 사서의 고유 업무가 될 수 있도록 사서를 대상으로 한 체계적인 교육프로그램이 개발되어야 한다. 따라서 본 연구는 국내에서 BIBFRAME 구축을 위한 실질적인 적용방안을 모색하였다는 점에서 그 의의가 있다.
This study is to suggest the concrete application plan of BIBFRAME under the development of BIBFRAME as library specific ontology for linked open data. The several research methods are used as the literature reviews, the case study of LC and LD4P, and the survey of cataloging librarians which is to ...
This study is to suggest the concrete application plan of BIBFRAME under the development of BIBFRAME as library specific ontology for linked open data. The several research methods are used as the literature reviews, the case study of LC and LD4P, and the survey of cataloging librarians which is to grasp understanding level of the linked data related terms and requirements for constructing LOD. The application plan is suggested as follows. First, publishing name authority data and subject heading in LOD are prominent as the startup with creating terms list or vocabulary in LOD that has been used in library for controlled vocabulary and data value. Second, it is needed to develop BIBFRAME application and extension modeling in Korea, to map KORMARC and the properties and classes of BIBFRAME, and to develop the editor and MARC to BIBFRAME Transformation Tools. Third, the systematical training for cataloging librarians is designed to regard BIBFRAME related works as the librarian's main field. Therefore, this study would contribute to seek the practical application plan for BIBFRAME in Korea.
This study is to suggest the concrete application plan of BIBFRAME under the development of BIBFRAME as library specific ontology for linked open data. The several research methods are used as the literature reviews, the case study of LC and LD4P, and the survey of cataloging librarians which is to grasp understanding level of the linked data related terms and requirements for constructing LOD. The application plan is suggested as follows. First, publishing name authority data and subject heading in LOD are prominent as the startup with creating terms list or vocabulary in LOD that has been used in library for controlled vocabulary and data value. Second, it is needed to develop BIBFRAME application and extension modeling in Korea, to map KORMARC and the properties and classes of BIBFRAME, and to develop the editor and MARC to BIBFRAME Transformation Tools. Third, the systematical training for cataloging librarians is designed to regard BIBFRAME related works as the librarian's main field. Therefore, this study would contribute to seek the practical application plan for BIBFRAME in Korea.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
0을 2016년 발표하였다. BIBFRAME 2.0의 발표와 함께 시작한 파일럿 테스트의 목표는 MARC를 참조하지 않고 BIBFRAME으로 데이터를 생성하는 환경을 구축하는 것으로 우선 전체 MARC데이터를 BIBFRAME으로 변환하고, 이후 BIBFRAME으로 데이터를 생성하는 것이다. MARC를BIBFRAME 온톨로지로 변환하기 위해 변환 프로그램을 다시 작성하되 변환에 따른 데이터 손실이 없도록 상세한 변환 명세서가 마련되었고, 변환시 데이터 변환뿐만 아니라 데이터에 해당하는 URI도 제공되었다.
0 환경에서 Network Development and MARC Standards Office와 Acquisitions and Bibliographic Access Directorate Divisions(이하, ABA)의 Cooperative and Instructional Programs Division(이하, COIN)은 2015년 9월 8일부터 2016년 3월 31일까지 테스트를진행하였다. 목표는 BIBFRAME 입력기로 단행본, 연속간행물, 지도자료, 음악악보, 녹음자료, 동영상, 화상자료 등의 다양한 포맷과 언어 자료를 BIBFRAME에 맞게 기술하는 것이었다. ABA내 Collections and Services Special Format Divisions 부서에서 약 40명 목록사서 및 테크니션이 참여해 여러 다양한 언어/문자, 포맷의 자료를 목록 하였다.
설문조사에서는 국내 목록사서를 대상으로 링크드 데이터 관련 용어의 이해도, 링크드데이터 구축을 위해 필요한 조건 등에 대해 조사하였다. 본 연구는 BFRAME의 구축 사례를 분석하여 국내에서 BIBFRAME 구축을 위한 실질적인 적용방안을 구체적으로 모색하였다는 점에서 그 의의가 있다.
미의회도서관은 도서관 자료의 링크드데이터 변환을 위해 도서관을 위한 특화된 온톨로지 BIBFRAME을 개발하고, LC의 전체 서지레코드를 링크드데이터로 변환하는 테스트를 완료하였고, 독일국가도서관도 BIBFRAME을 이용해 링크드데이터를 구축하고 있어 링크드데이터를 위한 도서관 온톨로지로 BIBFRAME의 영향력이 매우 클 것으로 판단된다. 이에 본고에서는 BIBFRAME 구축을 위한 국내 도서관의 구체적인 적용방안을 마련하고자 문헌연구, 사례조사, 설문조사를 실시하였다. 문헌연구를 통해 국외 도서관에서 링크드데이터 구축 및 실행과정을 살펴보고, 사례조사에서는 BIBFRAME을 구축한 미의회도서관과 LD4P 프로젝트를 분석하였다.
이에 본고에서는 BIBFRAME의 국내 적용을 위한 방안을 마련하고자 문헌연구, 사례조사, 설문조사를 실시하였다. 문헌연구와 사례조사를 통해 국외 도서관에서 링크드데이터 구축 및실행과정을 살펴보았다.
제안 방법
bibliotek-o는 BIBFRAME 온톨로지에 기반한 서지 메타데이터 모델링을 위한 프레임워크로 BIBFRAME의 대안 모델로 제안되었다. 2014에 진행된 LD4L 프로젝트에서 BIBFRAME 1.0이 도서관 자원을 기술하는데 충분하지 않다고 분석하고, 임시 온톨로지를 개발하였다. 2016년 LD4P가 시작되면서 LD4 온톨로지 그룹에서는 BIBFRAME 2.
6개 참여 도서관별로 프로젝트의 내용을 달성하기 위해 온톨로지 모델링, 메타데이터 생성, 특화된 영역별 온톨로지 모델링과 메타데이터 생성이라는 3가지 영역으로 나누어 연구를 진행한다( 참조).
LC의 Network Development and MARC Standards Office(NDMSO)에서 BIBFRAME 구현을 위한 프로그램으로 서지레코드를 BIBFRAME으로 변환하는 MARCXML to BIBFRAME Transformation(이하, BIBFRAME 변환기), BIBFRAME 형식에 맞게 입력하는 BIBFRAME Editor(이하, BIBFRAME 입력기)를 개발하였다. BIBFRAME 변환기는 MARCXML 서지레코드를 BIBFRAME으로 변환하고, BIBFRAME 입력기는 단행본, 악보, 연속간행물, 지도, 녹음자료, 동영상(블루레이 DVD), 동영상(35mm 필름), 화상자료의 8개 자료유형별 프로파일에 따라 입력한다.
LC에서 링크드데이터 구축의 첫 단계로 LDS라는 통제어휘집을 링크드데이터로 제작하고, 서지레코드를 링크드데이터로 변환하기 위한 온톨로지로 BIBFRAME을 개발하였다. 이를 바탕으로 서지레코드를 링크데이터로 변환할 수 있는 BIBFRAME 변환기와 입력기를 개발하였으며, 목록사서 교육과 함께 파일럿 테스트를 진행하였다.
LC의 Network Development and MARC Standards Office(NDMSO)에서 BIBFRAME 구현을 위한 프로그램으로 서지레코드를 BIBFRAME으로 변환하는 MARCXML to BIBFRAME Transformation(이하, BIBFRAME 변환기), BIBFRAME 형식에 맞게 입력하는 BIBFRAME Editor(이하, BIBFRAME 입력기)를 개발하였다. BIBFRAME 변환기는 MARCXML 서지레코드를 BIBFRAME으로 변환하고, BIBFRAME 입력기는 단행본, 악보, 연속간행물, 지도, 녹음자료, 동영상(블루레이 DVD), 동영상(35mm 필름), 화상자료의 8개 자료유형별 프로파일에 따라 입력한다.
특히, 벤더가 제공하는 카피목록과 원목 업무과정을 분석하고, 벤더제공 레코드의 링크드데이터로 변환시 업무과정을 제시하였다. RDF 이용을 위해 업무에 기반한 검색 환경의 요건을 마련하고, 원목을 위한 BIBFRAME 프로파일을 평가하였다. BIBFRAME 변환을 향상시키기 위해 벤더 제공 MARC 데이터를 개선하는 방안에 대해 벤더와 논의 중이다.
BIBFRAME 변환을 향상시키기 위해 벤더 제공 MARC 데이터를 개선하는 방안에 대해 벤더와 논의 중이다. Tracer Bullet 1에서는 LC의 변환프로그램을 이용해 MARC 레코드 38,000개를 BIBFRAME으로 변환하고, Blazegraph 그래프로 트리플로 표현하였으며, 자동 스크립트를 통해 Blacklight solr1) 환경에서 색인을 작성하였다. Tracer Bullet 2에서는 BIBFRAME 2.
이에 미의회도서관은 2008년 보고서 On the Record 이후 서지프레임워크 변환 프로젝트를 구성하여 FRBR, RDA와 같은 개체-관계 모델의 이용을 권고하고, MARC를대체할 BIBFRAME을 2012년 개발하였다. 도서관 표준 전문가들은 RDF 인코딩을 위한 모델을 개발하고, OMR(Open Metadata Registry, 이하 OMR)과 같이 웹기반 온톨로지와 어휘집 저장소를생성하고, 도서관과 다른 문화유산기관에서 운영하는 비전통적인 자원의 웹친화적 모델을 구축하였다. 이에 LCSH, VIAF, FAST와같은 도서관의 전거데이터는 새로운 아키텍쳐에 맞게 재구조화되었다(Codby, Wang, and Mixter 2015, 12-13).
링크드데이터 변환 및 생성프로그램의 요건을 조사하고, 와 같이 관련 프로그램의 테스트를 실시하였다.
링크드데이터와 MARC 데이터가 혼용된 상태에서 인스턴스 기반의 검색 환경을 개발하고, 도서 자료를 대상으로 BIBFRAME 2.0에서 solr로 매핑을 작성하였다. 현재, 디지털자원을 RDF에서 solr로 변환하는 매핑 프로그램을 개발하였고, BIBFRAME 2.
이에 본고에서는 BIBFRAME 구축을 위한 국내 도서관의 구체적인 적용방안을 마련하고자 문헌연구, 사례조사, 설문조사를 실시하였다. 문헌연구를 통해 국외 도서관에서 링크드데이터 구축 및 실행과정을 살펴보고, 사례조사에서는 BIBFRAME을 구축한 미의회도서관과 LD4P 프로젝트를 분석하였다. 이를 바탕으로 국내에서 BIBFRAME을 도입하기 위한 적용방안을 다음과 같이 3가지로 제시하였다.
이에 본고에서는 BIBFRAME의 국내 적용을 위한 방안을 마련하고자 문헌연구, 사례조사, 설문조사를 실시하였다. 문헌연구와 사례조사를 통해 국외 도서관에서 링크드데이터 구축 및실행과정을 살펴보았다. 사례조사로 BIBFRAME을 개발한 미의회도서관과 BIBFRAME 프로젝트를 진행하는 LD4P를분석하였다.
서지레코드를 링크드데이터로 변환하기 위해 도서관 도메인에 특화된 온톨로지를 개발해야 한다. 미의회도서관에서 도서관 서지레코드를 위한 온톨로지로 BIBFRAME을 개발하였고, 전거통제를 위한 온톨로지로 MADSRDF를사용하였다. OCLC에서는 온톨로지로 Schema.
미의회도서관은 링크드데이터 구축을 위해서 링크할 자원의 필요성을 인식하고, BIBFRAME 개발 이전에 기존 도서관이 구축한 이름전거, 주제명, 장소 등의 어휘집을 링크드데이터로 변환하기로 결정하였다. 2012년 URI를포함하는 전거 및 통제어휘 리스트를MADSRDF 표준을 사용하여 RDF로 변환하고, 이를 LDS라고 명명하였다.
BIBFRAME 관련 도구로 LC BIBFRAME 입력기 및 변환기, 검색도구 SHARE Virtual Discovery Environment, 기타 도구로 ALIADA, CEDAR, KARMA, RML Editor, VitroLib, Tableau의 다양한 변환기, 편집기, 검색기 등이 있다. 뿐만 아니라 MARC-to-RDF 변환기를 위한 요건을 개발하였으며, LC의 BIBFRAME 2.0 입력기를 이용해 인스턴스를 생성하였다.
문헌연구와 사례조사를 통해 국외 도서관에서 링크드데이터 구축 및실행과정을 살펴보았다. 사례조사로 BIBFRAME을 개발한 미의회도서관과 BIBFRAME 프로젝트를 진행하는 LD4P를분석하였다. 설문조사에서는 국내 목록사서를 대상으로 링크드 데이터 관련 용어의 이해도, 링크드데이터 구축을 위해 필요한 조건 등에 대해 조사하였다.
ABA내 Collections and Services Special Format Divisions 부서에서 약 40명 목록사서 및 테크니션이 참여해 여러 다양한 언어/문자, 포맷의 자료를 목록 하였다. 사서들은 Voyager ILS 시스템을 통해 MARC 포맷과 BIBFRAME 입력기를 통해 BIBFRAME의 2가지로 데이터를 입력하면서 MARC와 BIBFRAME 데이터를 상호 비교하고, 데이터 간의 상호 연계성을 파악하였다. 사서들이 MARC 레코드를 작성하면서 동시에 BIBFRAME 데이터를 작성하였기 때문에 업무과정에서의 변경은 없었다(Library of Congress.
사례조사로 BIBFRAME을 개발한 미의회도서관과 BIBFRAME 프로젝트를 진행하는 LD4P를분석하였다. 설문조사에서는 국내 목록사서를 대상으로 링크드 데이터 관련 용어의 이해도, 링크드데이터 구축을 위해 필요한 조건 등에 대해 조사하였다. 본 연구는 BFRAME의 구축 사례를 분석하여 국내에서 BIBFRAME 구축을 위한 실질적인 적용방안을 구체적으로 모색하였다는 점에서 그 의의가 있다.
둘째, 외부 데이터 소스에서 재사용할 수 있도록 용어를 폭넓게 정의한다. 셋째, 도메인과 범위와 같은 OWL, RDF의 규칙을 이용하여 온톨로지와 데이터를 과도하게 제한하지 않고 표현성을 제공한다. 넷째, 객체 속성, 구조화된 데이터, 비구조화된 문자값 보다 통제어휘를 선호한다.
국내 도서관의 링크드데이터 구축은 2013년 국립중앙도서관, KERIS, KISTI을 중심으로 공공부문에서 시작하였다. 이들은 표준 온톨로지를 개발하는 대신 BIBO, DC와 같은 기존 온톨로지를 재사용하여 서지데이터를 링크드데이터로 변환하였고, 이러한 재사용 온톨로지에는 도서관 특성이 반영된 요소들이 포함되지 않아 자체적으로 별도의 온톨로지를 추가 개발하였다. 그러므로, 국내에서 도서관 링크드데이터의 체계적인 모델링과 완전한 상호운용성을 위해 도서관 특화된 표준 온톨로지로 BIBFRAME의 적용방안을 모색해야 한다.
LC에서 링크드데이터 구축의 첫 단계로 LDS라는 통제어휘집을 링크드데이터로 제작하고, 서지레코드를 링크드데이터로 변환하기 위한 온톨로지로 BIBFRAME을 개발하였다. 이를 바탕으로 서지레코드를 링크데이터로 변환할 수 있는 BIBFRAME 변환기와 입력기를 개발하였으며, 목록사서 교육과 함께 파일럿 테스트를 진행하였다. 코넬에서는 BIBFRAME 확장의 필요성에 따라 bibliotek-o라는 온톨로지를 개발하고, 별도의 입력기와 변환기를 개발하였다.
특히, 원목, 카피목록, 자원의 디포짓, 컬렉션 자원의 디포짓 4가지 측면에서 업무과정의 변화를 제시한다. 이를 통해 링크드데이터 생성을 위한 생성 워크플로우를 제시하고, 링크드데이터의 변환과 원목을 위한 도구를 제안하며, 링크드데이터 변환 전후 개선을 위한 최선의 방안을 검토하고, 자원을 링크드데이터로 기술한다.
LD4 그룹에서는 저작관련 활동과 인스턴스 관련 활동 간의 구분이 완전하게 지속되지 않는 다는 것을 인식하고, 이러한 구분이 불필요하며 과도하게 복잡한 결과를 낳을 수 있다고 판단하였다. 이에 활동패턴을 정의하고 이는 에이전트와 저작, 인스턴스, 아이템을 링크하는 bib:Activity 클래스의 하위클래스 bib:AuthorActivity, bib:PublisherActivity 등으로 명확히 역할에 대해 규정하고 공급활동과 창작활동의 구분을 삭제하였다. 이를 통해 활동 관계는 이벤트와 같이 자원의 다른 유형으로 확장이 가능하게 되었다(Kovari, Folsom, and Younes 2017, 55).
교육내용은 시맨틱웹, 링크드데이터, BIBFRAME 입력기로 구성되었다. 주 단위 회의를 통해 참가 사서, 교육자, 개발자가 상호 의견을 교류하고 최선의 방안을 모색하였다. 사서는 경험을 바탕으로 BIBFRAME에 관련된 다양한 제안을 하였으며, 이러한 제안은 즉시 프로그램 개발에 적용되었다(Library of Congress.
2016-2018년 프로젝트의 주요 내용은 첫째, 링크드오픈데이터(LOD)로 메타데이터를 공동으로 생성하기 위한 표준, 가이드라인, 인프라를 개발하고, 둘째, 정보조직부서의 데이터 생성 환경 속에서 링크드데이터 생성을 위한 업무흐름도 개발하며, 셋째, 특정 도메인과 포맷의 도서관 자원을 기술하기 위한 BIBFRAME 온톨로지의 확장 방안을 마련하고, 넷째, 도서관 커뮤니티의 지속가능하고 확장 가능한 환경을 마련하는 것이다. 참여 도서관은 도서관 링크드데이터를 위한 온톨로지로 BIBFRAME을 사용하고, 이를 확장하는 방안을 각 특화된 도메인별로 연구하며, 메타데이터 생성한다. 또한, BIBFRAME 확장 모델링, 온톨로지 확장 모델링과 링크드데이터 생성을 위한 최선의 구축 사례, 링크드데이터 도구 평가, 링크드데이터 협력 생성을 위한 인프라 구조 프로토타입 개발을 공동으로 진행하고 있다(LD4P 2018).
bibliotek-o 프레임워크의 핵심은 BIBFRAME이고, BIBFRAME 기반 위에 구축되며, BIBFRAME 패턴 없이 실행될 수 없지만, bibliotek-o 온톨로지는 모델링 원칙과 패턴에서 BIBFRAME과 다음의 차이가 있다. 첫째, 데이터 교환과 상호운용성을 위해 기존 외부 어휘를 재사용한다. 예를들어, bf:suject를사용하기 보다는 이미 정의된 dcterms:subject를사 용한다.
특히, 벤더가 제공하는 카피목록과 원목 업무과정을 분석하고, 벤더제공 레코드의 링크드데이터로 변환시 업무과정을 제시하였다. RDF 이용을 위해 업무에 기반한 검색 환경의 요건을 마련하고, 원목을 위한 BIBFRAME 프로파일을 평가하였다.
따라서 핵심은 링크데이터 생성과정을 순서대로 제시하면서 링크드데이터 생성에 따른 업무과정상의 변화를 파악하기 위해 모든 업무 내용을 추적한다. 특히, 원목, 카피목록, 자원의 디포짓, 컬렉션 자원의 디포짓 4가지 측면에서 업무과정의 변화를 제시한다. 이를 통해 링크드데이터 생성을 위한 생성 워크플로우를 제시하고, 링크드데이터의 변환과 원목을 위한 도구를 제안하며, 링크드데이터 변환 전후 개선을 위한 최선의 방안을 검토하고, 자원을 링크드데이터로 기술한다.
대상 데이터
목표는 BIBFRAME 입력기로 단행본, 연속간행물, 지도자료, 음악악보, 녹음자료, 동영상, 화상자료 등의 다양한 포맷과 언어 자료를 BIBFRAME에 맞게 기술하는 것이었다. ABA내 Collections and Services Special Format Divisions 부서에서 약 40명 목록사서 및 테크니션이 참여해 여러 다양한 언어/문자, 포맷의 자료를 목록 하였다. 사서들은 Voyager ILS 시스템을 통해 MARC 포맷과 BIBFRAME 입력기를 통해 BIBFRAME의 2가지로 데이터를 입력하면서 MARC와 BIBFRAME 데이터를 상호 비교하고, 데이터 간의 상호 연계성을 파악하였다.
BIBFRAME 1.0 환경에서 Network Development and MARC Standards Office와 Acquisitions and Bibliographic Access Directorate Divisions(이하, ABA)의 Cooperative and Instructional Programs Division(이하, COIN)은 2015년 9월 8일부터 2016년 3월 31일까지 테스트를진행하였다. 목표는 BIBFRAME 입력기로 단행본, 연속간행물, 지도자료, 음악악보, 녹음자료, 동영상, 화상자료 등의 다양한 포맷과 언어 자료를 BIBFRAME에 맞게 기술하는 것이었다.
미의회도서관에서 도서관 서지레코드를 위한 온톨로지로 BIBFRAME을 개발하였고, 전거통제를 위한 온톨로지로 MADSRDF를사용하였다. OCLC에서는 온톨로지로 Schema.org, OWL, SKOS 등의 일반적 스키마를 사용하였다. 특히, LOV(Linked Open Vocabularies), OMR(Open Metadata Registry)에는 여러 다양한 메타데이터 온톨로지를 제공하고 있어 검색을 통해 원하는 온톨로지를 찾을 수 있다.
구축할 어휘집의 종류를 파악하기 위해 링크드데이터를 구축한 기관들이 사용한 어휘집을 조사한 결과 LD4L에서는 OCLC Fast, OCLC Works, Worldcat, ORCID, VIAF, LoC Subject Authority, LoC Name Authority, AGROVOC를사용하였다. Smith-yoshimura (2016a)에 따르면 현재 링크드데이터 출판(publishing)시 가장 많이 사용되는 어휘집은 Europeana, Getty vocabularies, LC의 LDS, 일본국회도서관 NDL 순이며, 이외에도 OCLC WorldCat, VIAF, ISNI 데이터가 주로 이용되었다.
링크드데이터에 대한 국내 사서들의 링크드데이터 인식정도를 파악하기 위해 국립중앙도 서관 목록교육에 참여한 33명의 사서를 대상으로 관련 용어 설문조사를 실시하였다.
LD4P는 Linked Data for Libraries라는 이전 멜론재단 기금을 받는 프로젝트가 확장된 것으로 도서관 자원의 링크드데이터 생성을 목표로 한다. 미의회도서관과 컬럼비아, 코넬, 하버드, 프린스턴, 스탠포드의 5개 대학교 도서관이 참여하였다. 2016-2018년 프로젝트의 주요 내용은 첫째, 링크드오픈데이터(LOD)로 메타데이터를 공동으로 생성하기 위한 표준, 가이드라인, 인프라를 개발하고, 둘째, 정보조직부서의 데이터 생성 환경 속에서 링크드데이터 생성을 위한 업무흐름도 개발하며, 셋째, 특정 도메인과 포맷의 도서관 자원을 기술하기 위한 BIBFRAME 온톨로지의 확장 방안을 마련하고, 넷째, 도서관 커뮤니티의 지속가능하고 확장 가능한 환경을 마련하는 것이다.
이론/모형
어휘집 구축 이후 도서관 특화된 온톨로지로 BIBFRAME을 2012년 개발하였는데, 이는 저작, 인스턴스 등의 서지 관련 개체를 표현하기 위해 개발된 클래스와 속성을 이용하여 RDF에기반을 둔 그래프기반 데이터모델이다. 서지기술을 명확한 트리플 문장으로 해체하고, 텍스트나 문자 값 대신 LDS의 URI 사용하며, 내용규칙으로 RDA를이용한다(McCallum 2017). BIBFRAME 온톨로지는 2016년 BIBFRAME 2.
성능/효과
셋째, 도메인과 범위와 같은 OWL, RDF의 규칙을 이용하여 온톨로지와 데이터를 과도하게 제한하지 않고 표현성을 제공한다. 넷째, 객체 속성, 구조화된 데이터, 비구조화된 문자값 보다 통제어휘를 선호한다. 다섯째, 데이터를 표현할 수 있는 단순하고 통일된 모델을 선호하며, 질의 경로(query path)를 최소화하기 위해 관계나 속성을 표현하는데 하나의 방법을 채택한다.
링크드데이터 관련 용어 3개(시맨틱웹, RDF, URI), 온톨로지 5개(BIBFRAME, SCHEMA.ORG, SKOS, OWL, SPARQL), 목록관련 최신용어 3개(FRBR, RDA, MADSRDF)에 대해 이해 정도를 5점 라이커트 척도로 표시하도록 한 결과 전반적으로 링크드데이터 관련 용어에 익숙하지 않은 것으로 나타났다( 참조).
링크드데이터 구축하는 6개 주요 기관 VIAF, LC, FAST, WorldCat, BNF, DNB에서 사용하는 어휘집을 분석한 결과 와 같이 VIAF, LDS를가장 많이 사용하는 것으로 나타났다.
미의회도서관은 도서관 자료의 링크드데이터 변환을 위해 도서관을 위한 특화된 온톨로지 BIBFRAME을 개발하고, LC의 전체 서지레코드를 링크드데이터로 변환하는 테스트를 완료하였고, 독일국가도서관도 BIBFRAME을 이용해 링크드데이터를 구축하고 있어 링크드데이터를 위한 도서관 온톨로지로 BIBFRAME의 영향력이 매우 클 것으로 판단된다. 이에 본고에서는 BIBFRAME 구축을 위한 국내 도서관의 구체적인 적용방안을 마련하고자 문헌연구, 사례조사, 설문조사를 실시하였다.
지금까지 살펴본 사례를 종합하면, 링크드데이터 구축을 위해 어휘집의 링크드데이터 변환, 온톨로지 개발 및 적절한 온톨로지 선택, 시스템 개발, 실재 데이터 입력의 과정이 있었다.
후속연구
링크드데이터 구축을 통해 한 분야에서 구축된 정보는 다른 분야에서 재사용이 가능하므로 특히 데이터 구축이 중복적인 도서관 및 박물관과 같은 기관에서 링크드데이터의 활용가능성이 매우 크다. 도서관에서 구축해온 서지데이터와 전거데이터를링크드데이터에 맞게 변환하여 제공한 다면 여러 분야에서 활용이 가능하고, 타 분야의 링크드데이터를 도서관에서도 활용할 수 있을 것이다.
둘째, 국내에서 BIBFRAME의 적합성을 판단하고, 확장 모델링을 개발할 필요가 있으며, 이에 맞는 데이터 구축을 위해 KORMARC과의 매핑 테이블 작성과 변환기 및 입력기 등의 시스템 개발도 요구된다.
org, SKOS, FOAF 등은 도서관 이외의 타 분야에서 주로 개발된 온톨로지로 도서관 특화된 데이터를 기술하는데 한계가 있다. 반면, BIBFRAME은 도서관 특화된 온톨로지로 도서관에서 필요한 데이터를 기술하도록 MARC를모두 수용하고 있어 앞으로 도서관 분야에서 널리 사용될 것이다.
0 Editor로 50개 자원의 원목을 작성하고, Tracer Bullet 3에서는 CEDAR RDF Editor로 디지털 자원 30개 이상의 원목을 작성할 것이다. 뿐만 아니라 MARC 레코드를 BIBFRAME으로 변환하고, 색인 처리를 위한 자동화 방안을 모색할 것이다.
셋째, BIBFRAME과 같은 링크드데이터 구축이 사서의 고유한 업무가 될 수 있도록 사서를 대상으로 한 체계적인 링크드데이터 교육 프로그램이 개발되어야 한다.
앞으로 링크드데이터가 사서의 고유업무가 되기 위해서는 사서를 대상으로 한 링크드데이터 교육이 체계적으로 개발되어야 한다. 이는 학계를 포함하여 재교육 기관에서 링크드데이터 교육이 상호 연계되어 체계적으로 이루어져야 한다.
이러한 사례를 바탕으로 국내에서 BIBFRAME 적용방안을 모색한다면 먼저, 링크드데이터 구축의 전제조건인 어휘집 구축, BIBFRAME 온톨로지 적용 및 시스템 개발, 마지막으로 이를 실질적으로 구축하기 위해 목록사서의 교육 측면으로 나누어 살펴볼 수 있을 것이다.
또한, 전거, 용어집과 같은 자원이 필요한데 이를 위해서는 도서관의 기본에 충실한 데이터 구축이 필요하다(이미화 2017, 124). 이러한 온톨로지 실험, 데이터 구축 및 변환을 통해 국내에서도 실질적인 링크드데이터 구축이 가능할 것이다.
링크드데이터 생성시 장애요인으로 데이터를 표현하는데 적절한 온톨로지의 선택, 시스템구축에 관한 문헌이나 권고의 부재, 도구의 부족, 소프트웨어의 문제 등(Smith-yoshimura 2016a)이 지적되었는데 이는 링크드데이터 구축을 위해 해결되어야 할 주요 문제들이다. 특히, 링크드데이터 구축을 위해서는 실질적인 시스템 개발 이전에 적절한 온톨로지를 선택해야 하며, 이를 위해서는 국내에서 BIBFRAME의 적용가능성을 타진하는 다양한 실험연구들이 진행될 필요가 있다. 또한, 전거, 용어집과 같은 자원이 필요한데 이를 위해서는 도서관의 기본에 충실한 데이터 구축이 필요하다(이미화 2017, 124).
그러므로 국내에서 BIBFRAME을 구축하기 위한 첫 단계는 이름전거, 주제명 등 기존 전거데이터를 링크드데이터로 생성하는 것이다. 현재, 국립중앙도서관에서 구축한 링크드데이터를 활용할 수 있으며, 앞으로 국내 대학에서 구축해온 전거데이터에 대한 공개를 바탕으로 링크드데이터로 구축한다면 이를 공유할 수 있을 것이다. 국내에서 전거데이터의 통합구축시 에는 VIAF와 같은 모델이 가장 적합한 형태이며, 이를 통해 개별 도서관에서는 링크드데이터 형태로 전거를 구축할 수 있을 것이다.
질의응답
핵심어
질문
논문에서 추출한 답변
링크드데이터란?
링크드데이터는 상호 연결된 웹을 지향하는 모형으로, URI와 RDF의 트리플 구문을 이용하여 데이터를 구조화하여 기술함으로 정보의 배포와 접근을 향상시킬 수 있다. 링크드데이터 구축을 통해 한 분야에서 구축된 정보는 다른 분야에서 재사용이 가능하므로 특히 데이터 구축이 중복적인 도서관 및 박물관과 같은 기관에서 링크드데이터의 활용가능성이 매우 크다.
도서관 및 박물관과 같은 기관에서 링크드데이터의 활용가능성이 매우 큰 이유는?
링크드데이터는 상호 연결된 웹을 지향하는 모형으로, URI와 RDF의 트리플 구문을 이용하여 데이터를 구조화하여 기술함으로 정보의 배포와 접근을 향상시킬 수 있다. 링크드데이터 구축을 통해 한 분야에서 구축된 정보는 다른 분야에서 재사용이 가능하므로 특히 데이터 구축이 중복적인 도서관 및 박물관과 같은 기관에서 링크드데이터의 활용가능성이 매우 크다. 도서관에서 구축해온 서지데이터와 전거데이터를링크드데이터에 맞게 변환하여 제공한 다면 여러 분야에서 활용이 가능하고, 타 분야의 링크드데이터를 도서관에서도 활용할 수 있을 것이다.
국내에서 BIBFRAME을 도입하기 위한 적용방안으로 제시한 것은?
이를 바탕으로 국내에서 BIBFRAME을 도입하기 위한 적용방안을 다음과 같이 제시하였다. 첫째, 이름전거, 주제명 등의 기존 전거데이터를 링크드데이터로 출판하는 것뿐만 아니라 도서관에서 통제어휘로 사용하거나 데이터 값으로 사용하는 용어집도 링크드데이터로 생성해야 한다. 둘째, 국내에서 BIBFRAME의 적합성을 판단하고, 확장 모델링을 개발할 필요가 있으며, KORMARC과의 매핑 테이블 작성과 변환기 및 입력기의 시스템 개발도 요구된다. 셋째, BIBFRAME과 같은 링크드데이터 구축이 사서의 고유 업무가 될 수 있도록 사서를 대상으로 한 체계적인 교육프로그램이 개발되어야 한다. 따라서 본 연구는 국내에서 BIBFRAME 구축을 위한 실질적인 적용방안을 모색하였다는 점에서 그 의의가 있다.
참고문헌 (19)
Lee, Mihwa. 2017. A Study on the Considerations in Constructing BIBFRAME by " Analyzing BIBFRAME 2.0." Journal of Korean Library and Information Science Society, 48(4): 107-127.
NIA. 2014. Linked Open Data Construction Casebook in Korea. Seoul: NIA.
Carlton, T., L. Hawkins and P. Frank. 2017. Module2: The BIBFRAME Editor and the BIBFRAME Linked Data Store. [cited 2018. 1. 15].
Cornell University Library. 2017. bibliotek-o : An Overview. [cited 2018. 1. 15].
Coyle, K. 2010. Metadata Models of the World Wide Web. "Library Technology Reports, 48(4): 12-19.
Coyle, K. 2012a. Semantic Web and Linked Data. "Library Technology Reports, 48(4): 10-14.
Coyle, K. 2012b. Metadata Elements. "Library Technology Reports, 48(4): 15-26.
Godby, C. J., S. Wang and J. K. Mixter. 2015. Library Linked Data in the Cloud. California: Morgan and Claypool.
Huerga, I. and M. P. Lauruhn. 2016. Linked Data Implications for Authority Control and " Vocabularies." In Linked Data for Cultural Heritage. Chicago: ALA.
Kovari, J., S. Folsom and R. Younes. 2017. Towards a BIBFRAME Implementation: the bibliotek-o. [cited 2018. 1. 15].
LD4L Labs and LD4P Ontology Group. 2017. Bibliotek-o: a BIBFRAME Ontology Extension. [cited 2018. 1. 15].
LD4P. 2018. Linked Data for Production. [cited 2018. 1. 15].
Library of Congress. Acquisitions and Bibliographic Access Directorate. 2016. BIBFRA ME Pilot Phase One: Report and Assessment. [cited 2018. 1. 15].
Lovins, D. and D. Hillmann. 2017. Broken-world Vocabularies. "D-Lib Magazine, 23(3/4). [cited 2018. 1. 15].
※ AI-Helper는 부적절한 답변을 할 수 있습니다.