도서관 계에서 기계 가독 목록 형식(MARC)에 대한 대안으로 주목받고 있는 BIBFRAME은 기존 데이터와의 호환성을 유지하면서 오픈 웹 환경에서 새로운 서지기술 데이터모델을 제시한다. MARC의 한국형 데이터 모델인 KORMARC 레코드의 BIBFRAME 변환을 위해, 서울시 노원구립도서관의 최신 서지 데이터 5,000개를 분석하여 25개의 핵심 필드를 추출한다. 핵심 필드들을 MARC 21의 호환성 여부에 따라 세 가지 유형으로 분류하고, 각 유형별 변환 기법을 정의한다. 또한 오픈소스 기반의 변환기를 구현하여 KORMARC to BIBFRAME 변환 작업을 수행한다. 본 연구는 KORMARC to BIBFRAME 변환에 대한 기초연구로써, 실제 사용되는 최신 KORMARC 정보를 분석하여 변환 규칙을 정의하고, BIBFRAME 변환을 시도했다는 점에 의의가 있다.
도서관 계에서 기계 가독 목록 형식(MARC)에 대한 대안으로 주목받고 있는 BIBFRAME은 기존 데이터와의 호환성을 유지하면서 오픈 웹 환경에서 새로운 서지기술 데이터모델을 제시한다. MARC의 한국형 데이터 모델인 KORMARC 레코드의 BIBFRAME 변환을 위해, 서울시 노원구립도서관의 최신 서지 데이터 5,000개를 분석하여 25개의 핵심 필드를 추출한다. 핵심 필드들을 MARC 21의 호환성 여부에 따라 세 가지 유형으로 분류하고, 각 유형별 변환 기법을 정의한다. 또한 오픈소스 기반의 변환기를 구현하여 KORMARC to BIBFRAME 변환 작업을 수행한다. 본 연구는 KORMARC to BIBFRAME 변환에 대한 기초연구로써, 실제 사용되는 최신 KORMARC 정보를 분석하여 변환 규칙을 정의하고, BIBFRAME 변환을 시도했다는 점에 의의가 있다.
BIBFRAME, which is attracting attention as an alternative to the machine-readable catalog format (MARC) in the library world, presents a new bibliographic data model in the open web environment while maintaining compatibility with existing data. To convert KORMARC(Korean data model of MARC) records ...
BIBFRAME, which is attracting attention as an alternative to the machine-readable catalog format (MARC) in the library world, presents a new bibliographic data model in the open web environment while maintaining compatibility with existing data. To convert KORMARC(Korean data model of MARC) records into BIBFRAME, we extract 25 key fields by analyzing the latest 5,000 bibliographic data from Nowon-gu Library in Seoul. The extracted core fields are classified into three types according to the compatibility of MARC 21, and define conversion rules for each type. In addition, implement an open source-based converter to perform KORMARC to BIBFRAME conversion. As a basic study on KORMARC to BIBFRAME conversion, this study is meaningful in that it analyzes the latest KORMARC information actually used, defines conversion rules, and attempts BIBFRAME conversion.
BIBFRAME, which is attracting attention as an alternative to the machine-readable catalog format (MARC) in the library world, presents a new bibliographic data model in the open web environment while maintaining compatibility with existing data. To convert KORMARC(Korean data model of MARC) records into BIBFRAME, we extract 25 key fields by analyzing the latest 5,000 bibliographic data from Nowon-gu Library in Seoul. The extracted core fields are classified into three types according to the compatibility of MARC 21, and define conversion rules for each type. In addition, implement an open source-based converter to perform KORMARC to BIBFRAME conversion. As a basic study on KORMARC to BIBFRAME conversion, this study is meaningful in that it analyzes the latest KORMARC information actually used, defines conversion rules, and attempts BIBFRAME conversion.
이에 본 연구에서는 국가서지 LOD를 활용하여 변환을 시도한다. 국가서지 LOD를 활용하여 049 필드의 소장 사항 정보도 기술할 수 있도록 코드를 수정하고 BIBFRAME으로 변환을 시도한다. 049 필드의 소장기관 부호, 등록번호, 권․연차기호, 복본 기호, 별치기호는 BIBFRAME에서 W–OfflineMeterial–Book–localHolding 형식으로 각각 기술한다.
090 필드도 출현 빈도가 100%로 매우 높아 BIBFRAME 도입 시 해당 변환명세가 필요하다. 따라서 090 필드도 국가서지 LOD를 활용하여 자관 청구기호 정보를 기술할 수 있도록 코드를 수정하고 BIBFRAME으로 변환을 시도한다. 090필드의 소장기관부호, 등록번호, 권․연차기호, 복본기호, 별치기호는 049 필드와 마찬가지로 BIBFRAME에서 W–OfflineMeterial–Book–localHolding 형식으로 각각 기술 가능하다.
MARC 21을 기반으로 개발된 KORMARC는 로컬데이터를 기술하는 필드 이외에 다른 필드들은 MARC 21과 상당히 유사하다. 따라서 KORMARC 사용 빈도 분석에서 추출된 필드들을 우선적으로 MARC 21의 필드들과 호환성 여부를 검토하며 이를 세 가지로 분류한다. 첫째, 완벽하게 호환이 되는 경우 ‘Conversion’으로 구분하며 이는 KORMARC의 서지 데이터를 BIBFRAME으로 즉시 변환할 수 있는 수준이다.
0은 공식적으로 MARC 21에 대한 BIBFRAME 변환 명세만 존재한다. 따라서 KORMARC에 대한 BIBFRAME 변환 절차를 진행하기 위해 본 연구에서는 KORMARC의 특성을 이용하여 단계적 Mapping 절차를 진행한다.
049 필드는 분석결과에서 확인할 수 있듯이 출현 빈도가 100%인 매우 중요한 데이터이지만 BIBFRAME에서는 변환명세가 없기 때문에 변환이 불가능하다. 따라서 본 연구에서 제안한 국가서지 LOD를 활용한 변환 기법을 이용하여 정상 변환이 가능하도록 구현하였다. 기타 필드들은 MARC 21과 KORMARC 필드의 호환성에 문제가 없기 때문에 BIBFRAME 변환기를 이용하여 정상 출력 되었음을 확인할 수 있다.
의 주요 출력 결과를 살펴보면 023 필드의 CIP 정보는 BIBFRAME 명세서에는 기술되어 있지 않지만, 본연구에서 제안하는 국가서지 LOD를 활용한 변환 기법을 적용하여 BIBFRAME으로 정상 변환된 것을 확인할 수 있다. 또한 056 필드의 한국십진분류기호(KDC)정보는 MARC 21 기반의 BIBFRAME에서는 나타낼 수 없으므로, 본 연구에서 오픈소스의 코드를 수정하여 해당 정보가 출력될 수 있도록 하였다. 049 필드는 분석결과에서 확인할 수 있듯이 출현 빈도가 100%인 매우 중요한 데이터이지만 BIBFRAME에서는 변환명세가 없기 때문에 변환이 불가능하다.
본 연구에서 제안한 변환 규칙 정의를 검증하기 위해 ‘marc2bibframe2’오픈소스 기반의 변환기를 구현하여 실험을 진행한다
1와 같이 리더, 디렉터리, 기변 길이 필드가 연속으로 나열되어 있다. 본 연구에서는 KORMARC 필드 사용 빈도 분석을 위한 전 처리 작업으로 기존 필드를 XML데이터로 변환 후 Python 언어를 이용하여(Fig. 2.
056 필드는 한국십진분류기호(KDC)를 기술하는 필드로, MARC 21에서는 사용하지 않는다. 본 연구에서는 마찬가지로 국가서지 LOD를 활용하여 056 필드의 KDC 정보도 기술할 수 있도록 코드를 수정하고 BIBFRAME으로변환을 시도한다. 056 필드의 한국십진분류기호(KDC)는 BIBFRAME에서 W–classification–kdc–kdcn 형식으로 기술 가능하며, 도서 기호는 –itemNumberOfKDC, 판 표시는 -editionOfKDC–rdfs:label 형식으로 기술한다.
대상 데이터
이에 대한 대안으로 개발되고 있는 BIBFRAME은 폐쇄적인 도서관 서지정보에 대한 공유 및 활용을 자유롭게 할 수 있으며 링크드 데이터로 인해 도서관의 서지 데이터 정보를 더욱 확장할 수 있도록 지원한다. BIBFRAME을 국내 서지 데이터에 적용하기 위해 분석에 활용한 서지 데이터는 2019년 전국 도서관 통계를 참고하여 가장 이용률이 많은 서울시 공공 도서관 중, 장서 보유량이 평균치 이상으로 높은 노원구립도서관의 최신 서지 데이터 5,000개를 이용했다. 분석결과, 방대한 양의 서지 정보 변환 기법 중 25 개의 핵심 필드를 도출하여 변환 규칙을 명세하였다.
선정된 데이터는 국․내외 도서관에서 폭넓게 서지정보를 얻을 수 있는 인기도서 ‘샬롯의 거미줄(Charlotte’s web)’이다.
본 연구에서 제안한 변환 규칙 정의를 검증하기 위해 ‘marc2bibframe2’오픈소스 기반의 변환기를 구현하여 실험을 진행한다. 이를 위해 변환에 사용될 KORMARC 서지 데이터 중 적절한 샘플 데이터를 선정한다. 선정된 데이터는 국․내외 도서관에서 폭넓게 서지정보를 얻을 수 있는 인기도서 ‘샬롯의 거미줄(Charlotte’s web)’이다.
데이터처리
본 연구에서는 KORMARC 필드 사용 빈도 분석을 위한 전 처리 작업으로 기존 필드를 XML데이터로 변환 후 Python 언어를 이용하여(Fig. 2.) 필드별 사용빈도 분석을 진행하였다.
성능/효과
실제로 사용하는 최신 KORMARC 서지 데이터 분석을 통해 도출한 변환 규칙을 오픈 소스 기반의 변환기 프로그램을 활용하여 KORMARC 전용 변환기를 만들고 국내 최초로 BIBFRAME 변환을 시도했다는 점에 의의가 있으며, KORMARC 데이터 필드의 BIBFRAME 변환 적용 가능성을 확인하였다. KORMARC 서지 데이터의 BIBFRAME 변환을 위해서는 9xx 필드의 로컬 표목 사용을 최소화할 필요가 있으며, KORMARC 데이터 필드의 필드 번호 오기로 인한 변환 오류를 방지해야 한다.
507 필드는 그래픽 자료의 축척 주기를 기술하는 필드인데, 노원구립도서관의 분석 데이터에는 필드의 정의와 의미가 다른 정보가 입력되어 있었다. MARC 작업 과정 확인 결과, 납품업체에서 사용하는 MARC 생성 프로그램이 통합 서지용 MARC로 변경되기 전 단행본용 MARC로 세팅되어 있어 단행본용 MARC 정보인 507 원서 주기 필드의 정보를 기록한 것으로 확인되었다. 실제 기록된 단행본용 KORMARC 507 필드의 데이터는 원서 주기(원서 원어 표기, 저자 원어 표기 등)이며 이는 현재 사용하고 있는 통합 서지용 KORMARC의 필드로 변경하여 사용 가능하다.
주요 서지 데이터로 추출한 25개의 필드 중 900 필드는 700 필드로, 940 필드는 740 필드로, 949 필드는 440 필드로, 950 필드는 020 필드의 입수 조건으로 변환되어 실제 수정 사용된 필드는 21개이다. 본 연구에서 주요 필드로 추출한 25개 모두 정상적으로 BIBFRAME 변환이 완료되었음을 확인할 수 있다.
BIBFRAME을 국내 서지 데이터에 적용하기 위해 분석에 활용한 서지 데이터는 2019년 전국 도서관 통계를 참고하여 가장 이용률이 많은 서울시 공공 도서관 중, 장서 보유량이 평균치 이상으로 높은 노원구립도서관의 최신 서지 데이터 5,000개를 이용했다. 분석결과, 방대한 양의 서지 정보 변환 기법 중 25 개의 핵심 필드를 도출하여 변환 규칙을 명세하였다.
실제로 사용하는 최신 KORMARC 서지 데이터 분석을 통해 도출한 변환 규칙을 오픈 소스 기반의 변환기 프로그램을 활용하여 KORMARC 전용 변환기를 만들고 국내 최초로 BIBFRAME 변환을 시도했다는 점에 의의가 있으며, KORMARC 데이터 필드의 BIBFRAME 변환 적용 가능성을 확인하였다. KORMARC 서지 데이터의 BIBFRAME 변환을 위해서는 9xx 필드의 로컬 표목 사용을 최소화할 필요가 있으며, KORMARC 데이터 필드의 필드 번호 오기로 인한 변환 오류를 방지해야 한다.
정보환경의 급진적인 발전에 따라 도서관 계에서도 기계 가독 목록 형식에 대한 변화가 가속화되고 있다. 이에 대한 대안으로 개발되고 있는 BIBFRAME은 폐쇄적인 도서관 서지정보에 대한 공유 및 활용을 자유롭게 할 수 있으며 링크드 데이터로 인해 도서관의 서지 데이터 정보를 더욱 확장할 수 있도록 지원한다. BIBFRAME을 국내 서지 데이터에 적용하기 위해 분석에 활용한 서지 데이터는 2019년 전국 도서관 통계를 참고하여 가장 이용률이 많은 서울시 공공 도서관 중, 장서 보유량이 평균치 이상으로 높은 노원구립도서관의 최신 서지 데이터 5,000개를 이용했다.
후속연구
BIBFRMAE 2.0의 실제 적용을 위해서는 본 연구에서 추출한 25개의 필드 외에 100여 개가 넘는 데이터 필드에 대한 추가 변환 연구가 필요하며, BIBFRAME 2.0의 공식적인 변환 명세가 없는 로컬 데이터에 대한 연구도 필요하다. 앞으로 BIBFRAME 2.
0의 공식적인 변환 명세가 없는 로컬 데이터에 대한 연구도 필요하다. 앞으로 BIBFRAME 2.0 자동 변환을 위한 데이터베이스 모델링 및 웹에서 구동하는 변환기에 대한 연구를 후속 연구로 진행하고자 한다.
참고문헌 (17)
Kyung-ho Lee, and Jung-hyun Kim, "Data Listing Method: Focusing on KORMARC and MARC 21," Daegu: Taeilsa, pp, 186-398, 2016.
Sung-Sook Lee, and Ji-won Lee, "Study on Conversion between MARC 21 and BIBFRAME 2.0," Journal of Social Science, 29(3), pp, 73-93, Jul 2018.
Mihwa Lee, "A Study on the Considerations in Constructing BIBFRAME by Analyzing BIBFRAME 2.0," Journal of Korean Library and Information Science Society, 48(4), pp, 107-127, Dec 2017.
Suin Yim, and Seungmin Lee, "A Study on the Separation of Descriptive Levels for Enhancing the Applicability of BIBFRAME," JOURNAL OF THE KOREAN SOCIETY FOR LIBRARY AND INFORMATION SCIENCE, 54(3), pp, 165-186, Aug 2020.
Tae-soo Kim, "Understanding the list," Seoul: Korea Library Association, pp, 165-201, 2008.
Jung-hyun Kim, "The actuality of the list organization," Daegu: Taeilsa, pp, 73-108, 2018.
Mihwa Lee, "Analyzing BIBFRAME Cases for the Development of BIBFRAME Application Plans in Korea," Journal of Korean Library and Information Science Society, 49(2), pp, 59-78, Jun 2018.
Hye-won Lee, "A Study on Acceptance of BIBFRAME 2.0 for Sharing and Utilization of Bibliographic Data," Korean Library And Information Science Society Summer Conference, 75-90, (), May 2018.
Xu, Amanda,Hess, Kirk,Akerman, Laura, "From MARC to BIBFRAME 2.0: Crosswalks," Cataloging & classification quarterly, 56(2-3), pp, 224-250, 2018.
Jee-Hyun Rho, "The Current State and Challenges of Linked Data in Library Cataloging," Journal of Korean Library and Information Science Society, 50(3), pp, 71-95, Sep 2019.
Ok Nam Park, and Jung Sun Oh, "Deployment of BIBFRAME as a New Bibliographic Framework in Linked Data," Journal of the Korean Biblia Society for Library and Information Science, 25(4), pp, 235-263, Nov 2014
※ AI-Helper는 부적절한 답변을 할 수 있습니다.