ISO 14721 OAIS 참조모형을 활용한 웹 아카이빙의 메타데이터 구조 및 요소 정의 A study on Designing Metadata Structure and Element on Web Archiving based on the ISO 14721 OAIS Reference Model원문보기
본 연구에서는 웹 아카이빙에서 가치 있는 웹 자원의 수집, 관리 및 보존을 위해 요구되는 메타데이터의 구조를 설계하고 요소를 정의하였다. 본 연구를 위해 국립중앙도서관 'OASIS'등의 웹 아카이빙에서 수집 자원의 장기 보존을 위해 활용되는 메타데이터를 조사하고, 웹 아카이빙의 각 프로세스 단계별 요구사항 및 웹 자원의 특성을 분석하였으며, 특히 장기 보존을 위한 아카이빙의 개념적 틀을 제공하는 ISO 14721 OAIS 참조모형을 기반으로 제안하였다. 또한 웹 아카이빙 간의 자원 공유를 위한 메타데이터의 상호운용성을 고려하였다. 그 결과 본 연구에서는 웹 아카이빙에서 자원의 체계적이고 효율적인 수집, 관리, 운영 및 보존을 위한 설명적, 구조적, 관리적 그리고 보존적 유형의 4개 메타데이터 구조를 설계하고 28개의 필수 메타데이터 요소를 정의하였다.
본 연구에서는 웹 아카이빙에서 가치 있는 웹 자원의 수집, 관리 및 보존을 위해 요구되는 메타데이터의 구조를 설계하고 요소를 정의하였다. 본 연구를 위해 국립중앙도서관 'OASIS'등의 웹 아카이빙에서 수집 자원의 장기 보존을 위해 활용되는 메타데이터를 조사하고, 웹 아카이빙의 각 프로세스 단계별 요구사항 및 웹 자원의 특성을 분석하였으며, 특히 장기 보존을 위한 아카이빙의 개념적 틀을 제공하는 ISO 14721 OAIS 참조모형을 기반으로 제안하였다. 또한 웹 아카이빙 간의 자원 공유를 위한 메타데이터의 상호운용성을 고려하였다. 그 결과 본 연구에서는 웹 아카이빙에서 자원의 체계적이고 효율적인 수집, 관리, 운영 및 보존을 위한 설명적, 구조적, 관리적 그리고 보존적 유형의 4개 메타데이터 구조를 설계하고 28개의 필수 메타데이터 요소를 정의하였다.
This study is to develope the structures and the elements of the metadata for harvesting, management and preservation of a valuable web resources in the web archiving. For this study, we investigated the available metadata in the web archiving and surveyed the requirements of web archiving process. ...
This study is to develope the structures and the elements of the metadata for harvesting, management and preservation of a valuable web resources in the web archiving. For this study, we investigated the available metadata in the web archiving and surveyed the requirements of web archiving process. And we analyzed the characteristics of web resources. Also, this study was used a based on the ISO 14721 OAIS Reference Model. Finally, to share the metadata elements among the web archiving system, this study considered the interoperability for the exchange of the metadata. Based on the result, this study designed four structures of the metadata and defined the 28 core metadata elements for the web archiving.
This study is to develope the structures and the elements of the metadata for harvesting, management and preservation of a valuable web resources in the web archiving. For this study, we investigated the available metadata in the web archiving and surveyed the requirements of web archiving process. And we analyzed the characteristics of web resources. Also, this study was used a based on the ISO 14721 OAIS Reference Model. Finally, to share the metadata elements among the web archiving system, this study considered the interoperability for the exchange of the metadata. Based on the result, this study designed four structures of the metadata and defined the 28 core metadata elements for the web archiving.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
WARP은 일본 도메인 상의 인터넷 정보를 수집·보존하여 미래세대에게 전달하는데 그 목적이 있다.
따라서 OASIS 프로젝트의 현황 분석과 웹 아카이빙 관련 해외 대표사례를 조사 및 분석하였다. 그 결과를 기반으로 OASIS 및 웹 아카이빙에 적용 가능한 메타데이터를 개발하기 위해 ISO 14721 OAIS 참조모형에서 제시하는 웹 아카이빙 업무단계별, 기능별 프로세스에 따른 구조와 요소를 적용하고자 하였다.
현재 운영 또는 준비 중인 세계의 웹 아카이빙 프로젝트나 기관 또한 OAIS 참조모형의 기준을 적용하고 준수하기 위해 노력하고 있다[3]. 따라서 ISO 14721 OAIS 참조모형에서 제시하고 있는 아카이빙의 절차에 따른 단계별 요구정보를 통한 메타데이터의 구조와 요소를 개발하고자 한다.
따라서 본 논문에서는 OASIS 웹 아카이빙의 주요 수집 자원인 웹사이트, 웹 문서, 웹 자원(개별 파일)을 대상으로 관리하고 보존하기 위한 단계별·기능별 요구사항을 충족 할 수 있는 메타데이터 구조와 요소를 개발하였다.
이에 현재 웹 아카이빙을 준비·계획 중이거나, 운영하고 있는 많은 프로젝트와 기관에서는 이들이 제시한 메타데이터 구조와 요소를 참고하여 메타데이터 요소를 추출하고 있다[16]. 따라서 본 논문에서는 국제적인 아카이빙 프로젝트 및 각 국가별 아카이빙에서 활용되는 메타데이터의 다양한 요구사항과 특성들을 고려한 구조와 요소에 대한 확보방안을 마련한다.
본 논문에서 디지털 자원 웹 아카이빙을 위한 메타데이터를 개발하기 위해서 지속적으로 연구되어 온 더블린코어 메타데이터, OCLC/RLG 보존메타데이터, NEDLIB 보존메타데이터, NLA 보존 메타데이터, OCLC 웹 아카이빙 메타데이터 그리고 최근 완료된 보존 메타데이터의 결정판이라 할 수 있는 PREMIS Data Dictionary (1.1)를 비롯하여 그동안의 웹 아카이빙 관련 메타데이터 사례들을 분석하여 메타데이터 개발 목표와 원칙을 제시하였다.
본 논문에서는 ISO 14721 OAIS 참조모형을 적용한 국내 웹 아카이빙 메타데이터의 구조와 활용요소를 개발하였다. 그 결과 첫째, 웹 아카이빙을 위한 디지털 자원으로 표현되는 수단인 문서, 이미지, 동영상, 사운드의 매체별 자원에 대한 정보는 자원의 구조정보를 기술하는 구조적 메타데이터 요소로 구조화, 상세화 하였다.
본 논문에서는 웹 자원 특성에 관한 3가지 관점을 통해 웹 아카이빙을 위한 메타데이터 요구사항을 기술하고자 하였다.
본 연구는 향후 디지털 자원의 웹 아카이빙을 위해 내·외부에 있는 디지털 자원을 보존하기 위한 주체와 대상 자원의 체계적인 수집, 관리, 저장 및 서비스를 위한 체계적인 관리방안을 제시하고자 하였다.
이때 어떤 정보를 갖고 있느냐에 따라 설명적 메타데이터, 구조적 메타데이터, 관리적 메타데이터 등으로 구분 지을 수 있다[17]. 이를 위해 본 논문에서는 OAIS 참조모형에서 제시한 아카이빙의 기능 단계별(입수 전-입수, 저장, 데이터관리, 보존, 접근/서비스, 아카이빙 운영)로 요구되는 정보를 활용할 수 있는 구조적인 특징을 반영한 메타데이터 구조를 제시하고자 한다.
제안 방법
5개의 엔티티 (Intellectual Entities, Objects, Events, Rights 그리고 Agents)는 보존 메타데이터로 설명되는 디지털 보존에 적절한 개체들이고, 엔티티의 속성은 의미단위로 표현된다. PREMIS 메타데이터 요소들의 논리적인 조직을 용이하게 하기 위해서 (그림 2)와 5가지 유형의 속성들로 구성된 단순한 모델을 개발하였다.
보존적 메타데이터를 관리적 메타데이터와 구분한 것은 현재 OASIS와 같이 보존 정책과 계획이 수립되지 않은 웹 아카이빙 상황에서 보존과 관련된 정보들 - 문맥정보, 참조정보, 출처정보, 인증 정보 - 등에 대해 별도로 관리해야 할 필요가 있음을 고려하였기 때문이다. 결과적으로 현재 OASIS 메타데이터와 앞서 사례 분석한 연구내용을 토대로 4개의 섹션(Section)과 9가지 메타정보로 구성된 구조를 제안하고 그에 따른 구성을 (그림 4)와 같이 표현하였다.
그 결과 첫째, 웹 아카이빙을 위한 디지털 자원으로 표현되는 수단인 문서, 이미지, 동영상, 사운드의 매체별 자원에 대한 정보는 자원의 구조정보를 기술하는 구조적 메타데이터 요소로 구조화, 상세화 하였다. 둘째, 웹 자원의 특성을 고려하여 웹사이트, 웹 자원의 연계 정보를 구체화하였다. 셋째, 디지털 자원의 장기 보존을 지원하기 위한 필수 보존 메타데이터 요소를 추가하였다.
따라서 OASIS 프로젝트의 현황 분석과 웹 아카이빙 관련 해외 대표사례를 조사 및 분석하였다. 그 결과를 기반으로 OASIS 및 웹 아카이빙에 적용 가능한 메타데이터를 개발하기 위해 ISO 14721 OAIS 참조모형에서 제시하는 웹 아카이빙 업무단계별, 기능별 프로세스에 따른 구조와 요소를 적용하고자 하였다.
일반적으로 관리적 메타데이터로 분류되던 보존 정보가 웹 아카이빙에서는 출처정보, 인증정보, 고정정보, 참조정보를 포함하며 구조화 및 상세화 되고 있다. 따라서 본 논문에서는 아카이빙 단계별 요구되는 정보에 따라 설명적 메타데이터(설명정보, 식별정보), 구조적 메타데이터(구조정보), 관리적 메타데이터(관리정보, 관리자 정보, 기술정보, 정책정보, 권리정보), 그리고 보존적 메타데이터 (참조정보, 인증정보, 문맥정보, 출처 정보)로 구분하였다.
더블린 코어 메타데이터는 메타데이터 표준 개발에 폭넓게 이용되는 국제 표준 메타데이터로 보편적이고 단순한 메타데이터 요소를 구성하여 전문가와 비전문가 모두에게 이용 된다. 또한 고유성, 확장성, 구문독립성, 선택성, 반복성, 수정가능성 원칙을 근거로 15개 메타데이터 요소를 제안하였다. 특히 전자도서관 및 초기 웹 아카이빙에서 자원을 수집 및 관리하기 위해 메타데이터 개발 시 기준이 되었다.
또한 보존 메타데이터 요소의 "프로토타입(Prototype) "을 구성하여, 공식적인 보존 메타데이터 명세서를 개발위한 합의에 기초하였다[13].
본 논문에서는 앞서 제안한 OASIS 메타데이터 구조와 개발 원칙을 기준으로 총 29개의 메타데이터 요소를 추출하고 구조화, 상세화를 통해 하위 요소를 선정하였다. <표 4>부터 <표 7>까지는 각 단위 섹션별 메타데이터 요소에 대하여 메타데이터의 범주(Category), 요소(Element), 하위요소(Sub Element), 기원(Origin), 정의(Definition) 및 의무사항(Cardinality)에 관한 설명이다.
둘째, 웹 자원의 특성을 고려하여 웹사이트, 웹 자원의 연계 정보를 구체화하였다. 셋째, 디지털 자원의 장기 보존을 지원하기 위한 필수 보존 메타데이터 요소를 추가하였다. 그 결과 메타데이터 개발 원칙과 기준에 의해 4개의 메타데이터 섹션 구조 - 설명적, 구조적, 관리적, 보존적 - 와 9개의 범주정보(Category)를 담을 수 있는 메타데이터 구조를 제안하고, 각 섹션구조에 따른 단위 정보를 제공할 수 있는 29개의 메타데이터 요소와 각 요소별 필수하위 요소를 개발하였다.
은 프로젝트 사례별 메타데이터에서 분야별 ·요소별 메타데이터의 콘텐츠정보, 구조정보, 권리정보, 관리정보 및 기술정보로 구분하여 각 사례들에 대한 구조와 요소를 비교·분석하였다.
둘째, 표준 또는 권위 있는 메타데이터를 준용한다. 이러한 메타데이터는 미국과 유럽을 중심으로 각국의 전문가와 앞선 사례들이 중심이 되어 오랜 기간 논의와 조사를 통해 개발되었다. 이에 현재 웹 아카이빙을 준비·계획 중이거나, 운영하고 있는 많은 프로젝트와 기관에서는 이들이 제시한 메타데이터 구조와 요소를 참고하여 메타데이터 요소를 추출하고 있다[16].
특히 OASIS 프로젝트의 정책, 시스템 변화 및 업무 변동 상황에 따라 메타데이터의 확장 및 변경·수정이 가능하도록 구성하였다.
대상 데이터
2003년 6월 OCLC/RLG는 PREMIS 보존메타데이터 구현 전략을 위해 6개국의 대학도서관, 국가도서관, 박물관 아카이브, 정부기관 기업에서 참여한 30명의 전문가로 구성된 PREMIS 실무반을 구성하였다. REMIS 실무반의 목적은 첫째, 보존 메타데이터 입력, 저장, 관리 및 교환을 위한 대안적인 전략들은 식별하고 평가하는 것이고, 둘째, 구현 가능한 필수 보존 메타데이터의 관리 및 이용을 위한 가이드라인과 권고안을 정의 하는 것이다.
특히 OASIS 프로젝트의 정책, 시스템 변화 및 업무 변동 상황에 따라 메타데이터의 확장 및 변경·수정이 가능하도록 구성하였다. OASIS 메타데이터는 더블린 코어의 15개 요소(Elements)를 토대로 내부 관리 메타데이터 요소를 추가하여 총 32개의 메타데이터 요소(하위 요소 포함)로 구성되어 있다.
성능/효과
NEDLIB(Networked European Deposit Library) 프로젝트는 1998년부터 2001년까지 유럽 7개국의 국립도서관 (네덜란드, 핀란드, 프랑스, 이탈리아, 노르웨이, 포르투갈, 스위스)과 3곳의 온라인 전자출판물 출판사( Elsevier, Kluwers, Springer Verlag) 그리고 네덜란드 국립기록보존소가 참여한 전자출판물의 장기 보존을 위한 프로젝트이다. NEDLIB 보존 메타데이터 또한 OAIS 참조 모형에 기초하여 개발되었으며, 그 결과는 다시 OAIS 참조모형이 완성되는데 영향을 주었다. CEDARS, NLA, OCLC/RLG의 보존 메타데이터가 디지털 정보의 장기 보존과 접근이라는 두 가지 목적을 두고 개발 된 것과 달리, NEDLIB는 디지털 정보자원의 보존 메타데이터는 엄격하게 보존에만 초점을 맞춰서 개발이 진행되었다[12].
셋째, 디지털 자원의 장기 보존을 지원하기 위한 필수 보존 메타데이터 요소를 추가하였다. 그 결과 메타데이터 개발 원칙과 기준에 의해 4개의 메타데이터 섹션 구조 - 설명적, 구조적, 관리적, 보존적 - 와 9개의 범주정보(Category)를 담을 수 있는 메타데이터 구조를 제안하고, 각 섹션구조에 따른 단위 정보를 제공할 수 있는 29개의 메타데이터 요소와 각 요소별 필수하위 요소를 개발하였다.
본 논문에서는 ISO 14721 OAIS 참조모형을 적용한 국내 웹 아카이빙 메타데이터의 구조와 활용요소를 개발하였다. 그 결과 첫째, 웹 아카이빙을 위한 디지털 자원으로 표현되는 수단인 문서, 이미지, 동영상, 사운드의 매체별 자원에 대한 정보는 자원의 구조정보를 기술하는 구조적 메타데이터 요소로 구조화, 상세화 하였다. 둘째, 웹 자원의 특성을 고려하여 웹사이트, 웹 자원의 연계 정보를 구체화하였다.
REMIS 실무반의 목적은 첫째, 보존 메타데이터 입력, 저장, 관리 및 교환을 위한 대안적인 전략들은 식별하고 평가하는 것이고, 둘째, 구현 가능한 필수 보존 메타데이터의 관리 및 이용을 위한 가이드라인과 권고안을 정의 하는 것이다. 그 결과로 PREMIS 데이터 모형과 의미단위(Semantic unit)를 정리한 PREMIS Data Dictionary 를 완성하였다.
셋째, 데이터 관리 단계 : 데이터 관리는 최초 입수된 자원이 아카이빙에서 관리되고 있는 단계에 관한 정보가 제공된다. 즉 데이터가 현재 어떤 상태(예: 포맷 변경, 저장 매체 변경 등)에 있는지에 대한 정보가 요구된다.
후속연구
향후 보존 정보가 강화된다면 보존 메타데이터 섹션에 구조 정보, 기술 정보, 관리 정보의 일부 정보를 포함하는 광의의 보존 메타데이터로도 변경도 가능하다. 따라서 디지털 자원의 단계별 보존 전략과 계획에 의한 구체적인 메타데이터 요소에 대한 연구가 필요할 것이다.
따라서 향후 OASIS 등의 웹 아카이빙에서는 웹 사이트, 웹 자원의 장기적인 보존을 위한 방향과 필요한 업무 프로세스에 따른 관리 방안에 대한 메타데이터 요소가 개발되어 활용되어야하는 이슈를 제시 한다.
현재의 보존 메타데이터 요소는 자원의 장기 보존을 지원하기 위해 요구되는 기본적인 요소만을 추출한 것이다. 향후 보존 정보가 강화된다면 보존 메타데이터 섹션에 구조 정보, 기술 정보, 관리 정보의 일부 정보를 포함하는 광의의 보존 메타데이터로도 변경도 가능하다. 따라서 디지털 자원의 단계별 보존 전략과 계획에 의한 구체적인 메타데이터 요소에 대한 연구가 필요할 것이다.
향후 연구에서 보존 메타데이터 개발은 국립중앙도서관의 OASIS 및 각 웹 아카이빙의 정책적인 방향에 따라 보존 전략과 계획을 준비해야 할 것이다. 현재의 보존 메타데이터 요소는 자원의 장기 보존을 지원하기 위해 요구되는 기본적인 요소만을 추출한 것이다.
질의응답
핵심어
질문
논문에서 추출한 답변
웹 아카이빙에서 보존메타데이터는 무엇인가?
이러한 역할을 하는 메타데이터를 보존 메타데이터라고 한다[4]. 웹 아카이빙에서 보존메타데이터란 “장기적으로 전자 기록들이 환경이 변하여도 계속 활용될 수 있게 하는 생존 능력(Viability), 이용자 또는 관리자의 요구에 따라 처리 및 표기될 수 있는 능력(Renderability), 관리자에 의하여 기록된 정보들을 식별할 수 있게 해주는 능력(Understandability)을 유지하기 위해 필요한 지식 정보”로 정의된다[5].
메타데이터는 어떤 기능을 가지고 있는가?
메타데이터는 데이터에 대한 데이터로서, 실제 콘텐츠는 아니면서 그에 대한 각종 정보를 갖고 있는 데이터를 의미하며, 일반적으로 다음의 2가지 기능을 갖는다. 첫째는 정보 검색을 지원하는 기능으로 정제된 정보를 제공하여 자원의 식별과 이용에 도움을 줄 뿐만 아니라 자원에 가치를 부가하여 자원의 검색에 유용하게 한다. 둘째는 자원을 체계적으로 관리하고 효과적인 이용을 지원하기 위해 자원을 기술하고, 범주화하며 자원의 연혁(history) 정보를 기록하는 것이다[3].
WARP의 목적은 무엇인가?
WARP(Web Archiving Project)은 2002년 11월 시작한 온라인 전자 출판물의 수집을 위한 웹 아카이빙 프로젝트로 NDL(National Diet Library)에서 지원한 3년간의 시범적인 프로젝트이다. WARP은 일본 도메인 상의 인터넷 정보를 수집·보존하여 미래세대에게 전달하는데 그 목적이 있다. WARP는 2001년 3월 더블린 코어를 기반으로 메타데이터 생성을 위한 NDL 표준안인 "NDL Metadata ELement Set"을 공표하였다.
참고문헌 (17)
서혜란, "디지털 납본제도 방안".디지털 유산 보존을 위한 포럼, 2004.
OASIS homepage : http://www.OASIS.go.kr
국립중앙도서관,“OASIS 표준화과제연구”, 2003.
Deborah Woodvard, "Preservation Metadata" OCLC/SCURL NEW Directions in Metadata, Edinburght, 15-16 August 2002.
김희정, "전자저널 아카이빙을 위한 OAIS 참조모형의 적용방안에 관한 연구", 박사학위논문, 연세대학교 문헌정보학과, 2003.
OCLC.RLG, A Metadata Framework to Support the Preservation of Digital Objects,2002.
PREMIS Working Group, " Data Dictionary for Preservation Metadata: Final Report of the PREMIS Working Group", 2005.
김태수, 목록의 이해,서울,한국도서관협회, 2000.
OCLC/RLG, "Implementing Preservation Repositories for Digital Materials: Current Practice and Emerging Trends in the Cultural Heritage Community", 2004.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.