여러 소스에 출현하는 관측분야의 과학데이터가 OpenURL 서비스 아키텍처에서 원활하게 유통되도록 하기 위해, OpenURL 소스와 서비스 구성요소간 상호운용성 확보를 할 수 있도록 Key/Encoded-Value(KEV) 형식으로 OpenURL 핵심 메타태그를 제안하였다. 현재의 OpenURL은 문헌위주의 학술정보 유통에 그 초점이 맞추어져 있으며, 과학데이터 유통을 위한 메타태그는 제공하지 못하고 있다. 과학데이터 기술을 위한 DataCite 컨소시엄의 메타데이터 요소를 기준으로 하고, 더블린 코어의 핵심 메타데이터 요소, 데이터세트와 테이블을 인용하기 위해 OECD에서 만든 메타데이터 요소, 지구관측 분야의 메타데이터 표준인 DIF 메타데이터 요소를 비교, 분석하여 관측분야의 과학데이터를 위한 OpenURL 핵심 메타태그를 도출하였다.
여러 소스에 출현하는 관측분야의 과학데이터가 OpenURL 서비스 아키텍처에서 원활하게 유통되도록 하기 위해, OpenURL 소스와 서비스 구성요소간 상호운용성 확보를 할 수 있도록 Key/Encoded-Value(KEV) 형식으로 OpenURL 핵심 메타태그를 제안하였다. 현재의 OpenURL은 문헌위주의 학술정보 유통에 그 초점이 맞추어져 있으며, 과학데이터 유통을 위한 메타태그는 제공하지 못하고 있다. 과학데이터 기술을 위한 DataCite 컨소시엄의 메타데이터 요소를 기준으로 하고, 더블린 코어의 핵심 메타데이터 요소, 데이터세트와 테이블을 인용하기 위해 OECD에서 만든 메타데이터 요소, 지구관측 분야의 메타데이터 표준인 DIF 메타데이터 요소를 비교, 분석하여 관측분야의 과학데이터를 위한 OpenURL 핵심 메타태그를 도출하였다.
This paper presents a core meta-tag of OpenURL written in Key/Encoded-Value format in the field of observation research, to distribute the scientific data, produced in many experimentations and observations, on the OpenURL service architecture. So far, the OpenURL hasn't supplied a meta-tag represen...
This paper presents a core meta-tag of OpenURL written in Key/Encoded-Value format in the field of observation research, to distribute the scientific data, produced in many experimentations and observations, on the OpenURL service architecture. So far, the OpenURL hasn't supplied a meta-tag represented scientific data because it has focused on circulation of scholarly and technological information extracted from thesis, proceedings, journals, literatures, etc. The DataCite consortium metadata were analyzed and compared with the Dublin Core metadata, OECD metadata, and Directory Interchange Format metadata to develop a core meta-tag in observation research.
This paper presents a core meta-tag of OpenURL written in Key/Encoded-Value format in the field of observation research, to distribute the scientific data, produced in many experimentations and observations, on the OpenURL service architecture. So far, the OpenURL hasn't supplied a meta-tag represented scientific data because it has focused on circulation of scholarly and technological information extracted from thesis, proceedings, journals, literatures, etc. The DataCite consortium metadata were analyzed and compared with the Dublin Core metadata, OECD metadata, and Directory Interchange Format metadata to develop a core meta-tag in observation research.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
관련 분야의 표준을 최대한 반영하고자 노력하였다. 특히 메타데이터 요소 비교의 기준으로 사용된 DataCite 메타데이터 요소를 거의 모두 수용하고자 하였다.
첫째, DataCite 기술 관련 워킹 그룹에 본 연구의 결과를 제출하고 관련 연구자와 후속 연구 진행이 필요하다. 둘째, 지구 관측 분야에서 2011년 2월 현재 OpenURL 레지스트리 운영에 책임을 맡고 있는 OCLC(Online Computer Library Center, Inc.)에 개발된 내용을 제출하여 표준화 작업을 진행하는 것이다. 셋째, Linking Resolver 솔루션을 개발하여 세계적으로 보급하고 있는 엑스리브리스사의 개발팀과 긴밀한 협력을 통해 ORD 개발 내용이 국제 사회 커뮤니티에서 활발하게 논의될 수 있도록 해야 한다.
셋째, OECD와 DataCite, DIF의 데이터 인용을 위한 필수 요소 항목들을 함께 검토하였다. 따라서 OpenURL 소스에서 데이터 인용 관련 요소가 모두 활용될 수 있도록 설계하였다. 넷째, 관련분야 표준을 최대한 반영하였다.
본 연구에서는 메타태그나 데이터 기반을 알기 위해 NISO OpenURL Version 0.1과 2004년 NISTO AX위원회에서 표준으로 제정한 Z39.88-2004를 검토하였다. 과학데이터 기술을 위한 DataCite3) 컨소시엄의 메타데이터 요소를 기준으로 하고, Dublin Core(이하 DC)의 핵심 메타데이터 요소, 데이터세트와 테이블을 인용하기 위해 개발된 OECD 메타데이터 요소, 지구관측 분야의 메타데이터 표준인 Directory Interchange Format(이하 DIF) 메타데이터 요소를 비교 분석하여 관측분야의 과학데이터를 위한 OpenURL 핵심 메타태그를 Key/Encoded-Value(KEV) 형식으로 제안하였다.
현재의 OpenURL 레지스트리에 등록된 메타데이터 형식 중 학술 커뮤니티에서 자주 사용될 수 있는 서비스 유형에 대한 형식도 존재한다. 하지만 본 연구는 OpenURL소스와 서비스 구성요소의 상호운용성 확보를 위한 핵심 메타태그를 개발하는 것이 주된 목적이다. 따라서 데이터 관련 서비스 유형 확장에 대한 연구는 별도로 진행하고자 한다.
가설 설정
88-2004 표준을 준수하여 관련 커뮤니티 연구자들과 종사자들이 쉽게 이해할 수 있도록 하였다. 둘째, 메타태그의 최신성이다. 연구데이터의 출판에 앞장서고 있는 DataCite의 최근 표준을 기준 스키마로 사용하기 때문에 데이터를 기술하되 필요한 메타태그에 대한 최근 연구결과를 반영하였다.
제안 방법
DataCite 메타데이터 요소를 기준으로 상기각 기관의 요소들과의 연결테이블(Crosswalks)을 작성하였다. 각각의 요소들을 비교한 후 공통요소를 찾아내고 이후 비교 대상으로 검토되었던 스키마에서 과학데이터 관련 핵심 메타태그를 도출 정립하였다.
88-2004 Matrix Serializati on(식별자: info:ofi/fmt:kev:mtx)” 형식을 제한 언어로 사용하였다. Key 이름은 표준에 맞게 변경하였으며 메타데이터 형식은 첫째, ANSI/NISO Z39.88-2004 표준 준수, 둘째, 메타태그의 최신성 보전, 셋째, OECD와 DataCite, DIF의 필수 요소 항목 참고, 넷째, 관련분야 표준의 적극적 반영, 다섯째, 미래 대비와 같은 다섯 가지 사항을 고려하였다.
문헌위주의 학술정보 유통에 초점이 맞추어져 개발된 OpenURL에 과학데이터 유통을 위한 메타태그를 접목하는 시도를 하였다. ORD 메타데이터의 객관성과 OpenURL에서의 상호운용성을 확보하기 위하여 DataCite 컨소시엄의 메타데이터 요소, DC의 핵심 메타데이터 요소, OECD 메타데이터 요소, 그리고 DIF 메타데이터 요소를 비교, 분석하였다.
DataCite 메타데이터 요소를 기준으로 상기각 기관의 요소들과의 연결테이블(Crosswalks)을 작성하였다. 각각의 요소들을 비교한 후 공통요소를 찾아내고 이후 비교 대상으로 검토되었던 스키마에서 과학데이터 관련 핵심 메타태그를 도출 정립하였다. 핵심 메타태그를 결정할 때의 가장 큰 원칙은 검토 스키마에 모두 존재하는 것을 우선적으로 선택하는 것이었다.
88-2004를 검토하였다. 과학데이터 기술을 위한 DataCite3) 컨소시엄의 메타데이터 요소를 기준으로 하고, Dublin Core(이하 DC)의 핵심 메타데이터 요소, 데이터세트와 테이블을 인용하기 위해 개발된 OECD 메타데이터 요소, 지구관측 분야의 메타데이터 표준인 Directory Interchange Format(이하 DIF) 메타데이터 요소를 비교 분석하여 관측분야의 과학데이터를 위한 OpenURL 핵심 메타태그를 Key/Encoded-Value(KEV) 형식으로 제안하였다.
넷째, 관련분야 표준을 최대한 반영하였다. 관측분야에서 표준으로 사용되고 있는 DIF 형식의 요소 중 주요 요소가 추가되어 관측분야에서 활용하는데 있어 기존 데이터베이스에 구축된 정보가 활용될 수 있도록 하였다. 다섯째, 미래를 준비하는 예비성을 들 수 있다.
해당 분야의 전문가들이 연구현장의 의견을 반영하여 지속적인 갱신을 해오고 있는 DataCite, DC, OECD, DIF 메타데이터 요소 하나하나에 대해서 그 용도와 가치를 판단하는 것은 불필요하다고 전제하였다. 다만 본 연구에서는 OpenURL 소스와 서비스 구성 요소간 상호운용성 확보를 할 수 있도록 OpenURL 핵심 메타태그를 KEV 형식으로 제안하는 것이기 때문에 OpenURL 메타태그로 적합한 메타데이터 요소인지만 판단하였다. 다음은 ORD KEV 메타데이터 정의를 위해 준수한 설계방향이다.
상기의 기준으로 DataCite 메타데이터 요소를 기준으로 DC, OECD, DIF 각각의 메타데이터 요소를 분석하여 연결테이블(Crosswalks)을 작성하였다. 다음으로 DataCite 메타데이터 요소를 대상으로 OpenURL 메타태그로 적합한 메타데이터 요소인지 판단하여 1차 핵심 메타태그를 도출하였다. DataCite 메타데이터 요소 중 [Right]와 [Description]은 OpenURL 소스와 서비스 구성 요소간 상호운용성 확보를 위해 불필요한 요소로 판단하여 선정하지 않았다.
문헌위주의 학술정보 유통에 초점이 맞추어져 개발된 OpenURL에 과학데이터 유통을 위한 메타태그를 접목하는 시도를 하였다. ORD 메타데이터의 객관성과 OpenURL에서의 상호운용성을 확보하기 위하여 DataCite 컨소시엄의 메타데이터 요소, DC의 핵심 메타데이터 요소, OECD 메타데이터 요소, 그리고 DIF 메타데이터 요소를 비교, 분석하였다.
범용적인 OpenURL 핵심 메타태그를 개발하기 위하여 과학데이터 기술을 위한 DataCite 컨소시엄의 메타데이터 요소를 기준으로, DC의 핵심 메타데이터 요소와 데이터세트와 테이블을 인용하기 위해 개발된 OECD 메타데이터 요소, 지구관측 분야의 메타데이터 표준인 DIF 메타데이터 요소를 중심으로 조사하였다.
상기의 기준으로 DataCite 메타데이터 요소를 기준으로 DC, OECD, DIF 각각의 메타데이터 요소를 분석하여 연결테이블(Crosswalks)을 작성하였다. 다음으로 DataCite 메타데이터 요소를 대상으로 OpenURL 메타태그로 적합한 메타데이터 요소인지 판단하여 1차 핵심 메타태그를 도출하였다.
연구데이터의 출판에 앞장서고 있는 DataCite의 최근 표준을 기준 스키마로 사용하기 때문에 데이터를 기술하되 필요한 메타태그에 대한 최근 연구결과를 반영하였다. 셋째, OECD와 DataCite, DIF의 데이터 인용을 위한 필수 요소 항목들을 함께 검토하였다. 따라서 OpenURL 소스에서 데이터 인용 관련 요소가 모두 활용될 수 있도록 설계하였다.
핵심 메타태그를 도출하기 위하여 DataCite 메타데이터 커널을 기준으로 DC 메타데이터 요소, OECD 메타데이터 요소와 DIF 메타데이터 요소들을 비교하여 공통요소를 도출하였다. 이후 비교 대상으로 검토되었던 스키마에서 과학데이터 관련 핵심 메타태그를 도출하여 추가하였다.
정의된 ORD KEV 메타데이터 형식은 [Summary] 필드를 제외하고 DIF 필수요소를 모두 포함하도록 설계되었다. [Entry_ID]는 Identifier, [Entry_Title]은 [Title], [Parameters]와 [ISO_Topic_Category]는 [Subject], [Data_Center]는 [Contributor], [Metadata_Name]과 [Metadata_Version]은 [MetadataName]과 [MetadataVersion]으로 매핑 되었다.
핵심 메타태그를 도출하기 위하여 DataCite 메타데이터 커널을 기준으로 DC 메타데이터 요소, OECD 메타데이터 요소와 DIF 메타데이터 요소들을 비교하여 공통요소를 도출하였다. 이후 비교 대상으로 검토되었던 스키마에서 과학데이터 관련 핵심 메타태그를 도출하여 추가하였다.
대상 데이터
ORD KEV 메타데이터(http://bit.ly/euht9q)의 정의는 “Z39.88-2004 Matrix Serializati on(식별자: info:ofi/fmt:kev:mtx)” 형식을 제한 언어로 사용하였다.
각각의 메타데이터 요소들은 ‘출판용 메타데이터(Publishing metadata)’ 항목과 타 정보원과의 ‘연결(Links)’ 항목으로 구분하여 정의하였다. 본 연구에서는 DataCite 메타데이터 요소를 기준으로 각각의 메타데이터 요소 묶음에서 추출한 17개의 필드를 대상으로 연계를 하였다.
ly/pvDIAh]에서 확인 가능하다. 설문조사는 2010년 Science 학술지 동료 연구검토자(peer reviewers)들을 표본으로 선정하여 진행되었으며, 1,700명의 연구자가 응답을 한 결과이다. <그림 1>에서와 같이 연구자들이 사용하고 있는 과학데이터는그 크기가 다양하다.
이론/모형
ORD KEV 메타데이터 정의에 사용한 제한 언어(Constraint Language)로는 OpenURL 레지스트리에서 관리되고 있는 “The Z39.88-2004 Matrix Serialization(식별자: info:ofi/fmt:kev:mtx)” 형식을 사용하였다.
성능/효과
DataCite 메타데이터 요소 중 [Right]와 [Description]은 OpenURL 소스와 서비스 구성 요소간 상호운용성 확보를 위해 불필요한 요소로 판단하여 선정하지 않았다. DataCite 메타데이터 요소를 기준으로 핵심 메타태그를 선정 한 후 마지막으로 검토 대상이 되었던 DC와 OECD, DIF에서 관측 분야의 핵심 메타태그로 추가될 수 있는 요소를 도출하였다. 다음 <표 6>은 DataCite 메타데이터 요소와 DC, OECD, DIF 각 각의 메타데이터 요소를 비교한 연결테이블(Crosswalks)이다.
)에 개발된 내용을 제출하여 표준화 작업을 진행하는 것이다. 셋째, Linking Resolver 솔루션을 개발하여 세계적으로 보급하고 있는 엑스리브리스사의 개발팀과 긴밀한 협력을 통해 ORD 개발 내용이 국제 사회 커뮤니티에서 활발하게 논의될 수 있도록 해야 한다. 넷째, 한국과학기술정보연구원에서 운영하는 전자자원 호스팅 사업의 커뮤니티를 활용하는 것이다.
정의된 ORD KEV 메타데이터 형식은 다음의 다섯 가지 사항을 고려한 것이다. 첫째, ANSI/NISO Z39.88-2004 표준을 준수하여 관련 커뮤니티 연구자들과 종사자들이 쉽게 이해할 수 있도록 하였다. 둘째, 메타태그의 최신성이다.
후속연구
후속 연구로는 본 연구 결과의 활용과 확산에 있어 다양한 형식의 제한 언어를 통한 연구결과 공유를 위해 info:ofi/fmt:kev:xml 형식의 제한 언어 확장이 필요하다. 또한 현재의 학술적 서비스 유형이 총 6가지의 키로 구분되어 있는데, 모두 문헌을 위주로 한 서비스 유형들만 포함되어 있기 때문에 이에 대한 연구가 필요하다. 이를 위해서는 Scholarly Service Type Keys의 확장 연구가 필요하다.
본 개발 결과의 검증과 구현은 앞으로 DataCite 기술 관련 워킹 그룹, 현재 OpenURL 레지스트리 운영을 맡고 있는 OCLC, 세계적 Linking Resolver 솔루션 개발사인 엑스리브리스, 한국과학기술정보연구원의 전자자원 호스팅 사업 커뮤니티, 그리고 관련 종사자들과의 협력 연구를 거쳐 이루어질 것으로 사려 된다. 구체적인 과정을 서술하면 다음과 같다.
본 개발 연구의 평가는 후속되는 연구에서 유관 기관과 관련 종사자들을 연계하여 평가할 것이다. 후속 연구로는 본 연구 결과의 활용과 확산에 있어 다양한 형식의 제한 언어를 통한 연구결과 공유를 위해 info:ofi/fmt:kev:xml 형식의 제한 언어 확장이 필요하다.
2007년에 사업을 시작하여 2011년 2월 현재 국내 57개 기관이 호스팅 사업에 참여하고 있다. 참여기관의 관리자들을 위한 교육이 매년 정기적으로 진행되고 있어, 이러한 채널을 이용하여 ORD의 실험적 적용을 통해 문제점을 지속적으로 개선시킬 수 있을 것이다. 마지막으로, ORD KEV 메타데이터 형식에 대한 관련분야 종사자의 검토가 무엇보다도 필요하다.
첫째, DataCite 기술 관련 워킹 그룹에 본 연구의 결과를 제출하고 관련 연구자와 후속 연구 진행이 필요하다. 둘째, 지구 관측 분야에서 2011년 2월 현재 OpenURL 레지스트리 운영에 책임을 맡고 있는 OCLC(Online Computer Library Center, Inc.
본 개발 연구의 평가는 후속되는 연구에서 유관 기관과 관련 종사자들을 연계하여 평가할 것이다. 후속 연구로는 본 연구 결과의 활용과 확산에 있어 다양한 형식의 제한 언어를 통한 연구결과 공유를 위해 info:ofi/fmt:kev:xml 형식의 제한 언어 확장이 필요하다. 또한 현재의 학술적 서비스 유형이 총 6가지의 키로 구분되어 있는데, 모두 문헌을 위주로 한 서비스 유형들만 포함되어 있기 때문에 이에 대한 연구가 필요하다.
질의응답
핵심어
질문
논문에서 추출한 답변
도서관이나 정보센터에서 데이터 서비스를 추가하는 것은 무엇을 의미하는가?
도서관이나 정보센터에서 데이터 서비스를 추가하는 것은 문헌위주의 과학기술정보 서비스 체계를 구성하는 각각의 구성요소가 관찰/실험 데이터도 처리할 수 있게 확장되어야 함을 의미한다. 과학데이터 관련 서비스를 확대하는 데 있어 OCLC(2005)의 보고서가 지적한 사항을 고려해야 한다.
메타데이터 통합관리를 위한 연구로 어떤 것들이 활발하게 진행되고 있는가?
첫째, 분야별로 과학데이터에 대한 표준화를 주도하고 데이터를 공유하는 움직임이 활발하게 전개되고 있다. 특히 학제 간 연계․융합 연구를 위해서 이질적인 메타데이터를 의미적으로 통합하여 연구자들이 관련된 데이터를 동시에 검색하고 발견할 수 있도록 하는 서비스의 개발이 필요하게 되었다. 둘째, 발생된 데이터에 대한 영구적 접근을 제공하기 위해 데이터 식별자 부여에 대한 관심이 급증하고 있다. 국제적인 데이터 공유와 접근을 위해 독일의 국가과학기술도서관(TIB)에서 운영대행을 하고 있는 DataCite 컨소시엄이 구성된 것도 바로 이러한 이유에서이다. 셋째, 데이터의 인용을 위한 표준 포맷에 관한 연구도 활발하게 진행 중에 있다. DataCite는 과학데이터를 기술하기 위한 스키마를 최근에 발표하였으며, 데이터 인용을 위한 핵심 요소와 그 형식을 제안하였다. OECD의 경우도 데이터세트와 테이블이 인용되기 위한 핵심 요소와 그 형식을 제안하였으며, DIF의 경우도 [Data_Set_Citation]4)요소를 활용하여 데이터 인용과 관련된 정보를 기술할 수 있도록 하고 있다.
현재의 OpenURL의 특징은 무엇인가?
여러 소스에 출현하는 관측분야의 과학데이터가 OpenURL 서비스 아키텍처에서 원활하게 유통되도록 하기 위해, OpenURL 소스와 서비스 구성요소간 상호운용성 확보를 할 수 있도록 Key/Encoded-Value(KEV) 형식으로 OpenURL 핵심 메타태그를 제안하였다. 현재의 OpenURL은 문헌위주의 학술정보 유통에 그 초점이 맞추어져 있으며, 과학데이터 유통을 위한 메타태그는 제공하지 못하고 있다. 과학데이터 기술을 위한 DataCite 컨소시엄의 메타데이터 요소를 기준으로 하고, 더블린 코어의 핵심 메타데이터 요소, 데이터세트와 테이블을 인용하기 위해 OECD에서 만든 메타데이터 요소, 지구관측 분야의 메타데이터 표준인 DIF 메타데이터 요소를 비교, 분석하여 관측분야의 과학데이터를 위한 OpenURL 핵심 메타태그를 도출하였다.
참고문헌 (24)
곽승진. 2004. 청소년 과학정보 메타데이터 요소 및 데이터베이스 구축 연구. 한국문헌정보학회지, 38(1): 263-279.
Herbert Van de Sompel, Patrick Hochstenbach, Oren Beit-Arie. 2000. OpenURL Syntax Description, version OpenURL/1.0f.
Joan Starr, Angela Gastl. 2011. "isCitedBy: A Metadata Scheme for DataCite." D-Lib Magazine, 17(1/2).
Joan Starr et al. 2010. DataCite Metadata Kernel for the Publication and Citation of Research Data. DataCite Metadata Working Group.
Lois Mai Chan, Marcia Lei Zeng. 2006. "Metadata Interoperability and Standardization- A Study of Methodology Part I Achieving Interoperability at the Schema Level." D-Lib Magazine, 12(6).
Micah Altman, Gary King. 2007. "A Proposed Standard for the Scholarly Citation of Quantitative Data." D-Lib Magazine, 13(3/4).
Marcia Lei Zeng, Lois Mai Chan. 2004. "Trends and Issues in Establishing Interoperability Among Knowledge Organization Systems." Journal of the American Society for Information Science and Technology, 55(5): 377-395.
NISO AX Committee. 2004. Z39.88-2004: The OpenURL Framework for Context- Sensitive Services-The Key/Encoded- Value(KEV) Format - Implementation Guidelines. v1.7.
OCLC. 2005. Perceptions of Libraries and Information Resources. Dublin, Ohio: OCLC.
OCLC. 2006. Process for the Evaluation and Approval of New OpenURL Community Profile Submittals by the Z39.88 Open-URL Maintenance Agency. Dublin, Ohio: OCLC.
Priscilla Caplan. 2003. Metadata Fundamentals for All Librarians. Chicago: American Library Association.
Science Staff. 2011. "Challenges and Opportunities." Science, 331(6018): 692-693.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.