글로벌 연구동향 파악, 이머징 시그널 탐지, 선도연구자 파악과 같은 최근의 정보서비스를 지원하기 위해서는 다양한 정보원으로부터 수집되는 대량의 정보를 통합 관리하는 것이 중요하다. 통합 관리를 위해서는 통합 메타데이터 스키마의 정의, 데이터 변환, 스키마 매칭 등의 노력이 필요한데 그 중에서 가장 먼저 수행되어야 하는 통합 메타데이터 스키마를 정의하기 위해서는 현존하는 다양한 메타데이터의 분석이 필요하다. 본 논문에서는 다양한 과학기술 학술논문 메타데이터를 메타데이터의 의미구조, 내용규칙, 구문 등으로 나누어 분석하고 통합 스키마를 만들거나 데이터 변환을 하기위해 고려하여야 할 점을 간략하게 살펴보았다. 일반적으로 구문형태는 편리성과 다양한 사용 환경을 지원하는 XML을 사용함을 알 수 있었으며, 의미구조에서는 공통적으로 사용하는 요소들과 구조화, 계층화한 이름 부여가 필요함을 알 수 있었다. 또한 요소들 중 다양한 내용규칙을 갖는 것들과 관련 표준을 살펴보았다. 분석된 자료는 메타데이터의 통합 관리, 데이터 변환, 상호운영을 위한 스키마 매칭 등의 연구에 기초자료로 사용되기를 기대한다.
글로벌 연구동향 파악, 이머징 시그널 탐지, 선도연구자 파악과 같은 최근의 정보서비스를 지원하기 위해서는 다양한 정보원으로부터 수집되는 대량의 정보를 통합 관리하는 것이 중요하다. 통합 관리를 위해서는 통합 메타데이터 스키마의 정의, 데이터 변환, 스키마 매칭 등의 노력이 필요한데 그 중에서 가장 먼저 수행되어야 하는 통합 메타데이터 스키마를 정의하기 위해서는 현존하는 다양한 메타데이터의 분석이 필요하다. 본 논문에서는 다양한 과학기술 학술논문 메타데이터를 메타데이터의 의미구조, 내용규칙, 구문 등으로 나누어 분석하고 통합 스키마를 만들거나 데이터 변환을 하기위해 고려하여야 할 점을 간략하게 살펴보았다. 일반적으로 구문형태는 편리성과 다양한 사용 환경을 지원하는 XML을 사용함을 알 수 있었으며, 의미구조에서는 공통적으로 사용하는 요소들과 구조화, 계층화한 이름 부여가 필요함을 알 수 있었다. 또한 요소들 중 다양한 내용규칙을 갖는 것들과 관련 표준을 살펴보았다. 분석된 자료는 메타데이터의 통합 관리, 데이터 변환, 상호운영을 위한 스키마 매칭 등의 연구에 기초자료로 사용되기를 기대한다.
It is important to manage large amount of information from various information providers for supporting recent information services such as providing global research trends, detecting emerging signal and listing leading researchers. For integrated management, definition of integrated metadata schema...
It is important to manage large amount of information from various information providers for supporting recent information services such as providing global research trends, detecting emerging signal and listing leading researchers. For integrated management, definition of integrated metadata schema, data transformation and schema matching are needed. It is first necessary to analyze existing various metadata for defining integrated metadata schema. In this paper, we have analyzed several metadata of scientific journal papers by classifying semantics, content rules and syntax, and looked around considerations to make integrated schema or transform metadata. We have known that XML is used as a syntax for supporting convenience and various usage condition, and hierarchy element names and common elements in semantics are needed. We also have looked at elements having various content rules and related standards. We hope that this study will be used as basic research material of metadata integrated management, data transform and schema matching for interoperability.
It is important to manage large amount of information from various information providers for supporting recent information services such as providing global research trends, detecting emerging signal and listing leading researchers. For integrated management, definition of integrated metadata schema, data transformation and schema matching are needed. It is first necessary to analyze existing various metadata for defining integrated metadata schema. In this paper, we have analyzed several metadata of scientific journal papers by classifying semantics, content rules and syntax, and looked around considerations to make integrated schema or transform metadata. We have known that XML is used as a syntax for supporting convenience and various usage condition, and hierarchy element names and common elements in semantics are needed. We also have looked at elements having various content rules and related standards. We hope that this study will be used as basic research material of metadata integrated management, data transform and schema matching for interoperability.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
또한 국내 메타데이터 주제의 연구 동향 대부분은 메타데이터 스키마에 대한 이론적 개념소개가 많아 상호운영 방식이나 품질 평가사례에 대한 연구가 필요하다[5]. 따라서 본 논문에서는 다양한 형식의 과학기술 학술 논문의 기술 메타데이터(이하 메타데이터)를 대상으로 비교 분석하여 통합 메타데이터의 설계나 상호운영을 위한 데이터 변환 시에 고려하여야 할 점에 대하여 살펴본다.
이를 위해서는 서로 다른 메타데이터 스키마로 표현되는 메타데이터의 통합 스키마의 정의, 데이터 변환, 스키마 매칭 등의 노력이 필요하다. 본 논문에서는 과학기술 학술논문에서의 여러 메타데이터를 조사하였다. 메타데이터의 의미구조, 내용규칙, 구문 등으로 나누어 분석하고 통합 스키마를 만들거나 데이터 변환을 할 때 고려하여야 할 점을 간략하게 살펴보았다.
제안 방법
메타데이터의 요소와 특정 목적을 위해 정의된 사용 규칙의 집합을 스키마 혹은 스킴이라고 하는데 본 논문에서는 스키마라는 용어를 사용하며, 메타데이터 스키마에서 명시할 수 있는 메타데이터의 세 측면인 의미구조와 내용 규칙, 구문을 따라 분석한 내용을 기술하였다[2].
본 논문에서는 과학기술 학술논문에서의 여러 메타데이터를 조사하였다. 메타데이터의 의미구조, 내용규칙, 구문 등으로 나누어 분석하고 통합 스키마를 만들거나 데이터 변환을 할 때 고려하여야 할 점을 간략하게 살펴보았다. 살펴본 바에 따르면, 관리 혹은 서비스의 목적에 따라 달라질 수는 있겠으나, 일반적으로 구문형태는 다수의 정보원이 사용하며 편리성과 다양한 사용 환경을 지원하는 XML을 사용하는 것이 더 포괄적인 것임을 알 수 있었다.
분석 대상은 전국 교육기관, 연구기관, 기업체 등의 기관을 대상으로 전자정보의 공동구매를 수행하고 있는 국가 컨소시엄인 KESLI(Korean Electronic Site License Initiative)의 이용자들이 가장 많이 구독하고 있거나 구독을 원하는 학술지를 출판하는 출판사(이하 정보원) 중 메타데이터가 제공되는 것과 구문이나 내용 규칙이 타 정보원과 많이 다른 정보원 몇 개를 합해 총 10개를 선정하였다. 참고로 같은 정보원에서 출판하는 학술지의 메타데이터는 대부분 동일하기 때문에 본 논문에서는 정보원을 기준으로 메타데이터를 분석한다.
대상 데이터
분석 대상은 전국 교육기관, 연구기관, 기업체 등의 기관을 대상으로 전자정보의 공동구매를 수행하고 있는 국가 컨소시엄인 KESLI(Korean Electronic Site License Initiative)의 이용자들이 가장 많이 구독하고 있거나 구독을 원하는 학술지를 출판하는 출판사(이하 정보원) 중 메타데이터가 제공되는 것과 구문이나 내용 규칙이 타 정보원과 많이 다른 정보원 몇 개를 합해 총 10개를 선정하였다. 참고로 같은 정보원에서 출판하는 학술지의 메타데이터는 대부분 동일하기 때문에 본 논문에서는 정보원을 기준으로 메타데이터를 분석한다.
조사한 정보원들의 대부분은 ISO639 코드나 USMARC 코드 등 표준 코드를 사용하고 있었다. 하지만 BioOne의 경우처럼 일부는 코드를 사용하지 않고 언어이름을 그대로 사용하는 경우도 있었다.
성능/효과
[표 8]과 [표 9]는 과학기술정보표준화위원회에서 조사한 권호 명칭의 다양한 표기 규칙들이다. 본 논문에서 조사한 정보원들의 메타데이터의 경우에는 요소명의 차이가 있기는 하였으나 비교적 권호 정보가 분리된 요소로 잘 표현되어 있으며, 표기규칙에서도 큰 차이는 없었다. [표 10]은 조사한 정보원들 중 일부의 권호 표기 규칙의 예이다.
후속연구
)와 같은 기호와 혼동되지 않도록 잘 선택하여야 한다. 또한 Nature의 예처럼 단체 저자는 새로운 요소를 만들어 표기할 것인지, 표기 규칙에 대한 정의도 필요할 것이다.
본 논문에서 조사한 과학기술 학술논문 메타데이터 분석 자료와 고려사항은 통합 메타데이터 스키마의 설계, 메타데이터 간의 데이터 변환을 위한 스키마 매핑작업인 크로스워크, 메타데이터 스키마 자동 매칭, 시맨틱 서비스를 위한 기초 연구 자료로 활용될 수 있을 것이다[16-19].
분류 요소를 사용할 경우에는 반드시 분류체계에 대한 정의가 선행되어야 하며, 권호 표기, 페이지 표기는 2004년 과학기술 정보표준화위원회에서 권고한 표준 표기방식을 준수하고 언어코드의 경우는 ISO639 국제 표준을 따르는 메타데이터를 설계하는 것이 좋을 것이다. 이러한 제안은 메타데이터 상호운영과 통합을 위한 여러 연구에 기초 자료로 사용하는데 도움이 될 것으로 기대한다. 향후 연구로는 본 논문의 자료를 토대로 통합관리와 상호운영에 있어서 반드시 필수적인 요소를 포함하고 내용 규칙과 의미구조를 통일한 통합 스키마의 설계를 할 예정이다.
이러한 제안은 메타데이터 상호운영과 통합을 위한 여러 연구에 기초 자료로 사용하는데 도움이 될 것으로 기대한다. 향후 연구로는 본 논문의 자료를 토대로 통합관리와 상호운영에 있어서 반드시 필수적인 요소를 포함하고 내용 규칙과 의미구조를 통일한 통합 스키마의 설계를 할 예정이다. 설계할 통합스키마에는 기술용 메타데이터뿐 만 아니라 원문이나 문헌에 포함된 이미지 등의 연계를 위하여 구조용 메타데이터도 포함할 계획이다.
질의응답
핵심어
질문
논문에서 추출한 답변
본 논문에서 따르기로 한 문헌정보의 메타데이터의 정의는?
통합 관리 및 분석 추출의 중요한 대상이 되는 문헌정보의 메타데이터는 사람에 따라 정의가 조금씩 다르나 본 논문에서는 ‘어떤 정보 자원에 관한 구조화된 정보를 의미하는 것’을 따르기로 한다[2]. 메타데이터는 기능적인 용도와 의도에 따라 기술용 메타데이터, 관리용 메타데이터, 구조용 메타데이터로 나뉘는데 관리용 메타데이터는 관리를 위하여 관리 기관 내부에서 사용하는 것이기 때문에 수집이 어려우며, 본 논문의 의도는 학술논문을 기술하는 메타데이터를 통합 관리 혹은 데이터 변환을 수행하기 위한 기초자료로 삼기 위한 것이기 때문에 관리 메타데이터와 구조 메타데이터는 본 논문에서 다루지 않는다
메타데이터는 기능적 용도와 의도에 따라 무엇으로 나뉘는가?
통합 관리 및 분석 추출의 중요한 대상이 되는 문헌정보의 메타데이터는 사람에 따라 정의가 조금씩 다르나 본 논문에서는 ‘어떤 정보 자원에 관한 구조화된 정보를 의미하는 것’을 따르기로 한다[2]. 메타데이터는 기능적인 용도와 의도에 따라 기술용 메타데이터, 관리용 메타데이터, 구조용 메타데이터로 나뉘는데 관리용 메타데이터는 관리를 위하여 관리 기관 내부에서 사용하는 것이기 때문에 수집이 어려우며, 본 논문의 의도는 학술논문을 기술하는 메타데이터를 통합 관리 혹은 데이터 변환을 수행하기 위한 기초자료로 삼기 위한 것이기 때문에 관리 메타데이터와 구조 메타데이터는 본 논문에서 다루지 않는다
메타데이터의 요소와 특정 목적을 위해 정의된 사용 규칙의 집합을 뜻하는 스키마의 구문은 무엇을 말하는가?
스키마의 구문은 메타데이터를 이루는 요소들을 어떻게 기계 가독 형식으로 인코딩해야 하는가를 말한다. 메타데이터를 다루기 위해 처리 시스템 내부적으로 표현하거나 저장하는 형태나 타 시스템과 상호교환하기위한 형식이다. XML이나 SGML과 같이 구문은 메타데이터의 의미구조와 얽혀 있는 채로 정의되는 경우도 있고, 스키마 자동 매칭이나 메타데이터 변환을 위한 파싱에서 사용되기도 한다.
참고문헌 (20)
http://www.ontotext.com/research/cubist
Priscilla Caplan, 오동근 역, 메타데이터의 이해, 태일사, 2004.
이경남, "전자기록의 장기적 보존을 위한 보존메타데이터 요소 분석", 기록학연구, 제14권, pp.191-240, 2006.
이혜진, 송인석, "효율적 정보자원 공유를 위한 서지 메타데이터 XML DTD 개발", 한국콘텐츠학회 종합학술대회 논문집, 제2권, 제2호, pp.427-433, 2004.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.