본 연구의 목적은 국내 학술논문에 나타나는 저자명, 단체명, 학술지명 전거데이터 구조를 FRAD 개념 모형을 적용하여 설계하는데 있다. 학술정보에는 정보의 접근점이 되는 저자, 소속기관, 발행기관, 학술지 및 회의명과 같은 개체를 포함하고 있을 뿐만 아니라 이들 개체들간 여러 관계들이 존재하고 있다. FRAD 개념 모형에 따른 학술정보 전거데이터의 표현을 통해 학술정보의 체계적인 관리 및 정확한 정보 검색, 그리고 다양한 형태의 지식 표현이 가능할 것으로 판단된다. 본 연구에서 설계된 개체-관계형 학술정보 전거데이터는 학술문서와 연계되며, 개체 식별을 위한 여러 속성 정보 및 관계 정보를 포함한다.
본 연구의 목적은 국내 학술논문에 나타나는 저자명, 단체명, 학술지명 전거데이터 구조를 FRAD 개념 모형을 적용하여 설계하는데 있다. 학술정보에는 정보의 접근점이 되는 저자, 소속기관, 발행기관, 학술지 및 회의명과 같은 개체를 포함하고 있을 뿐만 아니라 이들 개체들간 여러 관계들이 존재하고 있다. FRAD 개념 모형에 따른 학술정보 전거데이터의 표현을 통해 학술정보의 체계적인 관리 및 정확한 정보 검색, 그리고 다양한 형태의 지식 표현이 가능할 것으로 판단된다. 본 연구에서 설계된 개체-관계형 학술정보 전거데이터는 학술문서와 연계되며, 개체 식별을 위한 여러 속성 정보 및 관계 정보를 포함한다.
In this study, we proposed the FRAD concept model of authority data schema for author, organization and journal titles included in the academic papers. Academic information includes author names, affiliations, publishers, journals and conferences. They are used as access points, and there are multip...
In this study, we proposed the FRAD concept model of authority data schema for author, organization and journal titles included in the academic papers. Academic information includes author names, affiliations, publishers, journals and conferences. They are used as access points, and there are multiple relationships among these entities. It is expected that the use of authority data for academic information based on FRAD conceptual model could improve more accurate retrieval of information, systematic management of academic information, and various forms of knowledge representation. In this study, our entity-relationship authority data will be linked to the document, and included the several properties and relationship to identify the object.
In this study, we proposed the FRAD concept model of authority data schema for author, organization and journal titles included in the academic papers. Academic information includes author names, affiliations, publishers, journals and conferences. They are used as access points, and there are multiple relationships among these entities. It is expected that the use of authority data for academic information based on FRAD conceptual model could improve more accurate retrieval of information, systematic management of academic information, and various forms of knowledge representation. In this study, our entity-relationship authority data will be linked to the document, and included the several properties and relationship to identify the object.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
기존의 전거데이터 관련 연구들이 전거통제의 통일된 규칙, 기 구축된 전거데이터의 효율적인 공유·협력 방안에 대한 연구였다면, 이 연구는 학술논문에 나타난 저자명을 대상으로 실제적인 전거데이터를 구축하여 학술논문 메타데이터와 전거데이터와의 연결을 통한 검색의 효율성을 제고하는데 목적을 두었다.
본 장에서는 학술논문 저자명, 단체명, 학술지명 전거데이터를 구성하기 위해 본 연구 범위와 관련된 FRAD 개체, 속성, 관계에 대해 살펴보고자 한다.
이에 본 연구에서는 국내에서 발간되는 학술논문들을 체계적으로 조직, 구성하고 학술논문검색의 정확성을 제고하기 위해 FRAD 기반의 학술정보 전거데이터의 구조를 설계하였다.
제안 방법
4.1절의 학술논문 전거데이터 구성 요소 및 관계를 기반으로 하여 와 같이 저자명 전거데이터 구조를 설계하였다.
본 연구의 목적을 위한 연구 방법은 학술논문 전거데이터 구조 설계를 위해 학술정보 전거데이터 구축 연구 사례를 문헌을 통해 분석하고, FRAD의 개념 모형을 분석하였다. 관련 연구를 토대로 학술정보에서 도출할 수 있는 전거 개체와 관계를 도출하고 이를 FRAD 개념 모형을 참고하여 학술정보 전거데이터 구조와 관계를 설정하였다.
이러한 문제로 인해 이석형(2010)은 학술논문의 서지정보와 전거데이터가 직접 연결된 형태의 저자명 전거데이터 구축 방안을 제안하였다. 국내 학술논문에 나타난 저자명을 대상으로 전거데이터를 구축하기 위한 저자명 식별 요소를 정의하고 이에 따른 저자명 전거데이터 구축 시스템을 설계하였다. 기존의 전거데이터 관련 연구들이 전거통제의 통일된 규칙, 기 구축된 전거데이터의 효율적인 공유·협력 방안에 대한 연구였다면, 이 연구는 학술논문에 나타난 저자명을 대상으로 실제적인 전거데이터를 구축하여 학술논문 메타데이터와 전거데이터와의 연결을 통한 검색의 효율성을 제고하는데 목적을 두었다.
하지만, 구축된 전거데이터를 효과적으로 표현하고, 서론에서 언급한 연구 정보 서비스에 효율적으로 활용하기 위해서는 학술논문 전거 데이터에 대한 구조를 명확히 설계하여 학술정보의 다양한 요소를 표현할 수 있어야 한다. 따라서 본 연구에서는 학술정보 전거데이터 설계의 주안점을 전거데이터 생성규칙의 일관된 적용과 구축된 전거데이터의 공유 및 활용성 극대화에 초점을 맞추었다.
학술논문 전거데이터 스키마에는 저자명, 단체명, 학술지명을 표현하는 다양한 이름들에 대한 형식과 관계를 표현하고 있으며, 각 개체의 인스턴스들은 유일한 식별자를 가진다. 또한, FRAD 개념 모형에서 정의된 범주 1, 범주 2, 범주 3의 관계 유형을 지원하고자 하였다.
이 연구에서 학술정보 전거DB시스템은 기본적으로 서지정보, 전거정보, 소장정보, 연속간행물정보를 기본으로 한 학술정보종합관리시스템의 서브시스템으로 구성되어야 한다고 제안하였다. 또한, 이름전거와 주제전거의 성격이 상당히 다르다는 점에서, 전거 시스템 내에서도 이름전거DB와 주제전거DB도 별도 시스템으로 분리하는 것이 바람직하며, 이름 전거를 우선 구축하고 주제전거를 단계적으로 추진하는 접근법을 제안하였다.
본 연구에서는 학술정보를 체계적으로 조직, 구성하고 학술정보 검색의 정확률을 향상시킬수 있는 학술정보 저자명, 단체명, 학술지명 전거데이터 구조를 FRAD 개념 모형을 적용하여 설계하였다.
본 연구의 목적을 위한 연구 방법은 학술논문 전거데이터 구조 설계를 위해 학술정보 전거데이터 구축 연구 사례를 문헌을 통해 분석하고, FRAD의 개념 모형을 분석하였다. 관련 연구를 토대로 학술정보에서 도출할 수 있는 전거 개체와 관계를 도출하고 이를 FRAD 개념 모형을 참고하여 학술정보 전거데이터 구조와 관계를 설정하였다.
본 장에서는 관련 연구를 토대로 FRAD 개념 모형을 참고하여 학술논문 전거데이터 구조를 설계하고 그 관계를 설정하였다. 본 연구에서 학술논문 전거데이터 구조의 형식은 LC의 MADS 2.
본 학술논문 전거데이터 구조의 큰 특징은 전거데이터 구축시 동일 개체를 정확히 직관적으로 판단할 수 있는 근거를 제공하고 전거데이터를 활용한 학술정보 서비스에서 이용자의 편의성을 고려하여 저자명, 단체명, 학술지명 전거레코드 간 관계를 설정하여 전거데이터를 구조화하였다는 점이다. 전거형과 이형명의 구분을 두었지만 식별코드체계 기반으로 전거레코드를 구성하여 전거형 및 이형명 패턴 중 하나의 패턴으로 정보를 탐색하더라도 모든 유형을 제시할 수 있도록 이름 구조에도 관계를 설정하였다.
한국교육학술정보원(2000)에서는 학술정보전거DB시스템의 개발과 구축을 위한 방안을 연구하였다. 이 연구에서 학술정보 전거DB시스템은 기본적으로 서지정보, 전거정보, 소장정보, 연속간행물정보를 기본으로 한 학술정보종합관리시스템의 서브시스템으로 구성되어야 한다고 제안하였다. 또한, 이름전거와 주제전거의 성격이 상당히 다르다는 점에서, 전거 시스템 내에서도 이름전거DB와 주제전거DB도 별도 시스템으로 분리하는 것이 바람직하며, 이름 전거를 우선 구축하고 주제전거를 단계적으로 추진하는 접근법을 제안하였다.
기존의 전거데이터 관련 연구들이 전거통제의 통일된 규칙, 기 구축된 전거데이터의 효율적인 공유·협력 방안에 대한 연구였다면, 이 연구는 학술논문에 나타난 저자명을 대상으로 실제적인 전거데이터를 구축하여 학술논문 메타데이터와 전거데이터와의 연결을 통한 검색의 효율성을 제고하는데 목적을 두었다. 이에 따라 시간과 노력이 많이 드는 전거데이터의 구축을 위해 대용량의 학술논문으로부터 저자명 전거데이터를 효율적으로 소급 구축하고, 정기적으로 발간되는 학술지 논문에서 저자명 전거데이터를 갱신하는데 필요한 전거데이터 구축 시스템을 제안하였다.
이에 본 연구에서는 저자명, 단체명, 학술지명 전거레코드간 관계를 와 같이 설정하여 전거데이터의 구조를 설계하였다.
이형명 ‘[variant]'의 ‘lang'과 ‘type' 속성값에 기술언어와 이형명 형태를 정의하여 여러 이형명을 포함할 수 있도록 하였다.
학술정보 전거DB의 구축 및 유지 관리를 위해서 우선 서울대, 연세대, 이화여대 도서관에서 구축하고 있는 이름전거 데이터베이스를 소급하여 구축하고 신규입력전거레코드를 임시전거파일에 등록 후 검증과정을 통해 전거DB에 편입하도록 제시하였다. 전거레코드 설계와 관련하여 전거데이터 구조는 전거통제용 KORMARC 포멧으로 기술하도록 하였으며 한국표준전거데이터번호 등을 고려할 것을 제안하였다.
본 학술논문 전거데이터 구조의 큰 특징은 전거데이터 구축시 동일 개체를 정확히 직관적으로 판단할 수 있는 근거를 제공하고 전거데이터를 활용한 학술정보 서비스에서 이용자의 편의성을 고려하여 저자명, 단체명, 학술지명 전거레코드 간 관계를 설정하여 전거데이터를 구조화하였다는 점이다. 전거형과 이형명의 구분을 두었지만 식별코드체계 기반으로 전거레코드를 구성하여 전거형 및 이형명 패턴 중 하나의 패턴으로 정보를 탐색하더라도 모든 유형을 제시할 수 있도록 이름 구조에도 관계를 설정하였다.
학술정보 전거DB의 구축 및 유지 관리를 위해서 우선 서울대, 연세대, 이화여대 도서관에서 구축하고 있는 이름전거 데이터베이스를 소급하여 구축하고 신규입력전거레코드를 임시전거파일에 등록 후 검증과정을 통해 전거DB에 편입하도록 제시하였다. 전거레코드 설계와 관련하여 전거데이터 구조는 전거통제용 KORMARC 포멧으로 기술하도록 하였으며 한국표준전거데이터번호 등을 고려할 것을 제안하였다.
대상 데이터
본 연구에서 전거데이터 구조 설계 범위는 FRAD 개념 모형에서 개인에 해당하는 저자명, 단체에 해당하는 저자소속기관 및 출판사, 학회명에 대한 단체명 그리고, 저작, 표현형, 구현형, 개별자료에 해당하는 학술지 및 회의자료에 대한 학술지명 개체를 대상으로 한다.
본 연구의 전거데이터 구조 설계 범위는 FRAD 개념 모형에서 개인에 해당하는 저자명, 단체에 해당하는 저자소속기관 및 출판사, 학회명에 대한 단체명 그리고, 저작, 표현형, 구현형, 개별자료에 해당하는 학술지 및 회의자료에 대한 학술지명 개체를 대상으로 하였다. 학술논문 전거데이터 스키마에는 저자명, 단체명, 학술지명을 표현하는 다양한 이름들에 대한 형식과 관계를 표현하고 있으며, 각 개체의 인스턴스들은 유일한 식별자를 가진다.
저자명 전거데이터는 학술논문의 저자를 대상으로 구성하며, 단체명 전거데이터는 출판사명 및 학회명, 소속기관명을 대상으로 구성한다. 저자소속기관은 저자명 전거데이터의 속성 값으로 저자명 식별을 위한 요소로 활용되는데 (이석형 2010), 이들 소속기관에 대해서도 전거 데이터를 구축하여 활용한다면 저자 식별에 좀더 정확성을 기할 수 있기 때문에 단체명 전거 데이터로 구성할 수 있다.
이론/모형
FRAD는 FRBR, GARR(Guidelines for Authority Records and References), UNIMARC/ Authorities(Universal MARC Authorities), MLAR(Minimal Level Authority Record), ISAAR-CPF(International Standard Archival Authority Record for Corporate Bodies, Persons, and Families)와 같은 전거데이터 표준을 기반으로 하였다.
FRAD는 향후 전거데이터를 기술하고 공유하기 위한 기본 개념으로 활용될 것으로 판단된다. 따라서, 본 연구에서는 학술논문전거데이터를 효과적으로 표현하고 활용할 수 있도록 개체 관계형으로 구성하기 위해 FRAD 개념 모형을 적용하였다.
본 장에서는 관련 연구를 토대로 FRAD 개념 모형을 참고하여 학술논문 전거데이터 구조를 설계하고 그 관계를 설정하였다. 본 연구에서 학술논문 전거데이터 구조의 형식은 LC의 MADS 2.0(Metadata Authority Description Schema)4)을 이용하였다. MADS는 도서관에서 다양한 자원들을 기술하기 위한 XML 형식의 MODS(Metadata Object Description Schema)를 기반으로 전거데이터를 기술하기 위한 형식이다.
성능/효과
학술정보 전거데이터의 저자명 간의 관계인 협력관계는 FRAD 개념 모형의 합작관계와 상당히 유사한 개념을 갖는다. 또한 저자명과 단체명, 단체명과 단체명, 저자명과 학술지명, 단체명과 학술지명의 관계는 FRAD의 관계 모형과 일치하는 것으로 판단된다. 필명관계, 세속 관계, 종교적관계, 공직관계, 형제관계 등은 학술정보에서 확인하기 어려운 관계 유형이기 때문에 학술정보 전거데이터 관계에는 존재하지 않는다.
후속연구
도서관 분야에서는 전거데이터 교환 및 공유를 위한 관련 규칙과 포맷의 표준화 노력을 기울여왔는데, 그 결과 IFLA에서는 FRBR 개념을 전거데이터로 확장한 ‘전거데이터의 기능상의 요건(Functional Requirements for Author-ity Records, 이하 FRAD)’ 최종보고서(IFLA Working Group on FRANAR 2009)를 2009년에 발표하였다. FRAD는 향후 전거데이터를 기술하고 공유하기 위한 기본 개념으로 활용될 것으로 판단된다. 따라서, 본 연구에서는 학술논문전거데이터를 효과적으로 표현하고 활용할 수 있도록 개체 관계형으로 구성하기 위해 FRAD 개념 모형을 적용하였다.
대용량의 학술정보에 대한 전거데이터를 신속하게 구축하기 위해서는 전거데이터 구성시 개체 식별 알고리즘을 통한 시스템 전처리 단계의 역할이 중요한데 이 알고리즘의 성능 향상을 위한 연구가 필수적이라 판단된다. 또한, 본 연구의 FRAD 기반의 학술정보 전거데이터가 좀 더 효율적으로 활용되기 위해서는 학술정보에 대한 FRBR 모형 적용에 관한 세밀한 연구가 필요할 것이다.
향후 연구과제로는 학술정보 전거데이터 구축 시간과 노력을 단축하기 위한 전거데이터 자동화 구축 방안과 전거데이터 기반의 학술정보서비스 모형의 정립이 필요하다. 대용량의 학술정보에 대한 전거데이터를 신속하게 구축하기 위해서는 전거데이터 구성시 개체 식별 알고리즘을 통한 시스템 전처리 단계의 역할이 중요한데 이 알고리즘의 성능 향상을 위한 연구가 필수적이라 판단된다.
질의응답
핵심어
질문
논문에서 추출한 답변
전거통제는 무엇을 통하여 검색의 효율성을 제고시키는가?
전거통제는 전통적인 목록에서 표목(head-ing) 또는 접근점(access point), 즉 저자명과 단체명, 지명, 총서명, 통일서명, 주제명 등의 일관성과 통일성을 유지시킴으로써, 검색의 효율성을 제고시키기 위한 기법을 바탕으로 한다. 전거통제의 중심 개념인 기본 표목은 개별 자료들이 담고 있는 저작을 식별하고 특정 저자의 저작들을 집중하는 기능을 수행했으므로 전거 통제가 얼마나 잘 이루어져 있느냐 하는 것은 전통적인 목록 시스템이나 지식정보 시스템에서의 정보 관리 및 검색 효율성을 직접적으로 좌우하는 결정적인 요인이 된다(오동근 2000).
저자명․단체명 등을 고유한 개체로 식별하는 것은 어떤 측면에서 중요한가?
일련의 지식정보 처리과정에서 지식정보의 근거가 될 수 있는 출처 정보를 식별하는 단계, 즉 저자명․단체명 등을 고유한 개체로 식별하는 것은 이용자의 정보 접근 측면 뿐 아니라 정보 조직 및 관리의 측면에서 매우 중요하다고할 수 있다. 인터넷을 통한 학술정보, 뉴스, 웹문서와 같은 정보검색에서 사용되는 질의어 중 저자명과 같은 개체명이 차지하는 비율이 모든 검색엔진 질의어의 약 30% 이상을 차지하고 있다는 연구결과(R.
도서관 소장목록을 대상으로 한 전거통제와 관련된 연구 및 사례가 문헌정보학계를 중심으로 많이 이루어지는 근거는 무엇인가?
도서관에서의 전거통제는 일반적으로 목록 레코드에 대해 저작의 접근점이 되는 동일 개체에 대한 표목과 다양한 형식의 표목들을 연결하는 수단이 된다. 따라서, 목록레코드를 기술하는 형식인 카드목록이나 MARC와 같은 자동화목록으로 구성된 대부분의 도서관 소장목록을 대상으로 한 전거통제와 관련된 연구 및 사례는 문헌정보학계를 중심으로 많이 이루어지고 있다.
참고문헌 (20)
김미향. 2009. 기관 리포지터리의 검색기능 향상을 위한 인명 접근점제어 시스템 구축 연구. 박사학위논문, 연세대학교 대학원, 문헌정보학과.
이성숙. 2005. FRBR 모형의 수용에 관한 연구. 박사학위논문, 연세대학교 대학원, 문헌정보학과.
한국교육학술정보원. 2000. 학술정보 전거DB 시스템의 개발과 구축에 관한 연구. 서울: 한국교육학술정보원.
American Library Association, & Association of College and Research Libraries. 1995. "Standards for college libraries, 1995 ed." College and Research Libraries News, 56(4): 256.
Burger, Robert H. 1985. Authority Work: The Creation, Use, Maintenance, and Evaluation of Authority Records and Files. Littleton, Colorado: Libraries Unlimited
박하영. 2004. 접근 제어 레코드 형식 구축을 위한 XML 스키마 개발에 관한 연구. 석사학위논문, 연세대학교 대학원, 2004.
IFLA Working Group on FRANAR. 2009. "Functional requirements for authority data. A conceptual model." Final Reports. UBCIM publications. Munchen: K.G. Saur.
Blume, Matthias. 2005. "Automatic entity disambiguation: Benefits to NER, relation extraction, link analysis, and inference." International Conference on Intelligence Analysis.
Guha, R. V., & Garg, A. 2004. "Disambiguating people in search." Proceedings of the 13th World Wide Web Conference Series. [New York]: ACM Press.
Library of Congress. 2001. MARC21 Concise Format for Authority Data. [online]. [cited 2011.7.1]. .
※ AI-Helper는 부적절한 답변을 할 수 있습니다.