이 연구에서는 국립중앙도서관이 구축 운영하는 웹 아카이브인 OASIS의 특성과 문제점을 살펴보았다. OASIS 웹 사이트를 통해 제공되는 웹 자원 콘텐츠의 현황을 검토하고, 향후 필요한 개선 방안을 제 안하였다. 이 연구를 위해 2009년 5월 20일부터 7월 2일 사이 OASIS 웹 사이트에서 '문학'과 '사회과학'분야의 콘텐츠 및 이용 가능한 서비스를 검토한 결과, 수집된 콘텐츠의 주제 분포의 편중, 저작자/발행자 편향성과 권위의 근거 미약, 정보의 유일성과 최신성 결여, 웹 문서와 웹 사이트의 중복 수집, 학술적가치의 근거 결여 등 문제점이 발견되었다. 주제전문가의 활용과 실명제, 메타데이터 요소 추가 및 기본적 목표의식의 지속적 확인 등이 필요함을 제안하였다.
이 연구에서는 국립중앙도서관이 구축 운영하는 웹 아카이브인 OASIS의 특성과 문제점을 살펴보았다. OASIS 웹 사이트를 통해 제공되는 웹 자원 콘텐츠의 현황을 검토하고, 향후 필요한 개선 방안을 제 안하였다. 이 연구를 위해 2009년 5월 20일부터 7월 2일 사이 OASIS 웹 사이트에서 '문학'과 '사회과학'분야의 콘텐츠 및 이용 가능한 서비스를 검토한 결과, 수집된 콘텐츠의 주제 분포의 편중, 저작자/발행자 편향성과 권위의 근거 미약, 정보의 유일성과 최신성 결여, 웹 문서와 웹 사이트의 중복 수집, 학술적가치의 근거 결여 등 문제점이 발견되었다. 주제전문가의 활용과 실명제, 메타데이터 요소 추가 및 기본적 목표의식의 지속적 확인 등이 필요함을 제안하였다.
The purpose of this research is to examine the characteristics and problems of OASIS, a web archive, developed and operated by the National Library of Korea, and then to propose how to improve the quality of its contents. An analysis of the contents in 'Literature' and 'Social Sciences' in the OASIS...
The purpose of this research is to examine the characteristics and problems of OASIS, a web archive, developed and operated by the National Library of Korea, and then to propose how to improve the quality of its contents. An analysis of the contents in 'Literature' and 'Social Sciences' in the OASIS website shows problems, including low quality of some contents, lack of balance in subjects and creators/publishers, duplicate collections of web documents and web sites, lack of currency and evidence of unique or scholarly value of collected web resources, etc. Suggested are the use of 'real-name' of subject specialists to ensure their responsibilities in selection process and the addition of metadata elements to evidence the appropriate application of selection criteria.
The purpose of this research is to examine the characteristics and problems of OASIS, a web archive, developed and operated by the National Library of Korea, and then to propose how to improve the quality of its contents. An analysis of the contents in 'Literature' and 'Social Sciences' in the OASIS website shows problems, including low quality of some contents, lack of balance in subjects and creators/publishers, duplicate collections of web documents and web sites, lack of currency and evidence of unique or scholarly value of collected web resources, etc. Suggested are the use of 'real-name' of subject specialists to ensure their responsibilities in selection process and the addition of metadata elements to evidence the appropriate application of selection criteria.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
김유승(2008)은 웹 아카이빙의 유형을 선택적, 복합적 및 전체 도메인 아카이빙의 세 개로 구분하고, 복합적 아카이빙을 채택한 대표적 기관으로서 프랑스 국립도서관의 사례를 검토하고, 더불어 OASIS에 대한 ‘비판적 분석’을 수행하였다. OASIS의 수집 범위, 방법, 품질의 측면에서 주제별 정보자원에 대한 수집이 적극적이지 못하며, 제한적이고 소극적인 수집에 머물고 있다는 점, 단일 웹 문서와 사이트의 정보량 차이가 크며, 수집된 웹 사이트가 만족스럽지 못한 수평적, 수직적 품질을 보인다는 점 등을 지적하였다. 연구자는 또한 OASIS가 국가 대표 아카이브로서 “가능한 한 가장 넓고 심도 깊은” 수집 범위 설정, 다양한 아카이빙 정책의 적용 및 타 기관과의 협력적 웹 아카이빙 전략 수립 등이 필요함을 제안하였다.
물론 이러한 개선방안이 앞서 지적한 여러 문제들에 대한 직접적이며 즉각적인 해결책은 아니다. 그러나 이미 설정해 놓은 자원 수집의 기준과 지침이 있는 만큼, 그 기준에 철저히 부합하는 웹 자원을 전문가 책임으로 선정하고, 이용자들도 납득하고 신뢰할 수 있는 수집 정보를 제시하라는 것이다. 처음부터 정해진 기준대로 웹 자원을 선정하고 검수한다면 품질문제가 생기지 않을 수 있다.
따라서 여기에서는 OASIS의 ‘자원 수집 기준’ 항목을 적용하여 그동안 관찰한 콘텐츠의 특성을 정리하는 데 초점을 맞추었다.
따라서 여기에서는 OASIS의 ‘자원 수집 기준’ 항목을 적용하여 그동안 관찰한 콘텐츠의 특성을 정리하는 데 초점을 맞추었다. 또한 이러한 연구 자체의 제한점을 감안하여 이후 OASIS 운영 주체인 국립중앙도서관이나 관련 기관에서 보다 체계적인 평가나 분석을 시행하는 데 도움이 될 수 있도록 현재 시점에서의 문제점을 기술하고 의견을 제시하였다.
이 연구는 OASIS 웹 사이트를 통해 제공되는 웹 자원 콘텐츠와 서비스의 현황과 특성을 살펴보고, 향후 국가 자산으로서 가치 있는 디지털 자원의 수집과 제공을 위해 필요한 개선 및 발전 방안을 제안하고자 하는 목적으로 수행되었다.
최근 이소연(2008)은 미국의 RLG와 국립기록관리관(NARA)이 제시한 디지털 아카이브의 평가도구인 “TRAC(Trustworthy Repositories Audit & Certification)”을 사용하여 OASIS를 검토한 바 있다. 이 연구는 국제적으로 인정된 평가도구의 기준에 따라 OASIS가 디지털 아카이브로서 웹 자원의 수집, 보존, 관리 등 전 단계에서 내부적으로 갖추어야 할 조건들을 분석한 것이다. 연구자는 OASIS의 조직 인프라(24개 영역), 디지털 객체관리(44개 영역), 기술 인프라(16개 영역)는 그 조직 및 기술 인프라 측면에 비하여 웹 자원의 장기 보존 기능을 포함한 객체 관리 인프라가 취약한 상태임을 지적하였다.
제안 방법
그 내용은 OASIS의 ‘자원 수집 지침’에서 제시된 ‘우리나라와의 관련성’ 그리고 ‘정보 자체의 특성’ 관련 항목인 저작자의 평판, 제공된 정보의 유일성, 학술적 내용, 정보의 최신성 등을 중심으로 서술하였다.
다케다는 이들을 반드시 “국가대표”라고 명시하지는 않았지만, 한국을 비롯하여 모두 열여덟 개 나라에서 대부분 국립도서관 혹은 국가대표도서관이 유지하는 것들을 살펴보았다.
이 연구를 위해 먼저 2009년 5월 20일부터 7월 2일 사이 OASIS 웹 사이트에서 ‘문학’과 ‘사회과학’ 분야의 웹 자원 콘텐츠에 관련된 특성을 검토하였고, 이를 10월 초에 다시 검토하여 변동 여부를 확인하였다.
이 연구에서는 김유승의 구분 방법을 차용하여 과 같이 ‘자원 수집 지침’의 내용을 구분하고 항목화 하였다.
대상 데이터
IIPC는 최초 회원은 12개국 기관이었 지만, 이후 웹 아카이빙을 수행하는 기타 도서관, 박물관, 아카이브, 문화유산기관 등으로 회원을 확대하였고, 2008년 3월 이들의 프로파일을 조사하였다. 이 조사에는 2008년 현재 39개 회원 기관 중 35개 기관이 응답하였고, 이들 가운데 국립도서관이 24개, 국립 아카이브가 1개 있었고, 그밖에는 다른 유형의 도서관, 대학, 박물관, 서비스 제공자, 기타 기관 등이 포함되었다. 이들의 웹 아카이빙 범위는 광범한 혹은 “대량 크로울링(bulk crawling)”(20.
성능/효과
5월 29일 당시 수집된 웹 사이트는 모두 257종이었다. 열 개 주제 가운데 기술과학 주제가 80종, 사회과학 주제가 76종으로 가장 많았고, 철학 주제가 3종, 언어 주제가 5종, 순수과학 주제가 6종만이 수집되어 있었다.
이 자료를 검색화면에서 별도로 제목으로 검색한 결과의 메타데이터에서는 수집 일자가 2006년 3월 14일임을 확인할 수 있었는데, 이 연구가 진행되는 2009년 6월의 시점에서 이미 3년 전에 수집된 웹 문서를 ‘최신자료’라고 보기엔 무리가 있다.
후속연구
연구자는 또한 OASIS가 국가 대표 아카이브로서 “가능한 한 가장 넓고 심도 깊은” 수집 범위 설정, 다양한 아카이빙 정책의 적용 및 타 기관과의 협력적 웹 아카이빙 전략 수립 등이 필요함을 제안하였다.
첫째, OASIS 콘텐츠 수집에 개입하는 사람들의 역할과 수준을 강화해야 하고, 그러기 위해 웹 자원 추천자 “실명제”를 시행할 필요가 있다.
질의응답
핵심어
질문
논문에서 추출한 답변
우리나라 국립중앙도서관의 OASIS는 어떤 프로젝트인가?
우리나라 국립중앙도서관의 OASIS(Online Archiving & Searching Internet Sources)는 이러한 맥락에서 “국가 지식자원의 수집과 보존 책임”을 가진 국가대표도서관이 “가치 있는 인터넷 자료를 국가적인 차원에서 수집․축적하여 미래 세대에 연구 자료로 제공과 온라인 디지털자원 수집 보존의 표준모델 연구 등에 그 목적을 두고” 추진한 프로젝트이다(국립중앙도서관 2009a). 국립중앙도서관은 OASIS 프로젝트를 위하여 2001년 11월 온라인 저작물 수 집․보존 시스템 ISP 및 시범시스템 개발을 시작으로 하여, 2005년 12월 1일 웹기반 OASIS 시스템 확장 및 개선 사업을 완료하였고, 2006년 2월 1일 OASIS 홈페이지 대국민 서비스를 실시하기 시작하였다.
TRAC는 어떤 도구인가?
최근 이소연(2008)은 미국의 RLG와 국립기록관리관(NARA)이 제시한 디지털 아카이브의 평가도구인 “TRAC(Trustworthy Repositories Audit & Certification)”을 사용하여 OASIS를 검토한 바 있다. 이 연구는 국제적으로 인정된 평가도구의 기준에 따라 OASIS가 디지털 아카이브로서 웹 자원의 수집, 보존, 관리 등 전 단계에서 내부적으로 갖추어야 할 조건들을 분석한 것이다.
본 논문에서 웹 아카이브인 OASIS에 관한 고찰을 통해 어떤 문제점이 발견되었는가?
OASIS 웹 사이트를 통해 제공되는 웹 자원 콘텐츠의 현황을 검토하고, 향후 필요한 개선 방안을 제 안하였다. 이 연구를 위해 2009년 5월 20일부터 7월 2일 사이 OASIS 웹 사이트에서 '문학'과 '사회과학'분야의 콘텐츠 및 이용 가능한 서비스를 검토한 결과, 수집된 콘텐츠의 주제 분포의 편중, 저작자/발행자 편향성과 권위의 근거 미약, 정보의 유일성과 최신성 결여, 웹 문서와 웹 사이트의 중복 수집, 학술적가치의 근거 결여 등 문제점이 발견되었다. 주제전문가의 활용과 실명제, 메타데이터 요소 추가 및 기본적 목표의식의 지속적 확인 등이 필요함을 제안하였다.
참고문헌 (24)
국립중앙도서관. 2009. 2008 국립중앙도서관연보. 서울: 국립중앙도서관.
국립중앙도서관. 2009a. "OASIS 소개. 개요." [online]. [cited 2009.5.22]. .
국립중앙도서관. 2009b. "OASIS 소개. 수집보존프로세스." [online]. [cited 2009.5.30]. .
국립중앙도서관. 2009c. "OASIS 소개. 추진경과." [online]. [cited 2009.5.22]. .
김유승. 2007. 웹 아카이빙의 법?제도적 문제에 대한 고찰: 웹 정보자원의 특성을 중심으로. 한국문헌정보학회지, 41(3): 5-24.
이혜원. 2004. 온라인 디지털 자원 구축 사례: 국립중앙도서관을 중심으로. 서울: 국립중앙도서관.
최원태. 2005. 디지털유산 보존과 국가대표도서관의 정책방안. 서울: 국립중앙도서관.
Day, Michael. 2003. "Preserving the Fabric of Our Lives: A Survey of Web Preservation Initiatives." [online]. [cited 2009.6.12]. .
Evans, G. Edward, & Saponaro, Margaret Z. 2000. Developing Library and Information Center Collections. 4th Edition. Greenwood Village, Colorado: Libraries Unlimited.
Grotke, Abbie. 2008. International Internet Preservation Consortium: 2008 Member Profile Survey Results.. Canberra: The National Library of Australia.
Kent, Allen, et al. 1979. Use of Library Materials: The University of Pittsburgh Study. New York: Marcel Dekker, Inc.
Library of Congress. 2009. "Web Capture." [online]. [cited 2009.6.8]. .
Library of Congress Web Archives. 2009. "Minerva." [online]. [cited 2009.5.30]. /lcwa-home.html>.
Lyman, P. 2002. "Archiving the World Wide Web." In: Building a National Strategy for Digital Preservation. Council on Library and Information Resources and Library of Congress., 38-51. [online]. [cited 2009.6.12]. .
National Library of Australia and Partners. 2009a. "PANDORA. Australia's Web Archive. PANDORA Overview." [online]. [cited 2009.5.30]. .
National Library of Australia and Partners. 2009b. "PANDORA. Australia's Web Archive. PANDORA Archive Size and Monthly Growth." [online]. [cited 2009.5.30]. .
National Library of Australia and Partners. 2009c. "PANDORA. Australia's Web Archive. Selection Guidelines." [online]. [cited 2009.5.30]. .
UNESCO. 2003. "Guidelines for the Preservation of Digital Heritage." [online]. [cited 2009.6.12]. .
※ AI-Helper는 부적절한 답변을 할 수 있습니다.