모든 분야에서 과학데이터의 생산 및 수집에 많은 비용과 시간이 소요되고 있으며, 또한 공유와 재활용 정도가 매우 낮은 실정이다. 학제간 연구를 지원하기 위해서는 대량으로 발생하고 있는 과학데이터가 체계적으로 보존 및 공유되어야 하며, 또한 반복할 수 없거나 반복하는데 많은 비용이 발생하는 실험 및 관찰 데이터의 보존과 재사용 및 활용 환경 구축이 필수적이다. 이에, 본 연구에서는 국가 과학데이터를 수집 저장 관리 공유 활용할 수 있는 서비스와 국가 R&D 관련 기관, 국제적인 과학기술 단체 및 기관과의 다양한 과학데이터 연동 인터페이스를 제안한다. 이를 통해, 현재 개발되어 있는 기존 과학 데이터베이스들의 활용성을 증대시키고 산업적 파급 효과가 높은 과학 데이터를 더욱 개발하여 국가 연구개발 활동을 지원하는 과학 데이터 인프라를 확충하는데 기여하고자 한다.
모든 분야에서 과학데이터의 생산 및 수집에 많은 비용과 시간이 소요되고 있으며, 또한 공유와 재활용 정도가 매우 낮은 실정이다. 학제간 연구를 지원하기 위해서는 대량으로 발생하고 있는 과학데이터가 체계적으로 보존 및 공유되어야 하며, 또한 반복할 수 없거나 반복하는데 많은 비용이 발생하는 실험 및 관찰 데이터의 보존과 재사용 및 활용 환경 구축이 필수적이다. 이에, 본 연구에서는 국가 과학데이터를 수집 저장 관리 공유 활용할 수 있는 서비스와 국가 R&D 관련 기관, 국제적인 과학기술 단체 및 기관과의 다양한 과학데이터 연동 인터페이스를 제안한다. 이를 통해, 현재 개발되어 있는 기존 과학 데이터베이스들의 활용성을 증대시키고 산업적 파급 효과가 높은 과학 데이터를 더욱 개발하여 국가 연구개발 활동을 지원하는 과학 데이터 인프라를 확충하는데 기여하고자 한다.
Production and collection of scientific data in all areas is costly and time consuming. The level of sharing and recycling of scientific data is also very low. In order to support interdisciplinary research, massive scientific data should be systematically preserved and shared. In addition, it is es...
Production and collection of scientific data in all areas is costly and time consuming. The level of sharing and recycling of scientific data is also very low. In order to support interdisciplinary research, massive scientific data should be systematically preserved and shared. In addition, it is essential to build an infrastructure to preserve and utilize the costly experiment and observation data. In this study, we propose a service that can collect, store, manage, share, and utilize national science data. It also suggests interfaces for various scientific data interactions with national R & D related organizations, international scientific and technological organizations and institutions. This will increase the availability of existing scientific databases that are currently being developed.
Production and collection of scientific data in all areas is costly and time consuming. The level of sharing and recycling of scientific data is also very low. In order to support interdisciplinary research, massive scientific data should be systematically preserved and shared. In addition, it is essential to build an infrastructure to preserve and utilize the costly experiment and observation data. In this study, we propose a service that can collect, store, manage, share, and utilize national science data. It also suggests interfaces for various scientific data interactions with national R & D related organizations, international scientific and technological organizations and institutions. This will increase the availability of existing scientific databases that are currently being developed.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
또한, 과학데이터 센터 간 IT 인프라스트럭처, 과학데이터를 공유·활용하기 위한 국가 과학데이터 플랫폼 기반의 과학데이터 연동 표준 인터페이스를 제시한다.
본 연구에서는 국가 과학데이터를 수집·저장·관리·공유·활용할 수 있는 서비스와 국가 R&D 관련 기관, 국제적인 과학기술 단체 및 기관과의 다양한 과학데이터 연동 인터페이스를 제안한다.
본 연구에서는 데이터 리파지터리로 글로벌하게 사용되고 있는 iRODS, Fedora Commons, Invenio 기반의 B2SHARE, Dataverse 공유·활용 플랫폼을 검토하였다.
제안 방법
또한, 서지레코드관리, 자동화된 레코드 품질체크, 수정 가능한 브라우징 기능을 포함한 대출 모듈, 데이터 셋 수집기능, 도서관 상호대차 프로세스를 지원하고, 연구 결과물의 획득, 보존 및 데이터셋, 분석코드, 가상머신 환경, 환경설정 및 지식정보를 수집한다. 브라우저 기반의 데이터 가상화 및 클라우드에 저장된 코드의 재실행 또한 지원한다.
이를 위해, 국가 과학데이터 플랫폼은 과학데이터 서비스, 플랫폼 및 인프라스트럭처의 3계층으로 구성하였고, 플랫폼 계층은 제공하는 기능의 공통성에 따라 연계, 데이터 관리, 플랫폼 관리 및 가상화 등 Fig. 7에서와 같이 4개의 프레임워크로 구성하였다.
성능/효과
내장되어 있는 메시징 프레임워크를 통해서 메시지 기반의 워크플로우 기능을 지원하고, 확장 가능한 워크플로우를 제공한다. WAR 파일을 서블릿 컨테이너에 추가함으로서 손쉽게 운영환경 구축이 가능하고, 여러 프로세스들을 리파지터리의 하나의 이벤트로 묶음으로써 일관성과 성능향상을 가져올 수 있으며, Fedora에 의존적이지 않은 Open RDF 형식으로 데이터를 반출할 수도 있다.
본 연구에서 분석한 플랫폼은 모두 오픈 소스로서 데이터 리파지터리를 구축하고자 하는 기관이 손쉽게 획득하여 설치가 가능하다. 구축하고자 하는 시스템의 목적과 최종적인 서비스 방향을 고려하여 소프트웨어를 선택하고 커스터마이징을 통해 데이터 리파지터리를 구축할 수 있을 것이다.
후속연구
PaaS의 경우, 과학데이터 어플리케이션 개발자와 관리자는 과학데이터 플랫폼 클라우드에 어플리케이션을 배포하고 관리하며, PaaS 플랫폼에 분산저장, 과학데이터 및 메타데이터 검색 기능을 포함하여야 한다. 끝으로, SaaS의 경우, 국가 과학데이터 플랫폼 서비스 이용자는 접근하는 과학데이터 플랫폼 및 이용자별 서비스 권한 현황에 따라 서로 다른 접근 가능한 UI 서비스를 제공받아야 하며, 이를 지원 하는 멀티테넌트 기능을 제공할 필요가 있다.
향후, 디지털 아카이빙 OAIS 참조모델에서 요구되는 기능적 요구사항들을 각 소프트웨어가 어떤 수준으로 구현하고 있는지? 어떤 방식으로 구현하고 있는지? 를 분석, 제시함으로써 기관의 환경에 적합한 데이터 리파지터리를 선정하는데 참고 자료로 활용될 수 있도록 보충이 필요하다.
향후, 디지털 아카이빙 OAIS 참조모델에서 요구되는 기능적 요구사항들을 각 소프트웨어가 어떤 수준으로 구현하고 있는지? 어떤 방식으로 구현하고 있는지? 를 분석, 제시함으로써 기관의 환경에 적합한 데이터 리파지터리를 선정하는데 참고 자료로 활용될 수 있도록 보충이 필요하다.
질의응답
핵심어
질문
논문에서 추출한 답변
iRODS의 특성과 사용 목적은 무엇인가?
iRODS(integrated Rule Oriented Data System)은 오픈 소스로 제공되고, 데이터 관리 소프트웨어로서 규모가 크고, 중요하고, 복잡한 데이터를 관리하고 있으며, 수백 개 기관이 자신들의 연구데이터를 관리하기 위해서 iRODS를 사용 중에 있다. iRODS는 수십억 개의 파일, 수백 페타바이트의 데이터를 관리하기 위해서 데이터 가상화, 데이터 복구, 워크플로우 자동화, 보안 협력과 같은 네 개의 주요 기능을 제공하고 있다[9,10].
연계 프레임워크가 고려해야할 2가지 측면은 무엇인가?
첫째, 연계 프레임워크는 2가지 측면을 고려하여야 한다. 우선 자체 비관리 기관의 경우, 국가 과학데이터 공유활용 플랫폼은 클라우드를 기반으로 하여 설계하고 있기 때문에 클라우드 관계에 따라 Inter/Intra 클라우드 연동규격을 기초로 하여 연계하여야 한다. 자체 관리기관의 경우, 자체 구축된 Legacy 시스템을 활용하여 과학데이터를 관리하는 기관과의 연계는 OAI-PMH(Open Archives Initiative Protocol for Metadata Harvesting)규격을 준용하여 연계하여야 한다.
iRODS가 제공하는 네 개의 주요 기능은 무엇인가?
iRODS(integrated Rule Oriented Data System)은 오픈 소스로 제공되고, 데이터 관리 소프트웨어로서 규모가 크고, 중요하고, 복잡한 데이터를 관리하고 있으며, 수백 개 기관이 자신들의 연구데이터를 관리하기 위해서 iRODS를 사용 중에 있다. iRODS는 수십억 개의 파일, 수백 페타바이트의 데이터를 관리하기 위해서 데이터 가상화, 데이터 복구, 워크플로우 자동화, 보안 협력과 같은 네 개의 주요 기능을 제공하고 있다[9,10].
참고문헌 (18)
S. H. Lee (2018). A Distributed Method for Efficient Analysis of Large-scale Scientific Data : Focusing on the Ocean Color Satellite Data, University of Seoul
J. M. Yoon. (2016) Policy direction for efficient management and utilization of scientific data, The Proceeding of Korea Technology Innovation Society, 521-531
S. H. Lee (2017). Research and Development on Governance System, Core Technologies and Applications for Scientific Data : KISTI
S. T. Kim. (2010). A Study on a Model for Using and Preserving Scientific Data. Journal of the Korean Biblia Society for Library and Information Science, 21(4), 81-93
S. U. Park. (2011) An Economic Ripple Effect Analysis of National Scientific Data Center Construction, Journal of information science theory and practice, 42(3), 55-69
S. H. Lee (2013). A Development on the Scientific Data Sharing and Utilizing System : KISTI
S. H. Lee (2011). A Study on Establishing the Scientific Data Management and Application Framework to Build Up the National Scientific Data Center : KISTI
Research Data Management Strategy Requirements. https://admire.jiscinvolve.org/wp/files/2013/05/ADMIRe-RDM-Repository-Strategy-Requirements.pdf
iRODS Technical Overview http://bit.ly/2dd7Yoa
iRODS Architecture http://bit.ly/2d02B8u
Introduction to Fedora 4 http://fedorarepository.org/presentations
B2Share http://bit.ly/2dHdTQX
B2Share on Invenio 3 http://bit.ly/2e9GDVE
Invenio Digital Library Framework http://invenio-software.org/
Dataverse http://dataverse.org/about
Dataverse Features http://dataverse.org/software-features
S. K. Kim et al.' (2016). A Study on the Development of Phased Big Data Distribution Model Based on Big Data Distribution Ecology, Journal of Digital Convergence, 95-106
H. S. Byeon. (2017). The Status and Suggestions for Big Data Adaptation in the Government and the Public Agency. Journal of Digital Convergence, 13-25.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.