[논문]국가 과학데이터 공유·활용 서비스를 위한 사례 연구

진영근; 이원구

doi:10.15207/jkcs.2018.9.8.009

초록
AI-Helper

모든 분야에서 과학데이터의 생산 및 수집에 많은 비용과 시간이 소요되고 있으며, 또한 공유와 재활용 정도가 매우 낮은 실정이다. 학제간 연구를 지원하기 위해서는 대량으로 발생하고 있는 과학데이터가 체계적으로 보존 및 공유되어야 하며, 또한 반복할 수 없거나 반복하는데 많은 비용이 발생하는 실험 및 관찰 데이터의 보존과 재사용 및 활용 환경 구축이 필수적이다. 이에, 본 연구에서는 국가 과학데이터를 수집 저장 관리 공유 활용할 수 있는 서비스와 국가 R&D 관련 기관, 국제적인 과학기술 단체 및 기관과의 다양한 과학데이터 연동 인터페이스를 제안한다. 이를 통해, 현재 개발되어 있는 기존 과학 데이터베이스들의 활용성을 증대시키고 산업적 파급 효과가 높은 과학 데이터를 더욱 개발하여 국가 연구개발 활동을 지원하는 과학 데이터 인프라를 확충하는데 기여하고자 한다.

Abstract ▼ AI-Helper

Production and collection of scientific data in all areas is costly and time consuming. The level of sharing and recycling of scientific data is also very low. In order to support interdisciplinary research, massive scientific data should be systematically preserved and shared. In addition, it is es...

Production and collection of scientific data in all areas is costly and time consuming. The level of sharing and recycling of scientific data is also very low. In order to support interdisciplinary research, massive scientific data should be systematically preserved and shared. In addition, it is essential to build an infrastructure to preserve and utilize the costly experiment and observation data. In this study, we propose a service that can collect, store, manage, share, and utilize national science data. It also suggests interfaces for various scientific data interactions with national R & D related organizations, international scientific and technological organizations and institutions. This will increase the availability of existing scientific databases that are currently being developed.

주제어

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

또한, 과학데이터 센터 간 IT 인프라스트럭처, 과학데이터를 공유·활용하기 위한 국가 과학데이터 플랫폼 기반의 과학데이터 연동 표준 인터페이스를 제시한다.
본 연구에서는 국가 과학데이터를 수집·저장·관리·공유·활용할 수 있는 서비스와 국가 R&D 관련 기관, 국제적인 과학기술 단체 및 기관과의 다양한 과학데이터 연동 인터페이스를 제안한다.
본 연구에서는 데이터 리파지터리로 글로벌하게 사용되고 있는 iRODS, Fedora Commons, Invenio 기반의 B2SHARE, Dataverse 공유·활용 플랫폼을 검토하였다.

제안 방법

또한, 서지레코드관리, 자동화된 레코드 품질체크, 수정 가능한 브라우징 기능을 포함한 대출 모듈, 데이터 셋 수집기능, 도서관 상호대차 프로세스를 지원하고, 연구 결과물의 획득, 보존 및 데이터셋, 분석코드, 가상머신 환경, 환경설정 및 지식정보를 수집한다. 브라우저 기반의 데이터 가상화 및 클라우드에 저장된 코드의 재실행 또한 지원한다.
이를 위해, 국가 과학데이터 플랫폼은 과학데이터 서비스, 플랫폼 및 인프라스트럭처의 3계층으로 구성하였고, 플랫폼 계층은 제공하는 기능의 공통성에 따라 연계, 데이터 관리, 플랫폼 관리 및 가상화 등 Fig. 7에서와 같이 4개의 프레임워크로 구성하였다.

성능/효과

내장되어 있는 메시징 프레임워크를 통해서 메시지 기반의 워크플로우 기능을 지원하고, 확장 가능한 워크플로우를 제공한다. WAR 파일을 서블릿 컨테이너에 추가함으로서 손쉽게 운영환경 구축이 가능하고, 여러 프로세스들을 리파지터리의 하나의 이벤트로 묶음으로써 일관성과 성능향상을 가져올 수 있으며, Fedora에 의존적이지 않은 Open RDF 형식으로 데이터를 반출할 수도 있다.
본 연구에서 분석한 플랫폼은 모두 오픈 소스로서 데이터 리파지터리를 구축하고자 하는 기관이 손쉽게 획득하여 설치가 가능하다. 구축하고자 하는 시스템의 목적과 최종적인 서비스 방향을 고려하여 소프트웨어를 선택하고 커스터마이징을 통해 데이터 리파지터리를 구축할 수 있을 것이다.

후속연구

PaaS의 경우, 과학데이터 어플리케이션 개발자와 관리자는 과학데이터 플랫폼 클라우드에 어플리케이션을 배포하고 관리하며, PaaS 플랫폼에 분산저장, 과학데이터 및 메타데이터 검색 기능을 포함하여야 한다. 끝으로, SaaS의 경우, 국가 과학데이터 플랫폼 서비스 이용자는 접근하는 과학데이터 플랫폼 및 이용자별 서비스 권한 현황에 따라 서로 다른 접근 가능한 UI 서비스를 제공받아야 하며, 이를 지원 하는 멀티테넌트 기능을 제공할 필요가 있다.
향후, 디지털 아카이빙 OAIS 참조모델에서 요구되는 기능적 요구사항들을 각 소프트웨어가 어떤 수준으로 구현하고 있는지? 어떤 방식으로 구현하고 있는지? 를 분석, 제시함으로써 기관의 환경에 적합한 데이터 리파지터리를 선정하는데 참고 자료로 활용될 수 있도록 보충이 필요하다.
향후, 디지털 아카이빙 OAIS 참조모델에서 요구되는 기능적 요구사항들을 각 소프트웨어가 어떤 수준으로 구현하고 있는지? 어떤 방식으로 구현하고 있는지? 를 분석, 제시함으로써 기관의 환경에 적합한 데이터 리파지터리를 선정하는데 참고 자료로 활용될 수 있도록 보충이 필요하다.

질의응답

핵심어	질문	논문에서 추출한 답변
	iRODS의 특성과 사용 목적은 무엇인가?	iRODS(integrated Rule Oriented Data System)은 오픈 소스로 제공되고, 데이터 관리 소프트웨어로서 규모가 크고, 중요하고, 복잡한 데이터를 관리하고 있으며, 수백 개 기관이 자신들의 연구데이터를 관리하기 위해서 iRODS를 사용 중에 있다. iRODS는 수십억 개의 파일, 수백 페타바이트의 데이터를 관리하기 위해서 데이터 가상화, 데이터 복구, 워크플로우 자동화, 보안 협력과 같은 네 개의 주요 기능을 제공하고 있다[9,10].
	연계 프레임워크가 고려해야할 2가지 측면은 무엇인가?	첫째, 연계 프레임워크는 2가지 측면을 고려하여야 한다. 우선 자체 비관리 기관의 경우, 국가 과학데이터 공유활용 플랫폼은 클라우드를 기반으로 하여 설계하고 있기 때문에 클라우드 관계에 따라 Inter/Intra 클라우드 연동규격을 기초로 하여 연계하여야 한다. 자체 관리기관의 경우, 자체 구축된 Legacy 시스템을 활용하여 과학데이터를 관리하는 기관과의 연계는 OAI-PMH(Open Archives Initiative Protocol for Metadata Harvesting)규격을 준용하여 연계하여야 한다.
	iRODS가 제공하는 네 개의 주요 기능은 무엇인가?	iRODS(integrated Rule Oriented Data System)은 오픈 소스로 제공되고, 데이터 관리 소프트웨어로서 규모가 크고, 중요하고, 복잡한 데이터를 관리하고 있으며, 수백 개 기관이 자신들의 연구데이터를 관리하기 위해서 iRODS를 사용 중에 있다. iRODS는 수십억 개의 파일, 수백 페타바이트의 데이터를 관리하기 위해서 데이터 가상화, 데이터 복구, 워크플로우 자동화, 보안 협력과 같은 네 개의 주요 기능을 제공하고 있다[9,10].

참고문헌 (18)

S. H. Lee (2018). A Distributed Method for Efficient Analysis of Large-scale Scientific Data : Focusing on the Ocean Color Satellite Data, University of Seoul
J. M. Yoon. (2016) Policy direction for efficient management and utilization of scientific data, The Proceeding of Korea Technology Innovation Society, 521-531
S. H. Lee (2017). Research and Development on Governance System, Core Technologies and Applications for Scientific Data : KISTI
S. T. Kim. (2010). A Study on a Model for Using and Preserving Scientific Data. Journal of the Korean Biblia Society for Library and Information Science, 21(4), 81-93
S. U. Park. (2011) An Economic Ripple Effect Analysis of National Scientific Data Center Construction, Journal of information science theory and practice, 42(3), 55-69
S. H. Lee (2013). A Development on the Scientific Data Sharing and Utilizing System : KISTI
S. H. Lee (2011). A Study on Establishing the Scientific Data Management and Application Framework to Build Up the National Scientific Data Center : KISTI
Research Data Management Strategy Requirements. https://admire.jiscinvolve.org/wp/files/2013/05/ADMIRe-RDM-Repository-Strategy-Requirements.pdf
iRODS Technical Overview http://bit.ly/2dd7Yoa
iRODS Architecture http://bit.ly/2d02B8u
Introduction to Fedora 4 http://fedorarepository.org/presentations
B2Share http://bit.ly/2dHdTQX
B2Share on Invenio 3 http://bit.ly/2e9GDVE
Invenio Digital Library Framework http://invenio-software.org/
Dataverse http://dataverse.org/about
Dataverse Features http://dataverse.org/software-features
S. K. Kim et al.' (2016). A Study on the Development of Phased Big Data Distribution Model Based on Big Data Distribution Ecology, Journal of Digital Convergence, 95-106
H. S. Byeon. (2017). The Status and Suggestions for Big Data Adaptation in the Government and the Public Agency. Journal of Digital Convergence, 13-25.

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증

국가 과학데이터 공유·활용 서비스를 위한 사례 연구
A Case Study on Sharing & Using of National Scientific Data 원문보기

초록
AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약
AI-Helper

문제 정의

제안 방법

성능/효과

후속연구

질의응답

참고문헌 (18)

이 논문을 인용한 문헌

저자의 다른 논문 :

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

연합인증

국가 과학데이터 공유·활용 서비스를 위한 사례 연구 A Case Study on Sharing & Using of National Scientific Data 원문보기

초록 용어보기논문에서 용어와 풀이말을 자동 추출한 결과로, 시범 서비스 중입니다. AI-Helper

Abstract ▼ AI-Helper

주제어

AI 본문요약 엑셀 다운로드 AI-Helper

문제 정의

제안 방법

성능/효과

후속연구

질의응답

참고문헌 (18)

이 논문을 인용한 문헌

저자의 다른 논문 :

진영근 (2) 이원구 (5)

관련 콘텐츠

원문 보기

원문 URL 링크

오픈액세스(OA) 유형

이 논문과 함께 이용한 콘텐츠

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

선택된 텍스트

국가 과학데이터 공유·활용 서비스를 위한 사례 연구
A Case Study on Sharing & Using of National Scientific Data 원문보기

초록
AI-Helper

AI 본문요약
AI-Helper