국제 장기생태연구는 인간의 사회적 측면을 포함하여 생태연구에 관한 종합적인 장기 대규모 조사 관측을 통해 자연환경, 생물 다양성, 생태 환경의 보전향상과 지속 가능한 적절한 문제 해결을 목적으로 한다. 하지만 과거 국내 장기적인 생태연구는 통합 저장소의 부재와 많은 데이터 관리상의 문제점들이 있어 제대로된 협업연구가 어려웠고, 글로벌 데이터 공유도 불가능하였다. 이에 본 연구에서는 국제 데이터 연동이 가능하고 체계적인 장기생태연구 데이터 관리가 가능한 데이터 플랫폼 모델 제시를 목적으로 하고 다음과 같은 연구과정을 수행하였다. 첫째, 과거의 국가장기생태연구정보시스템과 구축된 데이터를 분석하여 데이터 관리의 문제점을 파악하였고, 데이터 정합성이 보장되지 않는 과거 데이터에 대한 데이터 정제 및 구축방안을 제시하였다. 둘째, 국제 장기생태연구 사이버 인프라와 데이터 플랫폼 기술을 분석을 위해 세계 각국의 플랫폼 모델을 파악하고, 국내 연구자 커뮤니티의 활용에 적합한 통합 플랫폼 모델을 도출하였다. 셋째, 다양한 데이터 형태의 데이터를 통합하기 위한 ...
국제 장기생태연구는 인간의 사회적 측면을 포함하여 생태연구에 관한 종합적인 장기 대규모 조사 관측을 통해 자연환경, 생물 다양성, 생태 환경의 보전향상과 지속 가능한 적절한 문제 해결을 목적으로 한다. 하지만 과거 국내 장기적인 생태연구는 통합 저장소의 부재와 많은 데이터 관리상의 문제점들이 있어 제대로된 협업연구가 어려웠고, 글로벌 데이터 공유도 불가능하였다. 이에 본 연구에서는 국제 데이터 연동이 가능하고 체계적인 장기생태연구 데이터 관리가 가능한 데이터 플랫폼 모델 제시를 목적으로 하고 다음과 같은 연구과정을 수행하였다. 첫째, 과거의 국가장기생태연구정보시스템과 구축된 데이터를 분석하여 데이터 관리의 문제점을 파악하였고, 데이터 정합성이 보장되지 않는 과거 데이터에 대한 데이터 정제 및 구축방안을 제시하였다. 둘째, 국제 장기생태연구 사이버 인프라와 데이터 플랫폼 기술을 분석을 위해 세계 각국의 플랫폼 모델을 파악하고, 국내 연구자 커뮤니티의 활용에 적합한 통합 플랫폼 모델을 도출하였다. 셋째, 다양한 데이터 형태의 데이터를 통합하기 위한 데이터셋의 모델을 설계하여 데이터 수집부터 데이터 라이프 사이클에 적합한 데이터 큐레이션 프로세스를 확립하였다. 특히 플랫폼에 제출되는 데이터의 품질을 보증하기 위해 통제어휘, 종정보와 같은 참조 메타데이터 기반의 데이터 유효성 검사와 데이터 관리자, 데이터 리뷰어의 데이터 스크린과 리뷰를 지원할 수 있는 데이터 통제를 사용자 권한관리와 함께 제시하고, 검증하였다. 넷째, 국제 데이터 공유와 글로벌 데이터 센터 역할을 수행하기 위한 관련 분야 데이터 네트워크와 연계할 수 있는 글로벌 네트워크 모델을 도출하고 필수 기술들을 정의하여 데이터 플랫폼에 반영하였다. 다섯째, 데이터 활용 시 데이터에 대한 저작권 보호를 위해 국내에서 공공누리(KOGL)과 국제 통용 자유이용저작물(CCL)을 매핑하여 국내외 사용자에게 활용될 수 있는 데이터 라이선스를 적용하였다. 여섯째, 데이터 활용을 극대화할 수 있게 하기 위해 프로젝트, 지리정보, 연구자, 사이트, 프로토콜, 통제어휘, DOI와 같은 모든 객체에 대한 데이터 매트릭스 체계를 구축하고, Open Layer 기반의 맵 검색, 사이트/조사방법과 같은 메타데이터 기반의 다면 검색, 통제어휘 검색, 통합검색과 검색엔진을 활용하여 검색기능을 강화하였다. 일곱째, 개인정보 공개 관련 법률은 개인정보 공개 범위를 제약하고 있어 공동연구를 기반으로 하는 장기생태연구에서 공개절차 및 범위의 적용 문제가 발생한다. 연구자의 개인정보 공개를 최소화하지만, 국제 데이터 교환 시 활용되는 개인정보를 충족시키는 공개 정책을 마련하였고, 데이터 플랫폼에서 지원할 수 있도록 하였다. 여덟째, 선별적 데이터 보관과 저장이 가능하도록 온라인 엑세스가 떨어지는 데이터에 대해서는 확장이 용이한 클라우드 스토리지로 이관하는 데이터 아카이빙 기술을 적용하여 확장성을 입증하였다. 아홉째, 상기 연구수행을 바탕으로 다양한 데이터를 지원하고, 데이터 제작, 작업흐름, 저장, 출판과 같은 데이터 콘텐츠 환경을 가장 잘 지원할 수 있는 콘텐츠 관리 시스템인 Drupal을 기반으로 데이터 플랫폼을 설계 및 구현하여, 전주기 데이터 관리가 가능하도록 하였다. 본 연구를 통해 개발된 데이터 플랫폼은 KNLTER의 참조모델로 LTER 데이터의 전주기적 관리를 가능케 하고, 국제 장기생태연구의 네트워크 노드로 데이터 센터 역할을 수행할 수 있다. 또한 국내 연구거점 사이트가 늘어나더라도 데이터 복제(Data Replication)와 데이터 수확(Data Harvesting)으로 중앙 집중식 구조(Central Co-ordination Unit)인 장기생태연구정보의 전주기 관리를 위한 데이터 플랫폼을 통해 국가차원의 관리도 가능해질 수 있다.
국제 장기생태연구는 인간의 사회적 측면을 포함하여 생태연구에 관한 종합적인 장기 대규모 조사 관측을 통해 자연환경, 생물 다양성, 생태 환경의 보전향상과 지속 가능한 적절한 문제 해결을 목적으로 한다. 하지만 과거 국내 장기적인 생태연구는 통합 저장소의 부재와 많은 데이터 관리상의 문제점들이 있어 제대로된 협업연구가 어려웠고, 글로벌 데이터 공유도 불가능하였다. 이에 본 연구에서는 국제 데이터 연동이 가능하고 체계적인 장기생태연구 데이터 관리가 가능한 데이터 플랫폼 모델 제시를 목적으로 하고 다음과 같은 연구과정을 수행하였다. 첫째, 과거의 국가장기생태연구정보시스템과 구축된 데이터를 분석하여 데이터 관리의 문제점을 파악하였고, 데이터 정합성이 보장되지 않는 과거 데이터에 대한 데이터 정제 및 구축방안을 제시하였다. 둘째, 국제 장기생태연구 사이버 인프라와 데이터 플랫폼 기술을 분석을 위해 세계 각국의 플랫폼 모델을 파악하고, 국내 연구자 커뮤니티의 활용에 적합한 통합 플랫폼 모델을 도출하였다. 셋째, 다양한 데이터 형태의 데이터를 통합하기 위한 데이터셋의 모델을 설계하여 데이터 수집부터 데이터 라이프 사이클에 적합한 데이터 큐레이션 프로세스를 확립하였다. 특히 플랫폼에 제출되는 데이터의 품질을 보증하기 위해 통제어휘, 종정보와 같은 참조 메타데이터 기반의 데이터 유효성 검사와 데이터 관리자, 데이터 리뷰어의 데이터 스크린과 리뷰를 지원할 수 있는 데이터 통제를 사용자 권한관리와 함께 제시하고, 검증하였다. 넷째, 국제 데이터 공유와 글로벌 데이터 센터 역할을 수행하기 위한 관련 분야 데이터 네트워크와 연계할 수 있는 글로벌 네트워크 모델을 도출하고 필수 기술들을 정의하여 데이터 플랫폼에 반영하였다. 다섯째, 데이터 활용 시 데이터에 대한 저작권 보호를 위해 국내에서 공공누리(KOGL)과 국제 통용 자유이용저작물(CCL)을 매핑하여 국내외 사용자에게 활용될 수 있는 데이터 라이선스를 적용하였다. 여섯째, 데이터 활용을 극대화할 수 있게 하기 위해 프로젝트, 지리정보, 연구자, 사이트, 프로토콜, 통제어휘, DOI와 같은 모든 객체에 대한 데이터 매트릭스 체계를 구축하고, Open Layer 기반의 맵 검색, 사이트/조사방법과 같은 메타데이터 기반의 다면 검색, 통제어휘 검색, 통합검색과 검색엔진을 활용하여 검색기능을 강화하였다. 일곱째, 개인정보 공개 관련 법률은 개인정보 공개 범위를 제약하고 있어 공동연구를 기반으로 하는 장기생태연구에서 공개절차 및 범위의 적용 문제가 발생한다. 연구자의 개인정보 공개를 최소화하지만, 국제 데이터 교환 시 활용되는 개인정보를 충족시키는 공개 정책을 마련하였고, 데이터 플랫폼에서 지원할 수 있도록 하였다. 여덟째, 선별적 데이터 보관과 저장이 가능하도록 온라인 엑세스가 떨어지는 데이터에 대해서는 확장이 용이한 클라우드 스토리지로 이관하는 데이터 아카이빙 기술을 적용하여 확장성을 입증하였다. 아홉째, 상기 연구수행을 바탕으로 다양한 데이터를 지원하고, 데이터 제작, 작업흐름, 저장, 출판과 같은 데이터 콘텐츠 환경을 가장 잘 지원할 수 있는 콘텐츠 관리 시스템인 Drupal을 기반으로 데이터 플랫폼을 설계 및 구현하여, 전주기 데이터 관리가 가능하도록 하였다. 본 연구를 통해 개발된 데이터 플랫폼은 KNLTER의 참조모델로 LTER 데이터의 전주기적 관리를 가능케 하고, 국제 장기생태연구의 네트워크 노드로 데이터 센터 역할을 수행할 수 있다. 또한 국내 연구거점 사이트가 늘어나더라도 데이터 복제(Data Replication)와 데이터 수확(Data Harvesting)으로 중앙 집중식 구조(Central Co-ordination Unit)인 장기생태연구정보의 전주기 관리를 위한 데이터 플랫폼을 통해 국가차원의 관리도 가능해질 수 있다.
International Long-Term Ecological Research (ILTER) aims to preserve the natural environment, biodiversity, and ecological environment; it also aims to provide sustainable solutions through comprehensive, long-term, large-scale survey and monitoring of ecological studies including that on environmen...
International Long-Term Ecological Research (ILTER) aims to preserve the natural environment, biodiversity, and ecological environment; it also aims to provide sustainable solutions through comprehensive, long-term, large-scale survey and monitoring of ecological studies including that on environmental regions inhabited by humans. Furthermore, ILTER aims to address future problems related to ecological and environmental issues by monitoring long-term changes in the ecological environment. LTER began in 1980 as a program launched by the United States National Science Foundation (NSF), 16 countries in 1993 and more than 40 countries, including South Korea, established the ILTER network in 1997. In 2004, the Ministry of Environment launched the KNLTER project in South Korea; as such, South Korea's data-based research lags considerably as compared to the UK-ECN and the US-LTER, which have been accumulating data for over 30 years. South Korea, where long-term ecological studies began later, poured its efforts into establishing ecological objects and measurements for long-term ecological studies at its early stage. South Korea has selected representative ecological sites in the Korean Peninsula and further initiated numerous ecological research projects resulting in successful research outcomes. However, problems have occurred with data collection over the past 10 years due to the lack of unified measurements and appropriate data management for long-term ecological studies. This hindered domestic LTER communities from collaborating analysis results of same-purpose data management and from global data sharing; moreover, South Korea was excluded from the collaboration of global long-term ecological studies based on long-term data monitoring. This study aims to design data platform-enabled global data sharing and systematic data management for long-term ecological studies through the following research process: First, to understand data management issues in the long-term ecological study projects for the past 10 years, this study captured data management issues by analyzing the legacy system and data provided by the National Institute of Ecology (NIE); it provided a data cleaning and building plan for past data without ensuring data consistency. Second, to analyze infrastructure and platform technology in global, long-term ecological studies, this study captured past platform models by KNLTE in addition to US-LTER, Terrestrial Ecological Research Network (AU-TERN), Environmental Change Network (UK-ECN), Taiwan Ecological Research Network (TW-TERN), Japan LTER (JA-JaLTER), and China Ecological Research Network (CN-CERN). The study elicited an integrated platform model for domestic researchers' communities. Third, to integrate various forms of data, this study established a data curation process appropriate for data life-cycle through data collection by designing a dataset model. Furthermore, to ensure data quality for the platform, this study presented data validation based on reference metadata such as controlled vocabulary and species information; it also provided quality control supporting data screening and reviewing by data managers and data reviewers in tandem with user authentication management. Fourth, this study elicited a KNLTER network model collaborative with relevant networks such as Data Observation Network for Earth (DataONE), Knowledge Network for Biocomplexity (KNB), and Research Data Alliance (RDA); this model functions as a global data center for international data sharing. The study further defined essential technologies. Fifth, to protect data by copyright for its usage, this study made data license available for domestic and international users by mapping Korea Open Government License (KOGL) to CCL, in accordance with the law on fair use of public domain materials effective in South Korea since 2014, and Creative Commons License (CCL). Sixth, to maximize data utility, this study established a data matrix system for all objects such as projects, geographical information, researchers, sites, protocols, controlled vocabulary, and Digital Object Identifier (DOI). The study further enhanced search functions for OpenLayers-based map search, faceted search, which was based on metadata such as site/ measurement, controlled vocabulary search, and unified search by using Drupal Node module and Apache Solr. Seventh, personal data protection act limits the disclosure scope of personal information, hindering collaborative research on long-term ecological studies in terms of disclosure procedure and scope. This study includes minimizing the disclosure of researchers’ personal information, enabling data platform to support global data sharing, along with creating a personal information disclosure policy. Eighth, to enable selective data storage and repository, this study applied data archiving technology to migrate less accessible data online to the cloud storage. Ninth, based on the research process above, this study designed a data platform, based on Drupal, a contents management system the best supporting data contents environment such as various data types, data creation, work flow, storage, and publishing and enabled full life-cycle management for LTER. Data platform designed through this study, is a reference model by KNLTER that enables life-cycle management of LTER data; it functions as ILTER's network node and data center. Furthermore, regardless of the increase in domestic sites, data replication and data harvesting enable governmental supervision through implementation of this data platform, which is the central coordination unit.
International Long-Term Ecological Research (ILTER) aims to preserve the natural environment, biodiversity, and ecological environment; it also aims to provide sustainable solutions through comprehensive, long-term, large-scale survey and monitoring of ecological studies including that on environmental regions inhabited by humans. Furthermore, ILTER aims to address future problems related to ecological and environmental issues by monitoring long-term changes in the ecological environment. LTER began in 1980 as a program launched by the United States National Science Foundation (NSF), 16 countries in 1993 and more than 40 countries, including South Korea, established the ILTER network in 1997. In 2004, the Ministry of Environment launched the KNLTER project in South Korea; as such, South Korea's data-based research lags considerably as compared to the UK-ECN and the US-LTER, which have been accumulating data for over 30 years. South Korea, where long-term ecological studies began later, poured its efforts into establishing ecological objects and measurements for long-term ecological studies at its early stage. South Korea has selected representative ecological sites in the Korean Peninsula and further initiated numerous ecological research projects resulting in successful research outcomes. However, problems have occurred with data collection over the past 10 years due to the lack of unified measurements and appropriate data management for long-term ecological studies. This hindered domestic LTER communities from collaborating analysis results of same-purpose data management and from global data sharing; moreover, South Korea was excluded from the collaboration of global long-term ecological studies based on long-term data monitoring. This study aims to design data platform-enabled global data sharing and systematic data management for long-term ecological studies through the following research process: First, to understand data management issues in the long-term ecological study projects for the past 10 years, this study captured data management issues by analyzing the legacy system and data provided by the National Institute of Ecology (NIE); it provided a data cleaning and building plan for past data without ensuring data consistency. Second, to analyze infrastructure and platform technology in global, long-term ecological studies, this study captured past platform models by KNLTE in addition to US-LTER, Terrestrial Ecological Research Network (AU-TERN), Environmental Change Network (UK-ECN), Taiwan Ecological Research Network (TW-TERN), Japan LTER (JA-JaLTER), and China Ecological Research Network (CN-CERN). The study elicited an integrated platform model for domestic researchers' communities. Third, to integrate various forms of data, this study established a data curation process appropriate for data life-cycle through data collection by designing a dataset model. Furthermore, to ensure data quality for the platform, this study presented data validation based on reference metadata such as controlled vocabulary and species information; it also provided quality control supporting data screening and reviewing by data managers and data reviewers in tandem with user authentication management. Fourth, this study elicited a KNLTER network model collaborative with relevant networks such as Data Observation Network for Earth (DataONE), Knowledge Network for Biocomplexity (KNB), and Research Data Alliance (RDA); this model functions as a global data center for international data sharing. The study further defined essential technologies. Fifth, to protect data by copyright for its usage, this study made data license available for domestic and international users by mapping Korea Open Government License (KOGL) to CCL, in accordance with the law on fair use of public domain materials effective in South Korea since 2014, and Creative Commons License (CCL). Sixth, to maximize data utility, this study established a data matrix system for all objects such as projects, geographical information, researchers, sites, protocols, controlled vocabulary, and Digital Object Identifier (DOI). The study further enhanced search functions for OpenLayers-based map search, faceted search, which was based on metadata such as site/ measurement, controlled vocabulary search, and unified search by using Drupal Node module and Apache Solr. Seventh, personal data protection act limits the disclosure scope of personal information, hindering collaborative research on long-term ecological studies in terms of disclosure procedure and scope. This study includes minimizing the disclosure of researchers’ personal information, enabling data platform to support global data sharing, along with creating a personal information disclosure policy. Eighth, to enable selective data storage and repository, this study applied data archiving technology to migrate less accessible data online to the cloud storage. Ninth, based on the research process above, this study designed a data platform, based on Drupal, a contents management system the best supporting data contents environment such as various data types, data creation, work flow, storage, and publishing and enabled full life-cycle management for LTER. Data platform designed through this study, is a reference model by KNLTER that enables life-cycle management of LTER data; it functions as ILTER's network node and data center. Furthermore, regardless of the increase in domestic sites, data replication and data harvesting enable governmental supervision through implementation of this data platform, which is the central coordination unit.
Keyword
#ANDS Big data Controlled Vocabulary Central Co-ordination Unit Content Management Framework Content Management System DOI Data Platform Data Publication Data Archiving Data Conversion Data Curation Data Harvest Data License Data Replication Data Synthesis Data validation DataONE Drupal ERD ILTER Information Security KNB KNLTER Long-Term Ecological Research Measurement NEON PASTA Personal Information Protection Protocol Quality Assurance Quality Control TERN UML XML
학위논문 정보
저자
허태상
학위수여기관
배재대학교
학위구분
국내박사
학과
컴퓨터공학과 컴퓨터공학전공
지도교수
정회경
발행연도
2017
총페이지
xiii, 113장
키워드
ANDS Big data Controlled Vocabulary Central Co-ordination Unit Content Management Framework Content Management System DOI Data Platform Data Publication Data Archiving Data Conversion Data Curation Data Harvest Data License Data Replication Data Synthesis Data validation DataONE Drupal ERD ILTER Information Security KNB KNLTER Long-Term Ecological Research Measurement NEON PASTA Personal Information Protection Protocol Quality Assurance Quality Control TERN UML XML
※ AI-Helper는 부적절한 답변을 할 수 있습니다.