$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

커뮤니티 주도적 과학 데이터 큐레이션 협업 환경의 개발
Development of Collaborative Environment for Community-driven Scientific Data Curation 원문보기

한국콘텐츠학회논문지 = The Journal of the Korea Contents Association, v.17 no.9, 2017년, pp.1 - 11  

최동훈 (한국과학기술정보연구원) ,  박재원 (한국과학기술정보연구원) ,  김병규 (한국과학기술정보연구원) ,  신진섭 (한국과학기술정보연구원)

초록
AI-Helper 아이콘AI-Helper

데이터 재사용 수요가 증가할수록 데이터 큐레이션의 중요성에 대한 인식은 점차 증가하고 있다. 데이터의 폭증으로 인해, 과학자들은 전체 노력의 90%를 자신의 연구에 필요한 데이터의 검색 및 수집에 들이고 있다. 이러한 노력을 절감시키기 위해, 본 논문에서는 과학 데이터의 재사용성을 높이는 데 필수적인 커뮤니티 주도적 데이터 큐레이션 협업 환경의 개발 및 적용에 대해 다룬다. 본 과학 큐레이션 협업 환경은 특정연구 분야의 연구 결과 간에 상호 연관성을 포획하고 재구성하기 위해 데이터 (또는 데이터 컬렉션) 및 관련 문헌 간의 상호 연결에 초점을 맞추고 있다. 또한 풍부한 문맥 정보를 메타데이터로 제공하여 사용자의 데이터 이해를 돕는다. 데이터 및 데이터-문헌 간의 상호 연결을 영구적으로 접근할 수 있도록 보장하기 위해, DOI 시스템을 이용하여 실현하였다. 이 큐레이션 협업 환경은 국내외 연구자들로 구성된 무정형 단백질 연구 그룹에 의해 커뮤니티 주도적인 큐레이션 데이터베이스 구축에 적용되었다. 이렇게 구축된 데이터 베이스는 무정형 단백질 연구자의 과학적 발견을 위한 데이터 검색 및 수집 노력을 절감해 줄 것이다.

Abstract AI-Helper 아이콘AI-Helper

The importance of data curation is increasingly recognized as the need of data reuse drastically grows. Due to recent data explosion, scientists invest almost 90% of their efforts in the retrieval and collection of data needed to their study. In this paper, we deal with the development and applicati...

주제어

표/그림 (5)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 이들이 문헌에 대한 대표적인 문맥 정보라고 할 수 있다. 데이터 큐레이션 협업 환경은 이와 같이 다양한 관점의 문맥 정보를 풍부하게 제공하여, 사용자의 데이터의 이해를 돕고 데이터의 재사용성을 제고하고자 한다.
  • 데이터와 문헌 간의 상호연관성은 이들 간의 DOI(Digital Object Idenfier) [14][16]를 서로 연결하여 영구적 접근성을 보장한다. 또한 연구 커뮤니티에 의한 데이터의 신뢰성을 보장하기 위한 데이터 검토 프로세스(data review process)를 제시한다. 큐레이션 데이터 모델과 데이터 검토 프로세스를 지원하는 문맥 중심의 커뮤니티 주도적 데이터 큐레이션 협업 환경의 구조를 제시한다.
  • 위의 서술과 같이 데이터 재사용성을 위한 큐레이션은 이해하기 쉽고 믿고 사용할 수 있는 데이터를 공개하기 위해 데이터 생산자, 데이터 사서, 데이터 재사용자 등 다수의 전문가로 구성된 연구자 커뮤니티가 주도하는 협업적 방법을 요구한다. 본 논문에서는 과학 데이터에 대한 문맥 중심의 커뮤니티 주도적 큐레이션 협업 환경의 개발 및 적용에 대해 다룬다. 데이터의 이해 가능성과 재사용성을 극대화하기 위해, 데이터-문헌 간의 상호연관성 및 데이터에 대한 문맥을 중심으로 큐레 이션 데이터 모델을 제시한다.
  • 본 논문에서는 과학 분야의 연구자 커뮤니티가 주도하는 데이터 큐레이션을 지원하기 위한 협업 환경의 개발 및 적용 사례를 제시하였다. 과학 데이터의 이해 가능성과 재사용성을 극대화하기 위해, 데이터에 대한 문맥 정보를 메타데이터로 정의, 생성 및 관리할 수 있고 데이터-문헌 간의 상호연결 정보를 DOI 간의 매핑으로 생성 및 관리할 수 있도록, 큐레이션 데이터 모델을 제시하였다.
  • 과학 데이터의 이해 가능성과 재사용성을 극대화하기 위해, 데이터에 대한 문맥 정보를 메타데이터로 정의, 생성 및 관리할 수 있고 데이터-문헌 간의 상호연결 정보를 DOI 간의 매핑으로 생성 및 관리할 수 있도록, 큐레이션 데이터 모델을 제시하였다. 분야 전문가에 의한 제3자 검토를 통한 데이터의 신뢰성을 보장하기 위해 연구 커뮤니티 중심의 데이터 검토 프로세스를 제시하였다. 연구 커뮤니티의 데이터 큐레이션 요구사항에 따라 큐레이션 협업 환경의 사용자 기능을 도출하였고, 큐레이션 데이터 모델과 데이터 검토 프로세스 모델을 중심으로 이들 기능을 지원 할 수 있도록 커뮤니티 주도적 데이터 큐레이션 협업 환경을 설계하여 개괄적인 구조를 제시하였다.
  • 이와 같이 데이터와 문헌은 연구 결과의 가치를 결정하는 중요한 역할을 한다. 협업 환경은 데이터와 문헌 간의 연관성을 중심으로 데이터문헌 간의 상호연결 정보를 관리하고, 이들 정보에 대한 영구적 접근성을 보장하고자 한다. 이렇게 하면, 연구자의 데이터와 문헌 정보에 대한 지속적인 재사용 및 인용이 가능하다.

가설 설정

  • 문헌은 데이터와 마찬가지로 문맥 정보를 포함하고 있으나, 본 논문에서는 제목, 연구자, 초록, 키워드, 연구 주제, 표, 그림, 연구 재단으로 제한한다. 문헌은 출판 당시에 DOI를 부여한 상태에서 출판하기 때문에 출판된 모든 문헌은 DOI가 부여되어있다고 가정한다. 따라서, 데이터-문헌 간의 상호연결 정보는 데이터 DOI와 문헌 DOI 간의 매핑 테이블로 모델링한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
큐레이션이란? 이러한 고통을 경감시키려면, 연구자가 데이터를 손쉽게 찾아서 접근할 수 있고 쉽게 이해할 수 있을 뿐만 아니라 다른 리파지토리의 데이터와 쉽게 통합하여 재사용할 수 있도록, 충분한 메타데이터를 제공하는 것이 중요하다. 데이터의 발견, 접근, 이해, 통합, 재사용을 위한 메타데이터를 정의하고 생성하여 데이터의 부가가치를 제고하려는 노력을 데이터 큐레이션(curation)이라고 한다[2]. 연구 데이터의 큐레이션은 분야 전문가의 지식과 경험을 요구하기 때문에, 분야 전문가, 데이터 사서(data librarian), 데이터 재사용자 등으로 구성된 커뮤니티가 데이터 수명주기에 걸쳐 데이터 이해 및 재사용에 필요한 메타데이터를 정의하고 생성한다.
문맥 중심의 데이터 큐레이션을 달성하기 위해 필요한 것은 무엇인가? 연구 데이터에 대한 문맥 정보는 실험 방법, 장치, 데이터에 간략한 서술, 약어집(codebook), 데이터 포맷, 데이터 분석 도구 등을 말한다. 문맥 중심의 데이터 큐레이션을 성공적으로 달성하려면, 큐레이션 활동에 관련된 이해당사자의 지식과 경험의 다양성에 주목할 필요가 있다. 앞에 언급한 데이터 생산자, 데이터 사서, 데이터 재사용자는 대표적인 이해당사자로, 이들은 각자 서로 다른 전문성을 가지고 데이터에 대한 문맥 정보를 생성하여 데이터의 이해 및 재사용에 기여한다.
큐레이션은 데이터 신뢰성을 보장하기 위해 어떤 것을 하는가? 데이터의 신뢰성은 이에 근거한 연구결과의 투명성 및 재현성과 밀접한 관계가 있다. 데이터 신뢰성을 보장하기 위해, 연구 결과의 근거가 되는 데이터를 사전에 제출하여 검증 절차에 따라 제3자 검토를 거친다 [12][13]. 데이터에 대한 제3자 검토는 자연과학은 물론이고 심리학 및 경제학을 비롯한 사회 과학 분야에서도 실천하고 있다. 검증을 위해 연구자는 생성된 데이터와 함께, 실험 설계, 방법, 장치 등 문맥 정보를 메타데이터로 제출한다. 만일 기존의 데이터 리파지토리로부터 데이터를 수집하여 데이터 컬렉션을 생성했다면, 데이터와 함께 이에 관한 문맥 정보를 수집하여 제출한다. 제출된 데이터의 검증은 전문 지식과 경험을 가진 분야 전문가에 의한 제3자 검토 과정을 수반한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (18)

  1. B. Howe and T. Lewis, "Enabling Collaborative Research Data Management with SQLShare, 2012, https://www.slideshare.net/billhoweuw/research-data-managementi22012 

  2. I. Faniel, D. Minor, and C. L. Palm, "Putting Research Data into Context: Scholarly, Professional, and Educational Approaches to Curating Data for Reuse," ASIST 2014. 

  3. I. Faniel, E. Yakel, K. Fear, and E. Kansa, "A Context-driven Approach to Data Curation for Reuse," International Digital Curation Conference, Amsterdam, February 22, 2016. 

  4. I. Faniel, E. Kansa, S. W. Kansa, J. Barrera-Gomez, and E. Yakel, "The Challenges of Digging Data: A Study of Context in Archaeological Data Reuse," JCDL 2013, pp.295-304. 

  5. http://www.rcsb.org/pdb/home/home.do 

  6. https://www.ncbi.nlm.nih.gov/genbank 

  7. M. E. Cusick, "Literature-curated protein interaction datasets," Nat Methods, Vol.6, No.1, pp.39-465, 2009. 

  8. D. S. Kwon, S. Kim, S. Y. Shin, Andrew Chatr-aryamontri, and W. John Wilbur, "Assisting manual literature curation for protein-protein interactions using BioQRator," Database, 2014. 

  9. D. G. Jamieson, M. Germer, F. Sarafraz, G. Nenadic, and D. L. Robertson, "Towards semi-automated curation: using text mining to recreate the HIV-1, human protein interaction database," Database, 2012. 

  10. M. S. Mayernik, J. Phillips, and E. Nienhouse, "Linking Publications and Data: Challenges, Trends, and Opportunities," D-Lib Magazine, Vol.22, No.5/6, 2016(11). 

  11. M. Hoogerwerf, M. Losch, J. Schirrwagen, S. Callaghan, P. Manghi, K. Iatropoulou, D. Keramida, and N. Rettberg, "Linking Data and Publications: Towards a Cross-Disciplinary Approach," The International Journal of Digital Curation, Vol.8, No.1, 2013. 

  12. B. Lawrence, C. Jones, B. Mathews, S. Palmer, and S. Callaghan, "Citation and Peer Review of Data: Moving Towards Formal Data Publication," The International Journal of Digital Curation, Vol.6, No.2, 2011. 

  13. H. M. Berman, J, Westbrook, Z. Feng, G. Gilliland, T. N. Bhat, H. Weissig, I. N. Shindyalov, and P. E. Bourne, "The Protein Data Bank," Nucleic Acids Research, Vol.28, No.1, pp.235-242, 2000. 

  14. https://www.doi.org 

  15. H. Lee, K. H. Mok, R. Muhandiram, K. H. Park, J. E. Suk, D. H. Kim, J. Chang, Y. C. Sung, K. Y. Choi, and K. H. Han, "Local Structural Elements in the Mostly Unstructured Transcriptional Activation Domain of Human p53," The Journal of Biological Chemistry, Vol.275, No.38, pp.29426-294323, 2000. 

  16. https://www.doi.or.kr 

  17. M. D. Wilkinson, M. Dumontier, I. J. Aalbersberg, G. Appleton, M. Axton, A. Baak, K. Blomberg, J. W. Boiten, L. B. da Silva Santos, P. E. Bourne, J. Bouwman, A. J. Brookes, T. Clark, M. Crosas, I. Dillo, C. Dumon, S. Edmunds, C. T. Evelo, R. Finkers, A. Gonzalez-Beltran, A. J. G. Gray, P. Groth, C. Goble, J. S. Grethe, J. Heringa, P. A. G. 't Hoen, R. Hooft, T. Kuhn, R. Kok, J. Kok, S. J. Lusher, M. E. Martone, A. Mons, A. L. Packer, B. Persson, P. Rocca-Serra, M. Roos, R. van Schaik, S. A. Sansone, E. Schultes, T. Sengstag, T. Slater, G. Strawn, M. A. Swertz, M. Thompson, J. van der Lei, E. van Mulligen, J. Velterop, A. Waagmeester, P. Wittenburg, K. Wolstencroft, J. Zhao, and B. Mons, "The FAIR Guiding Principles for scientific data management and stewardship," Scientific Data 2016. 

  18. Life Science Solutions, "Automated vs manual literature curation: extracting more information from scientific literature," Elsevier, 2014. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로