$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

데이터세트 보존포맷 검증방안에 관한 연구: 재난안전정보 데이터세트의 SIARD 적용을 통해
Empirical Verification of Conversion and Restoration of Preservation Format for Dataset: Application of Dataset with Disaster Safety Information to SIARD 원문보기

정보관리학회지 = Journal of the Korean society for information management, v.37 no.2, 2020년, pp.251 - 284  

한희정 (전북대학교 문화융복합아카이빙 연구소) ,  윤성호 (전북대학교 일반대학원 기록관리학과) ,  오효정 (전북대학교 문헌정보학과, 문화융복합아카이빙 연구소) ,  양동민 (전북대학교 일반대학원 기록관리학과, 문화융복합아카이빙 연구소)

초록
AI-Helper 아이콘AI-Helper

정보의 활용이 국가 경쟁력의 핵심으로 부각되면서 우리 정부를 포함한 주요 선진국들은 데이터를 중요하게 인식하고 있으며, 이에 따라 장기보존 기술 연구 및 표준 제정 등을 추진하여 데이터의 체계적인 관리 및 보존을 위한 노력을 지속적으로 기울이고 있다. 그러나 현재 국내의 경우 다양한 유형의 데이터들에 대해 법령에는 기록관리 대상으로 명시하고 있지만, 이를 수집, 관리 및 보존하기 위한 구체적인 방법은 표준전자문서 이외에는 없는 상황이다. 특히, 행정정보시스템에서 생산되는 엄청난 규모의 데이터세트에 대한 관리 및 보존은 무엇보다 강하게 요구되어 왔으나 데이터세트에 대한 지침이 제대로 제공되고 있지 않고 있다. 보존포맷 선정체계가 마련되어야 시스템 보완 및 구축이 가능하기 때문에 우선적으로 데이터세트 특성을 고려한 보존포맷 선정 기준 체계가 보다 구체화 되어야 하며, 선정기준에 따라 도출된 데이터세트 보존포맷의 변환에 대한 실증적인 검증 작업이 필요하다. 이에 본 연구는 데이터세트의 특성을 고려한 보존포맷 선정 기준에 대한 평가체계를 도출하고, 보존포맷에 대한 실증적 검증을 통해 장기보존할 수 있는 방안을 제시하고자 한다.

Abstract AI-Helper 아이콘AI-Helper

As the use of information has emerged as the core of national competitiveness, major developed countries and the Korean government have realized the importance of data. They have pursued technical research and standard establishment for long-term preservation and continuously strived for systematic ...

주제어

표/그림 (32)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 연구는 데이터세트 유형 전자기록의 장기 보존 방안을 제안하는 것을 목적으로 한다. 이 를 위해 먼저, 문헌조사를 통해 국내외 전자기 록물 보존포맷 현황 및 선정 기준을 분석하였으며, 데이터세트 유형 전자기록 분석을 위해 국내 공공기관 행정정보시스템의 형태 및 운영 현황 등을 조사 및 분석하였다.
  • 그래서 활용성과 관련하여 데이터세트를 보존포맷으로 변환한 후에도 다 시 복원하여 활용할 수 있거나 뷰어와 같은 도 구를 통해 확인할 수 있는지를 판단할 수 있는 평가항목(9-15)이 필요하다. 이를 종합하여 본 논문에서는 데이터세트 보 존포맷 선정을 위한 평가체계를 와 같이 제안하고자 한다. 본 논문에서 제안하는 데이 터세트 보존포맷 평가표는 다른 전자기록에도 공통으로 적용될 수 있는 공통기준을 제외한 데이터세트만의 특성을 반영한 결과이다.
  • 따라서 필수보존속성(SP)을 기준으로 도출한 데이터 세트의 특성은 진본성을 보장을 위해 고려해야 할 중요한 요소라 볼 수 있다. 이에 본 논문은 필수보존속성(SP)을 기준 으로 도출한 데이터세트의 특성을 바탕으로 데 이터세트 보존포맷으로 선정하기 위해 고려해 야 할 기준 항목을 다음과 같이 제안하고자 한 다( 참조). 먼저, 데이터세트 보존포맷 선정을 위해 고려해 야 할 첫 번째 고유기준은 일반화(Normalization) 이다.
  • 따라서 기록관리적 측면에서 공통기준 외 에 전자기록물 유형별 보존되어야 할 특성을 분석하고, 이를 반영한 고유기준이 마련되어야 한다. 이에 본 연구는 기록관리적 측면에서 전자기 록물 유형 중 데이터세트에 대한 특성을 분석 하여 데이터세트 보존포맷 선정을 위한 고유기 준을 다음과 같이 제안하고자 한다.
  • 특히, 공공기관에서 생산되는 많은 다양한 유 형의 데이터세트를 지속가능하게 관리 및 보존 하기 위해서는 데이터세트 특성을 고려한 보존 포맷 선정 기준 체계가 보다 구체화 되어야 하며, 선정기준에 따라 도출된 데이터세트 보존 포맷의 변환에 대한 실증적인 검증 작업이 필 요하다. 이에 본 연구는 데이터세트의 특성을 고려한 보존포맷 선정 기준에 대한 평가체계를 도출한 후, 보존포맷 변환에 대한 실증적 검증을 통해 데이터세트 유형의 전자기록을 장기보존할 수 있는 방안을 제시하고자 한다.
  • 또한 오세라, 이해영 (2019) 역시 데이터 세트 기록관리가 방치된 가장 큰 원인으로 문서 류와 태생이 다른 데이터세트를 문서류 기록과 같은 기준과 관리 방법을 적용하려고 하는 데 있 다고 지적하였다. 이에 해당 연구에서는 현장에 서 조사한 시스템의 현황 분석 및 실무자 인터뷰를 통해 데이터세트의 관리 기준을 설계하여 현 실에서 적용 가능한 관리 절차를 제안하였다. 이 들 연구들은 다양한 유형의 전자기록의 관리 및 보존 방안의 필요성에 대해서 강조하고 있으며, 특히 엄청난 속도로 생산되는 행정정보 데이터세 트에 대한 기록관리방안을 가장 시급한 문제로 꼽고 있다.
  • 관계형 데이터베이스 보존을 위해 스위스 연방기록에서 개발한 SIARD는 전 세계 여러 국가 에서 사용 또는 연구 중이다(행정안전부, 2018). 이와 관련하여 본 논문에서는 스위스, 덴마크, 포르투칼에서 SIARD를 어떻게 활용하고 있는 지에 대해 조사․분석하였다( 참조).

가설 설정

  • 그 외에도 데이터베 이스 안에 있는 SIARD 파일이 외부에 저장되어 있는 대용량의 객체를 “file:" URI를 이용하여 참조할 수 있으며, 압축방법으로는 deflate 방식 을 지원하고 있다. 한편, SIARD는 OAIS 패키지 모델 구조와 독립적으로 설계되어 OAIS 패키지 메타데이 터와 관계없이 자체적으로 메타데이터를 가지 고 있으며, 다른 문서들(외부 LOB파일, 외부 파일 이름에 대한 변환 맵, DB 문서, DB 구조 와 관련 문서 등)과 함께 보존되는 것으로 가정 한다( 참조). SIARD 아카이브 구조 를 보면 메타데이터와 테이블데이터가 결합된 구조로 하나의 관계형 DB는 단일의 SIARD 파 일로 저장되며, 모든 DB 콘텐츠는 XML 스키마 1.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
SIARD란 무엇인가? SIARD(Software Independent Archival of Relational Databases)는 관계형 데이터베이스 에 저장되어 있는 데이터세트를 소프트웨어와 독립적으로 하나의 파일로 ‘장기보존’ 할 수 있 도록 개발된 표준이다. Unicode, XML, SQL: 2008, URI(Uniform Resource Identifier), ZIP 등의 표준을 기반으로 하고 있어 원본 데이터 베이스 소프트웨어를 사용할 수 없게 되더라도 이들 표준에 기반하여 데이터베이스 데이터에 접근 및 교환이 가능하기 때문에 보존용 포맷 으로 고려해 볼 수 있다.
다양성을 고려하여 보존포맷을 설정해야 되는 이유는 무엇인가? 일반화는 상용화된 다양한 종류(제조사, 버전)의 DBMS와의 호환가능성을 판단하는 기준이다. 앞서 언급하였듯이 데이터세트는 매 우 다양하다는 특성을 갖고 있다. 따라서 데이 터세트의 다양성을 고려하여 보존포맷을 선정 할 필요가 있다.
미 국․영국 등 주요 선진국들은 데이터를 보존하기 위해 무엇을 하는가? 최근 데이터의 활용이 국가 경쟁력을 좌우하는 핵심자원으로 그 중요성이 부각됨에 따라 이를 정부차원에서 적극 수집, 관리 및 활용하 고자 하는 움직임이 활발해지고 있다. 이미 미 국․영국 등 주요 선진국들은 데이터와 통계자 료의 중요성을 깨닫고 이들 데이터를 장기보존 하기 위한 기술 연구 및 데이터 표준 제정 등을 추진하여 데이터의 체계적인 보존을 위한 노력을 지속적으로 기울여 왔다. 우리나라 역시 2013 년에 공공데이터의 제공 및 이용활성화에 관 한 법률 (이하 ‘공공데이터법’)을 제정하여 공 공데이터 공유 및 활용 기반을 마련하기 시작 했다.
질의응답 정보가 도움이 되었나요?

참고문헌 (29)

  1. Kang, H. M. (2016). A study on the standardization of jpeg format as a long-term preservation master file for paper archives in the central archives of Korea. Journal of the Korean Library And Information Science Society, 47(4), 489-510. https://doi.org/10.16981/kliss.47.4.201612.489 

  2. National Archives of Korea (2004). Electronic record permanent preservation based technology service. Daejeon: National Archives of Korea. 

  3. National Archives of Korea (2013). A study on the reproduction technology and the prototype for the electronic records of administrative agency. Daejeon: National Archives of Korea. 

  4. 국가기록원 (2017). 차세대 기록관리 모델 재설계 연구 개발 완료보고서. 대전: 국가기록원. 

  5. Roh, J.-W., & So, J.-E. (2020). A study on the management plan for preservation and long-term use of datasets. Journal of D-Culture Archives, 3(1), 51-64. 

  6. Park, J., & Lee, M. (2019). A study on the introduction of raw image file formats for the management of digital photographic records. Journal of Korean Society of Archives and Records Management, 19(3), 155-178. https://doi.org/10.14404/JKSARM.2019.19.3.155 

  7. Seong, H. H. (2007). A study on document preservation format classified by the type for long-term preservation and use of electronic records. Master's thesis, Hankuk University of Foreign Studies. Seoul. 

  8. So, J. E. (2019). A study on derivation critical factor for selection of dataset preservation format: Focus on dataset of relational database. Master's thesis, Jeonbuk National University of Graduate School. Jeonju. 

  9. Song, C.-H., & Cha, H.-C. (2017). A study on the risk evaluation of electronic records for long-term preservation. Journal of The Korea Society of Computer and Information Winter Conference, 25(1), 29-30. 

  10. Oh, S.-L., Park, S., & Yim, J. H. (2018). A case study of dataset records in information management system. Journal of Korean Society of Archives and Records Management, 18(2), 109-133. https://doi.org/10.14404/JKSARM.2018.18.2.109 

  11. Oh, S.-L., & Rieh, H.-Y. (2019). Managing data set in administrative information systems as records. Journal of Korean Society of Archives and Records Management, 19(2), 51-76. https://doi.org/10.14404/JKSARM.2019.19.2.051 

  12. Oh, S.-L., Jung, M. R., & Yim, J. H. (2016). Redesigning electronic records preservation formats based on open formats. Journal of Korean Society of Archives and Records Management, 16(4), 79-120. https://doi.org/10.14404/JKSARM.2016.16.4.079 

  13. Wang, H.-S., & Seol, M.-W. (2017). A study on managing dataset records in government information systems. Journal of Korean Society of Archives and Records Management, 17(3), 23-47. https://doi.org/10.14404/JKSARM.2017.17.3.023 

  14. Lim, N., & Nam, Y. (2019). A study on the criteria for digitization of records. Journal of the Korean BIBLIA Society for library and Information Science, 30(3), 5-30. https://doi.org/10.14699/kbiblia.2019.30.3.005 

  15. Korea Minisry of Government (2017). Act on activation of data-based administration. Bill number 11077. Korea Ministry of Government Legislation. Retreived from http://www.lawmaking.go.kr 

  16. Cha, H.-C., & Song, C.-H. (2019). A risk assessment method for the long-term preservation of electronic records. Journal of Korea Multimedia Society, 22(1), 79-87. https://doi.org/10.9717/kmms.2019.22.1.079 

  17. Korea Society of Archival Studies (2008). Dictionary of records and archival terminology. Seoul: Yuksa Bipyung Sa. 

  18. Han, H.-J., Oh, H.-J., & Yang, D. (2020). A study on the selection of preservation format for long-term preservation of electronic records. Journal of Korean Society of Archives and Records Management, 20(1), 69-87. https://doi.org/10.14404/JKSARM.2020.20.1.069 

  19. Ministry of the Interior and Safety (2018). Source data of public sector, preservation is mandatory. Press release. 2018.09.19. 

  20. Ministry of the Interior and Safety, National Information Society Agency (2019). Statistical report on public sector information resources based on the EA in 2019. 

  21. Hyun, M. (2005). A study on the management of dataset as records. Journal of the Korean Association of Records Management, 5(2), 103-124. https://doi.org/10.14404/JKSARM.2005.5.2.103 

  22. eCH-0165 (2018). SIARD format specification. Version 2.1 

  23. eCH-0233 (2019). Archivierung elektronischer steuerdaten und -akten der kantone. Version 1.0 

  24. Essen M. V., Rooij, M. D., Roberts, B., & Dobbelsteen, M. V. D. (2011). Database preservation case study: Review. National Archives of the Netherlands. 

  25. Giaretta, D., Matthews, B., Bicarregui, J., Lambert, S., Guercio, M., Michetti, G., & Sawyer D. (2009). Significant properties, authenticity, provenance, representation information andOAIS Information. Paper presented at the iPRES 2009: the Sixth International Conferenceon Preservation of Digital Objects, San Francisco, California.https://escholarship.org/uc/item/0wf3j9cw 

  26. Knight, G. (2008). Framework for the definition of significant properties. The National Archives, InSPECT Project Document. 

  27. Lindely, A. (2013). Database preservation evaluation report -SIARD vs. CHRONOS Preserving complex structures as databases through a record centric approach?. International Conference on Preservation of Digital Objects (iPres), Lisbon. https://doi.org/10.13140/2.1.3272.8005 

  28. NARA (2009). Significant properties. Retrieved from https://www.archives.gov/files/era/acera/pdf/significant-properties.pdf 

  29. The National Archives (2018. 5. 1). Significant properties. Retrieved from http://www.significantproperties.org.uk 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로