웹기록물은 공공기관의 업무활동이나 전자상거래에 대한 법적증거로 활용될 수 있기 때문에 보존할 가치가 있는 정보이지만 웹기록물의 특징 중 하나인 '휘발성'으로 인해 소실되고 있다. 따라서 이렇게 사라지는 웹기록물을 장기보존하기 위한 장기보존포맷이 정의되어야 한다. 웹기록물은 전자기록물의 일종이기 때문에 전자기록물 장기보존포맷에 보존할 수 있어야 한다. 하지만 현재 표준으로 제시된 포맷은 웹기록물의 특성을 고려하지 않고 정의되었기 때문에 웹기록물을 보존할 수 없다. 본 논문에서는 표면/심층 웹기록물 문서보존포맷으로 연구된 KoDeWeb/KoSurWeb과 전자기록물 장기보존포맷을 분석하고, 이를 바탕으로 웹기록물을 보존할 수 있는 확장된 전자기록물 장기보존포맷을 정의하였다. 정의된 포맷을 활용하면 웹기록물도 전자기록물들과 같이 보존되어 활용될 수 있고, 전자 상거래에 관련된 공공기관의 웹기록물을 보존함으로써 전자 상거래에 대한 법적 증거로서 활용될 수 있다.
웹기록물은 공공기관의 업무활동이나 전자상거래에 대한 법적증거로 활용될 수 있기 때문에 보존할 가치가 있는 정보이지만 웹기록물의 특징 중 하나인 '휘발성'으로 인해 소실되고 있다. 따라서 이렇게 사라지는 웹기록물을 장기보존하기 위한 장기보존포맷이 정의되어야 한다. 웹기록물은 전자기록물의 일종이기 때문에 전자기록물 장기보존포맷에 보존할 수 있어야 한다. 하지만 현재 표준으로 제시된 포맷은 웹기록물의 특성을 고려하지 않고 정의되었기 때문에 웹기록물을 보존할 수 없다. 본 논문에서는 표면/심층 웹기록물 문서보존포맷으로 연구된 KoDeWeb/KoSurWeb과 전자기록물 장기보존포맷을 분석하고, 이를 바탕으로 웹기록물을 보존할 수 있는 확장된 전자기록물 장기보존포맷을 정의하였다. 정의된 포맷을 활용하면 웹기록물도 전자기록물들과 같이 보존되어 활용될 수 있고, 전자 상거래에 관련된 공공기관의 웹기록물을 보존함으로써 전자 상거래에 대한 법적 증거로서 활용될 수 있다.
Web records is valuable information to preserve, because it can be used as a legal evidence about business or e-commerce of a public institution, but it is easily disappeared because of its volatile characteristic. Therefore, archival information package should be defined for long-term preservation....
Web records is valuable information to preserve, because it can be used as a legal evidence about business or e-commerce of a public institution, but it is easily disappeared because of its volatile characteristic. Therefore, archival information package should be defined for long-term preservation. Web records can be stored in the archival information package for electronic records, because web records is a kind of electronic records. However, the NEO(NARS Encapsulation Object), the archival information package for electronic records in Korea, can't able to store web records, because it was developed without consideration of the characteristic of web records. In this paper, we define extended NEO based on the analysis of KoSurWeb and KoDeWeb, that archival information package for document of surface and deep web as well as the NEO. Web records can be preserved and utilized along with electronic records by using the extended NEO. Also it can be used for record and legal evudence by archiving web records of public institution about e-commerce.
Web records is valuable information to preserve, because it can be used as a legal evidence about business or e-commerce of a public institution, but it is easily disappeared because of its volatile characteristic. Therefore, archival information package should be defined for long-term preservation. Web records can be stored in the archival information package for electronic records, because web records is a kind of electronic records. However, the NEO(NARS Encapsulation Object), the archival information package for electronic records in Korea, can't able to store web records, because it was developed without consideration of the characteristic of web records. In this paper, we define extended NEO based on the analysis of KoSurWeb and KoDeWeb, that archival information package for document of surface and deep web as well as the NEO. Web records can be preserved and utilized along with electronic records by using the extended NEO. Also it can be used for record and legal evudence by archiving web records of public institution about e-commerce.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
공공기관도 초기에는 웹을 단순한 기관의 홍보를 위한 목적으로 사용하였다. 그러나 이러한 흐름에 맞춰 행정업무의 일부를 웹 사이트에서 처리하고, 기업과 정부 기관(B2G : Business-to-Government)과의 전자상거래를 활성화하여 여러 기관의 각종 신청서 제공, 세무 양식 제공, 공과금 납부와 같은 업무를 웹에서 지원하고 기업이 정부 기관의 구매요건을 파악한 뒤 제안서를 제출할 수 있도록 활용하고 있다.
관련 연구에서는 전자기록물 장기보존포맷이 웹기록물을 보존할 수 있도록 메타데이터와 컨텐츠를 확장하기 위해서 웹기록물 문서 보존포맷의 메타데이터와 컨텐츠를 살펴보았다. 웹기록물을 보존하기 위한 문서보존포맷으로는 표면 웹기록물을 보존하기 위한 문서 보존포맷인 KoSurWeb과 심층 웹기록물을 보존하기 위한 문서보존포맷인 KoDeWeb이 있다.
하지만 기존의 전자기록물 장기보존포맷은 웹기록물의 내용이 가지는 특수성과 웹기록물의 보존및 복원에 관련된 정보들을 정의하지 않았다. 따라서 본 논문에서는 전자기록물 장기보존포맷이 웹기록물 문서 보존포맷을 수용할 수 있도록 전자기록물 장기보존포맷의 메타데이터와 컨텐츠를 확장하여 설계하였다. <표 1>은 전자기록물 장기보존포맷의 일종인 기록물건 장기보존포맷의 메타데이터와 웹기록물 문서 보존포맷의 메타데이터를 비교 분석하여 전자기록물 장기보존포맷의 메타데이터를 확장하여 정의한 것이다.
특히‘휘발성’ 특징을 가진 웹기록물은 생성과 삭제가 빈번하게 이루어지기 때문에 보존의 가치가 있는 자원이지만 많은 양의 업무 기록및 전자상거래에 대한 법적 증거들이 소실되고 있다[8]. 따라서 본 논문의 목적은 이와 같이 소실되는 웹기록물을 보존하기 위한 웹기록물 장기보존포맷을 설계하는 것이다.
또한 확장 설계한 전자기록물 장기보존포맷의 적용성을 확인하기 위해서 국가기록원의 웹기록물을 대상으로 확장된 전자기록물 장기보존포맷에 웹기록물 문서보존포맷을 보존하였다. 그 결과 확장 설계한 전자기록물 장기보존포맷이 웹기록물 문서보존포맷을 온전히 보존할 수 있다는 것을 확인하였다.
본 논문에서는 보존의 가치가 있지만 자체의 특성으로 인하여 소실되고 있는 웹기록물을 보존하기 위해서 KoSurWeb과 KoDeWeb 의 메타데이터들을 분석하고 그리고 이를 바탕으로 기존의 전자기록물 보존포맷인 전자 기록물 장기보존포맷을 확장하여 웹기록물의 보존에 적합한 확장된 전자기록물 장기보존 포맷을 정의하였다.
기록물철 장기보존포맷은 특정 사안에 관련된 기록물건 장기보존포맷들을 모아 정리한 것으로 웹기록물인 경우 정책에 의해 정해진 특정 기간 안에 수집된 모든 표면/심층 웹기록물이 이에 해당한다. 본 논문에서는 한번 수집된 표면/심층 웹기록물을 저장할수 있는 기록물건 장기보존포맷을 대상으로 메타데이터와 컨텐츠를 확장하였다.
이러한 문제점을 해결하기 위해서 본 논문에서는 전자기록물 장기보존포맷이 웹기록물에 관련된 내용을 명시할 수 있도록, 기존의 전자기록물 장기보존포맷의 메타데이터의 범위를 확장시키고, 웹기록물의 보존 및 복원에 관련된 정보들을 저장할 수 있도록 기술 메타데이터 항목을 추가시켰다.
제안 방법
KoDeWeb(Korea Deep Web)은 심층 웹기록물에 대한 문서보존포맷이다. KoDeWeb의 메타데이터는 데이터베이스에서 추출한 심층 웹기록물의 메타데이터와 컨텐츠를 저장하기 위해서 SIARD(Software Independent Archival of Relation Database)[13]의 메타데이터를 참조하고, 국내의 심층 웹기록물을 분석하여 정의되었다. KoDeWeb은 KoSurWeb과 마찬가지로 XML로 구성되기 때문에, 소프트웨어나 하드웨어에 독립적이며, 하나의 포맷으로 구성되어 있기 때문에 문서보존포맷의 전송및 보존과정에서 손실이 적다는 장점이 있다.
하지만 전자기록물 장기보존포맷의 경우는 전송 및 보존에 따른 손실이 적게 하기 위해 컨텐츠를 단일화하여 ‘DocumentData’에 BIT Stream 형태로 저장한다. 따라서 WARC 파일포맷 형태로 저장된 KoSurWeb의 컨텐츠와 ZIP64 파일포맷 형태로 저장된 KoDe Web의 컨텐츠를 전자기록물 장기보존포맷에서 포함할 수 있도록 Base64 데이터 포맷 형태로 인코딩하여 저장한다. <그림 4>는 확장된 전자기록물 장기보존포맷에 대한 구조로, 박스 안의 메타데이터가 웹기록물을 보존할 수 있도록 확장된 메타데이터들이다.
따라서 전자기록물 장기보존포맷이 이러한 메타데이터들을 포함할 수 있도록 상위 메타데이터로 ‘TechnicalMetadata’를 추가하고 기술 메타데이터의 하위 항목으로 데이터베이스 연결 정보인 ‘Connection’을 포함 하기 위한 ‘Connection’, 아카이빙을 수행한 컴퓨터의 도메인 정보인 ‘DNS’를 포함하기 위한 ‘DNS’, 데이터베이스에 대한 제품 및 버전 정보인 ‘Database’를 포함하기 위한 ‘Data base’ 메타데이터를 추가하였다.
따라서 해당 메타데이터를 기록물건 장기보존포맷에서 포함할 수 있도록 문서의 버전정보인 ‘Version’을 포함하기 위한 ‘Version’, 기여자 정보인 ‘Contributor’를 포함하기 위한 ‘Contributor’, 웹기록물의 수용 범위에 대한 정보인‘Coverage’를 포함하기 위한 ‘Coverage’, 데이터베이스의 스키마에 대한 정보인 ‘Schemas’를 포함하기 위한 ‘Schemas’, 데이터베이스 사용자에 대한 정보인 ‘User’를 포함시키기 위한 ‘Users’, 데이터베이스 사용자 권한에 대한 정보인 ‘Role’을 포함하기 위한 ‘UserRoles’ 메타데이터, 데이터베이스의 시스템 권한에 대한 정보인 ‘Authorization’를 포함하기 위한‘SystemRoles’ 메타데이터를 추가하였다.
본 논문에서는 이렇게 구성된 국가기록원의 KoSurWeb과 KoDeWeb을 확장 설계한 전자기록물 장기보존포맷에 적용하였다. <표 3>은 KoSurWeb의 메타데이터 일부를 발췌한 예시이고, <표 4>는 KoDeWeb의 메타데이터의 일부를 발췌한 예시이다.
이를 위해서 기록물건 장기보존포맷은 과 같이 기록물건 메타데이터, 문서보존포맷, 전자 기록물 원문, 전자서명으로 구성되어 있다.
따라서 기록물건 장기보존포맷이 웹기록물 문서보존포맷을 포함하기 위해서는 기록물건 장기보존포맷의 문서보존포맷이 웹기록물 문서보존포맷을 포함해야 한다. 이를 위해서본 논문에서는 먼저 기록물건 장기보존포맷의 문서보존포맷과 웹기록물 문서보존포맷인 KoSurWeb과 KoDeWeb의 메타데이터를 먼저 살펴보았다.
대상 데이터
기록물건 메타데이터는 전자기록물을 유지하고 이해하는데 필요한 정보들을 포함하는 메타데이터이다. 기록물건 메타데이터는 AgentCon, MandateCon, IdentifierCon, TitleCon, DescriptionCon, StorageCon, Classification Con, IndexCon, CreationCon, Preservation Con, TranscationCon, RightManagementCon, ManagementHistoryCon, UseHistoryCon, RelationCon 등 총 15개의 상위요소를 가진다.
여러 공공기관 중 국가기록원의 웹사이트의 경우, 다양한 형태의 컨텐츠를 포함하고 있고, 시스템적인 정보들 역시 풍부하여 이러한 조건을 충족한다. 또한 문서보존포맷으로 구성 시 다양한 메타데이터를 충족시킬 수 있기 때문에 적용 시험 대상으로 선정하였다.<그림 5>는 국가기록원 웹 사이트의 구성요소들을 도식화한 것이다.
성능/효과
또한 확장 설계한 전자기록물 장기보존포맷의 적용성을 확인하기 위해서 국가기록원의 웹기록물을 대상으로 확장된 전자기록물 장기보존포맷에 웹기록물 문서보존포맷을 보존하였다. 그 결과 확장 설계한 전자기록물 장기보존포맷이 웹기록물 문서보존포맷을 온전히 보존할 수 있다는 것을 확인하였다.
적용 시험 결과 웹기록물 문서보존 포맷의 메타데이터 및 컨텐츠가 확장된 전자기록물 장기보존포맷에 손실 없이 저장된 것을 확인하였다.
후속연구
또한 XML로 구성되어 있기 때문에 소프트웨어나 하드웨어에 독립적이며, 단일화된 패키지로 구성이 되어 있기 때문에 전송 및 보존에 따른 손실이 적다는 장점이 있다. 뿐만 아니라 전자 상거래에 대한 공공기관의 웹기록물을 보존함으로써 전자 상거래에 대한 기록 및 법적 증거로서 장기간 보존되고 활용될 수 있고, 나아가 웹 정보검색 기술의 활용 및 민간이 운영하는 웹사이트에 대한 영구보존에 활용될 수 있다.
질의응답
핵심어
질문
논문에서 추출한 답변
웹기록물이란 무엇인가?
웹기록물이란 이와 같이 공공기관의 웹사이트에 포함된 정보 뿐만 아니라 전자상거래시 웹상에서 처리한 업무의 결과로서 보유되고 업무과정에서 생산 접수되는 정보이다. 이러한 정보들은 생산 및 접수과정에 대한 법적 증거일 뿐만 아니라 그 내용 자체가 정보 가치가 있기 때문에 이를 유지 관리 및 보존해야 한다[1].
KoSurWeb이란 무엇인가?
KoSurWeb(Korea Surface Web)은 표면 웹기록물에 대한 문서보존포맷이다. KoSurWeb은 더블린코어(Dublin Core)[11]의 메타데이터를 기반으로 정의되었기 때문에 국내외적으로 호환성을 가지고 있으며 XML로 구성되어 있어 소프트웨어나 하드웨어에 독립적이고 개방적이다.
사라지는 웹기록물을 장기보존하기 위한 장기보존포맷이 정의되어야 하는 배경은 무엇인가?
웹기록물은 공공기관의 업무활동이나 전자상거래에 대한 법적증거로 활용될 수 있기 때문에 보존할 가치가 있는 정보이지만 웹기록물의 특징 중 하나인 '휘발성'으로 인해 소실되고 있다. 따라서 이렇게 사라지는 웹기록물을 장기보존하기 위한 장기보존포맷이 정의되어야 한다.
참고문헌 (13)
김유성, "공공기록물 관리에 관한 법률의 제정 의의와 개선방안", 한국기록관리학회, 제8권, 제1호, 2008, pp. 5-25.
차승준, 이규철, "Extension of the NARS Encapsulated Object to Accommodate Surface Web Records in Public Sector", 한국정보과학회 데이터베이스 소사이어티, The Second International Conference on Emerging Database, 2010, pp. 184-188.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.