웹을 통한 정보의 폭발적인 팽창으로 웹기록 보존의 중요성이 높아지고 있다. 한편, 현재 보존되고 있는 표면웹보다 더 유용한 정보 자원으로 심층웹이 대두되었는데, 이 역시 추후 아카이빙이 대상이 되어야 한다는 것은 지극히 당연하다. 그러나 여태까지 그 담론이 제대로 이루어지지 않은 것은 심층웹이라는 대상 자체가 명확하지 않은 데에 그 일차적인 원인이 있다. 따라서 본 연구에서는 심층웹을 정의하고, 그 유형을 구분하여 아카이빙 시 발생할 수 있는 문제점을 도출하여 정리하는 데 일차적으로 그 목적을 두고 있다.
우선 아카이빙의 대상을 명확히 하기 위하여 기존에 전개된 이론을 정리하여 정의하고자 하였다. Invisible web과 Deep web을 중심으로 심층웹의 개념을 정의하고, 그 특징을 밝힌 연구를 정리하였다. 또 심층웹의 유형을 구분하고, 구체적으로 어떤 기술이 문제가 되는지 문헌 연구를 통해 밝히고자 하였다.
이를 바탕으로 아카이빙 시 발생할 수 있는 문제점을 도출하였다. 심층웹 아카이빙 시 가장 문제가 되는 것은 수집 단계로, 수집 방법과 수집 범위, 수집 기간의 책정이 주의 깊게 이루어져야 한다. 관리 단계에서는 조직화와 저장의 문제, ...
웹을 통한 정보의 폭발적인 팽창으로 웹기록 보존의 중요성이 높아지고 있다. 한편, 현재 보존되고 있는 표면웹보다 더 유용한 정보 자원으로 심층웹이 대두되었는데, 이 역시 추후 아카이빙이 대상이 되어야 한다는 것은 지극히 당연하다. 그러나 여태까지 그 담론이 제대로 이루어지지 않은 것은 심층웹이라는 대상 자체가 명확하지 않은 데에 그 일차적인 원인이 있다. 따라서 본 연구에서는 심층웹을 정의하고, 그 유형을 구분하여 아카이빙 시 발생할 수 있는 문제점을 도출하여 정리하는 데 일차적으로 그 목적을 두고 있다.
우선 아카이빙의 대상을 명확히 하기 위하여 기존에 전개된 이론을 정리하여 정의하고자 하였다. Invisible web과 Deep web을 중심으로 심층웹의 개념을 정의하고, 그 특징을 밝힌 연구를 정리하였다. 또 심층웹의 유형을 구분하고, 구체적으로 어떤 기술이 문제가 되는지 문헌 연구를 통해 밝히고자 하였다.
이를 바탕으로 아카이빙 시 발생할 수 있는 문제점을 도출하였다. 심층웹 아카이빙 시 가장 문제가 되는 것은 수집 단계로, 수집 방법과 수집 범위, 수집 기간의 책정이 주의 깊게 이루어져야 한다. 관리 단계에서는 조직화와 저장의 문제, 메타데이터의 개발, 장기 보존 전략의 수립, 메타데이터의 개발, 외관의 보존 문제 등이 존재한다. 이용을 위해서는 접근 도구의 개발과 접근 제어의 문제가 고려되어야 하며, 이외에도 관련 콘텐츠 및 기술의 지적 재산권, 개인 정보 유출이나 인권 문제에 대한 고려, 아카이브가 불법적인 정보를 보존 및 관리하는 데 따르는 위험성의 보장, 다기관 협력 등은 앞으로 웹 아카이빙의 발전을 위해 반드시 해결되어야 한다.
최종적으로는 기존의 웹 아카이빙 프로세스에서 심층웹 아카이빙과 관련하여 어떤 부분이 고려되어야 하는지를 중점적으로 설명하였다. 심층웹의 특성상 수집 단계에서부터 보존 및 전달 과정에 이르기까지 전 과정이 보다 유기적으로 관련을 맺고 있기 때문에, 수집을 위한 선별 과정에서부터 이에 대한 고려가 필요하다.
심층웹은 실질적으로 기존의 웹 아카이빙에 포함되지 못한 가치 있는 기록이므로 웹 아카이빙의 발전을 위해 반드시 해결되어야 한다. 따라서 본 연구의 의의는 현행 웹 아카이빙의 한계를 검토하고 앞으로 개선해야 할 방향을 제시하는 데에 있다고 할 수 있을 것이다.
웹을 통한 정보의 폭발적인 팽창으로 웹기록 보존의 중요성이 높아지고 있다. 한편, 현재 보존되고 있는 표면웹보다 더 유용한 정보 자원으로 심층웹이 대두되었는데, 이 역시 추후 아카이빙이 대상이 되어야 한다는 것은 지극히 당연하다. 그러나 여태까지 그 담론이 제대로 이루어지지 않은 것은 심층웹이라는 대상 자체가 명확하지 않은 데에 그 일차적인 원인이 있다. 따라서 본 연구에서는 심층웹을 정의하고, 그 유형을 구분하여 아카이빙 시 발생할 수 있는 문제점을 도출하여 정리하는 데 일차적으로 그 목적을 두고 있다.
우선 아카이빙의 대상을 명확히 하기 위하여 기존에 전개된 이론을 정리하여 정의하고자 하였다. Invisible web과 Deep web을 중심으로 심층웹의 개념을 정의하고, 그 특징을 밝힌 연구를 정리하였다. 또 심층웹의 유형을 구분하고, 구체적으로 어떤 기술이 문제가 되는지 문헌 연구를 통해 밝히고자 하였다.
이를 바탕으로 아카이빙 시 발생할 수 있는 문제점을 도출하였다. 심층웹 아카이빙 시 가장 문제가 되는 것은 수집 단계로, 수집 방법과 수집 범위, 수집 기간의 책정이 주의 깊게 이루어져야 한다. 관리 단계에서는 조직화와 저장의 문제, 메타데이터의 개발, 장기 보존 전략의 수립, 메타데이터의 개발, 외관의 보존 문제 등이 존재한다. 이용을 위해서는 접근 도구의 개발과 접근 제어의 문제가 고려되어야 하며, 이외에도 관련 콘텐츠 및 기술의 지적 재산권, 개인 정보 유출이나 인권 문제에 대한 고려, 아카이브가 불법적인 정보를 보존 및 관리하는 데 따르는 위험성의 보장, 다기관 협력 등은 앞으로 웹 아카이빙의 발전을 위해 반드시 해결되어야 한다.
최종적으로는 기존의 웹 아카이빙 프로세스에서 심층웹 아카이빙과 관련하여 어떤 부분이 고려되어야 하는지를 중점적으로 설명하였다. 심층웹의 특성상 수집 단계에서부터 보존 및 전달 과정에 이르기까지 전 과정이 보다 유기적으로 관련을 맺고 있기 때문에, 수집을 위한 선별 과정에서부터 이에 대한 고려가 필요하다.
심층웹은 실질적으로 기존의 웹 아카이빙에 포함되지 못한 가치 있는 기록이므로 웹 아카이빙의 발전을 위해 반드시 해결되어야 한다. 따라서 본 연구의 의의는 현행 웹 아카이빙의 한계를 검토하고 앞으로 개선해야 할 방향을 제시하는 데에 있다고 할 수 있을 것이다.
Web preservation is more important because information explosive expands through web. It is no wonder that deep web should be archive, which is regarded as an information resource better than surface web. However, discourse about deep web archiving is so far unsuccessful due to its ambiguity of defi...
Web preservation is more important because information explosive expands through web. It is no wonder that deep web should be archive, which is regarded as an information resource better than surface web. However, discourse about deep web archiving is so far unsuccessful due to its ambiguity of definition. Accordingly, this study has primarily goals that defines deep web, classifies its types, then derives issue while archiving.
First, this study attempt to define deep web through research. Definition concept of deep web is around 'Invisible web' and 'Deep web', then reviewed study on its character. After that, classifies types of deep web and explain what is the most problematic technically for deep web archiving by research review.
Based on this, issues can occur if the deep web archiving were derived. Acquisition is a most difficult problem when deep web archiving ― It is important to appropriate acquisition method, scope, timing and frequency. Organization and storage, metadata development, long term preservation, look and feel preservation etc should be considered in management stage. For using and delivery of the deep web, it is necessary to develop access tool which has access control function. Besides, it should solve intellectual property rights for relational contents or technic, infringement of privacy or human rights, ensuring risks archive as managed illegal information, interagency coordination etc.
At last, this paper tries to explain focusing deep web archiving in web archiving process. While deep web archiving, to consider preservation and delivery from selection is needed because entire process has significant relationship each other.
Deep web archiving should be resolved for development of web archiving, because deep web is worthy but actually not included in the existing web archiving. Therefore, this paper has significance that it has reviewed limitations of web archiving at present, thus suggested the direction for later works to develop.
Web preservation is more important because information explosive expands through web. It is no wonder that deep web should be archive, which is regarded as an information resource better than surface web. However, discourse about deep web archiving is so far unsuccessful due to its ambiguity of definition. Accordingly, this study has primarily goals that defines deep web, classifies its types, then derives issue while archiving.
First, this study attempt to define deep web through research. Definition concept of deep web is around 'Invisible web' and 'Deep web', then reviewed study on its character. After that, classifies types of deep web and explain what is the most problematic technically for deep web archiving by research review.
Based on this, issues can occur if the deep web archiving were derived. Acquisition is a most difficult problem when deep web archiving ― It is important to appropriate acquisition method, scope, timing and frequency. Organization and storage, metadata development, long term preservation, look and feel preservation etc should be considered in management stage. For using and delivery of the deep web, it is necessary to develop access tool which has access control function. Besides, it should solve intellectual property rights for relational contents or technic, infringement of privacy or human rights, ensuring risks archive as managed illegal information, interagency coordination etc.
At last, this paper tries to explain focusing deep web archiving in web archiving process. While deep web archiving, to consider preservation and delivery from selection is needed because entire process has significant relationship each other.
Deep web archiving should be resolved for development of web archiving, because deep web is worthy but actually not included in the existing web archiving. Therefore, this paper has significance that it has reviewed limitations of web archiving at present, thus suggested the direction for later works to develop.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.