$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

공간 데이터웨어하우스에서 효율적인 공간 데이터 적재를 위한 이기종 데이터 소스의 비중복 추출기법
Non Duplicated Extract Method of Heterogeneous Data Sources for Efficient Spatial Data Load in Spatial Data Warehouse 원문보기

한국공간정보시스템학회 논문지 = Journal of Korea Spatial Information System Society, v.11 no.2, 2009년, pp.143 - 150  

이동욱 (인하대학교 정보공학과) ,  백성하 (인하대학교 정보공학과) ,  김경배 (서원대학교 컴퓨터교육과) ,  배해영 (인하대학교 정보공학부)

초록
AI-Helper 아이콘AI-Helper

공간 데이터웨어하우스는 공간 DBMS 또는 다양한 소스데이터로부터 시간에 따라 추출된 공간데이터를 ETL 과정을 통해 가공된 데이터를 관리하는 시스템이다. 적재 주기 마다 추출된 공간데이터는 비공간 데이터와 달리 같은 주제의 중복된 공간 정보가 유용하지 않으며, 공간 데이터의 특징으로 저장 공간의 낭비가 크다. 또한 이기종간의 시스템에서 소스 데이터를 추출할 경우 서로 다른 공간데이터 타입 및 스키마를 가지고 있어 이를 위한 공간데이터 추출 기법이 요구된다. 기존 기법에서는 기준이 되는 Geocoding DB를 이용하여 추출된 공간데이터에 대한 주소 매칭과정을 수행함으로써, 정형화된 데이터 셋을 적재한다. 하지만 이 기법은 추출 데이터를 매번 Geocoding DB와 비교 연산이 발생하며, 주제별로 공간 데이터를 통합 관리함에 따라 이 기종 공간 DBMS 사이에 중복된 데이터를 고려하지 않는 문제점이 있다. 본 논문에서는 공간 데이터웨어하우스 구축기 내에서 이 기종의 소스 시스템으로부터 추출된 갱신질의 통합을 이용한 효율적 추출 기법을 제안한다. 이는 이 기종의 공간 DBMS로부터 발생한 과거 적재 시점부터 현재까지 발생한 질의 중 삽입이나 삭제 등의 업데이트 관련 질의만을 추출하여 공간데이터의 불필요한 추출 연산 비용을 제거한다. 또한 소스 공간 데이터베이스 관리시스템의 업데이트 질의를 이용하여 추출된 공간 데이터를 주제별로 중복 제거 및 통합 한다. 제안 기법은 데이터 중복 저장에 의한 저장 공간의 낭비를 줄이고, 적재시점 별 통합된 데이터를 적재함으로써 빠른 공간데이터 분석을 지원할 수 있다.

Abstract AI-Helper 아이콘AI-Helper

Spatial data warehouses are a system managing manufactured data through ETL step with extracted spatial data from spatial DBMS or various data sources. In load period, duplicated spatial data in the same subject are not useful in extracted spatial data dislike aspatial data and waste the storage spa...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 공간 데이터웨어하우스에서 효율적인 공간 데이터 적재를 위한 이기종 간의 비중복 추출 기법을 제안하였다.
  • 본 논문에서는 공간 데이터웨어하우스에서 효율적인 공간 데이터 적재를 위한 이기종 간의 비중복 추출 기법을 제안한다. 제안기법은 소스 시스템으로부터 과거 적재 시점부터 현재까지 발생한 질의 중 삽입이나 삭제 등 데이터의 갱신이 발생되는 질의만을 추출하여 불필요한 데이터의 추출 연산 비용을 제거한다.
  • 본 장에서는 효율적인 공간데이터 적재를 위한 이기종 시스템간의 추출기법을 제안한다. 이는 소스 공간 DBMS 로부터 업데이트가 발생된 공간데이터만을 추출하고 적재 시점별, 주제별로 통합하는 연산과정을 포함한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
시맨틱 기반의 소스 데이터 추출 기법은 이기종 소스 시스템으로 추출된 다른 이름을 가진 데이터의 스키마를 다루기 위해 어떤 단계를 지니나? 이러한 적재 기법 중 유사 시맨틱 기반의 데이터 변환을 통한 적재 기법이 제안되었다[18]. 시맨틱 기반의 소스 데이터 추출 기법은 이기종 소스 시스템으로 추출된 다른 이름을 가진 데이터의 스키마를 다루기 위해 유사 시맨틱을 기반으로 공통의 사전(Dictionary)을 생성하는 어플리 케이션 사전의 생성 단계 및 데이터 소스들에 주석을 달기 위한 데이터 저장소의 주석 생성 단계를 지닌다. 또한, W3C에서 지정한 OWL(Web Ontology Language)를 이용하여 이 기종이기 때문에 가지는 소스 시스템 사이의 스키마의 불일치성 즉, 추출된 소스 데이터들의 의미론적 충돌을 해결하며 이러한 의미론적 충돌 해결을 통해 추출된 데이터가 가지고 있는 이 기종간 정보들의 통합을 수행하게 된다.
Geocoding DB를 통한 공간데이터의 적재방법은 어떤 문제점을 지니고 있나? 첫째, 기준이 되는 Geocoding DB를 이용하는데 있어서 Geocoding DB는 언제나 최신의 데이터를 가지고 있을 것이 요구된다. 즉, 공간데이터웨어하우스의 소스로 사용되는 각 시스템들로부터 얻어온 가장 최근에 업데이트가 발생된 공간데이터를 적재하는 과정에서 만약, 기준이 되는 Geocoding DB가 최신의 공간데이터에 대한 정보가 갱신 전이라면 소스 시스템으로부터 추출된 최신의 업데 이트 데이터는 잘못된 데이터로 인식하여 SDW(Spatial Data Warehouse)시스템 내에 적재되지 않는다. 둘째, Address Matching으로 정형화된 Geometric 좌표값을 얻는 것은 이 기종 시스템으로부터 추출된 주제별 공간데이터에 대하여 하나씩 Geocoding DB와 비교연 산을 수행해야 하므로 자연히 데이터 비교연산 비용증가에 따른 전체 시스템에서의 공간데이터 적재비용이 증가하는 단점이 존재한다. 또한, 같은 주제의 공간 데이터에 대해 과거 적재시점의 공간데이터와 중복 제거를 고려하지 않기 때문에 저장 공간을 낭비한다.
공간 데이터웨어하우스는 무엇인가? 공간 데이터웨어하우스는 공간 DBMS 또는 다양한 소스데이터로부터 시간에 따라 추출된 공간데이터를 ETL 과정을 통해 가공된 데이터를 관리하는 시스템이다. 적재 주기 마다 추출된 공간데이터는 비공간 데이터와 달리 같은 주제의 중복된 공간 정보가 유용하지 않으며, 공간 데이터의 특징으로 저장 공간의 낭비가 크다.
질의응답 정보가 도움이 되었나요?

참고문헌 (20)

  1. S. Chaudhuri, U. Dayal, “An Overview of Data 

  2. W. H. Inmon, “Building the Data Warehouse,” 

  3. E. Sperley, “The EnterpriseData Warehouse: 

  4. L. Savary, K. Zeitouni, “Spatial Data Warehouse 

  5. ESRI, “Spatial Data Warehousing for Hospital 

  6. ESRI, “Spatial Data Warehousing,” An ESRI 

  7. Oracle, “Oracle Spatial,” An Oracle White Paper, 

  8. 전병윤, 이동욱, 유병섭, 배해영, “공간 데이터웨어하우스에서 GML데이터의 효율적인 적재를 위한 데이터 통합기법,” 한국정보처리학회 2006년 춘계학술대회, Vol. 13, No. 1, 2006, pp. 27-30. 

  9. 유병섭, 김경배, 이순조, 배해영, “공간 데이터 웨어하우스에서 공간 분석을 위한 공간 집계 연산,” 한국공간정보시스템학회 논문지, Vol. 9, No. 3, 2007, pp. 

  10. L. Stoimenov, S. Djordjevic, D. Stojanovic, 

  11. ESRI, “Spatial Data Standards and GIS 

  12. M. Howard, O. Dreza, “Combining Heterogeneous 

  13. A. Simitsis, P. Vassiliadis, T. Sellis, “Optimizing 

  14. C. Squire, “Data extraction and transformation 

  15. Oracle, “Integrated ETL and Modeling,” An 

  16. 박동선, 배해영, “다차원 지리정보시스템을 위한 저장기법 및 분리된 저장구조,” 한국정보처리학회 논문지, Vol. 7, No. 1, 2000, pp 1-11. 

  17. 전치수, 이동욱, 유병섭, 이순조, 배해영, “공간 데이터웨어하우스에서 시공간 분석 지원을 위한 비 중복적재기법,” 한국공간정보시스템학회 논문지, Vol. 9, No. 2, 2007, pp. 81-91. 

  18. D. Skoutas, A. Simitsis, “Designing ETL processes 

  19. X. CHEN, Z. CHI, X. CAO, “Applying DP to 

  20. TIGER/Line Files, 2000 Technical Documentatio 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로