[논문]SOA 기반 서비스 사이의 오류 데이터 정제 서비스 개발

지은미; 최병주; 이정원

doi:10.3745/kipstd.2007.14-d.7.829

[국내논문] SOA 기반 서비스 사이의 오류 데이터 정제 서비스 개발
Developing dirty data cleansing service between SOA-based services 원문보기

정보처리학회논문지. The KIPS transactions. Part D. Part D, v.14D no.7, 2007년, pp.829 - 840

지은미 (이화여자대학교 컴퓨터학과) , 최병주 (이화여자대학교 컴퓨터학과) , 이정원 (아주대학교 정보통신대학 전자공학부)

초록
AI-Helper

현재까지 오류 데이터를 정제하는 기법은 여러 소스로부터 대량의 데이터를 통합하여 데이터베이스에 저장되어 있는 데이터의 품질을 관리함으로써 의미 있는 정보를 추출하기 위함이었다. 급변하는 비즈니스 환경과 무한경쟁 사회에서 지속적으로 생존하려면 환경 변화에 빠르게 대처해야 한다. 최근 시스템의 요구사항이 복잡해짐에 따라 대규모의 분산 시스템을 통합 구축하기 위한 서비스 기반 구조 (Service Oriented Architecture)로 확산되고 있으며, 여기에서도 각 서비스간의 데이터 정제기법을 통한 신뢰성 있는 데이터 교환이 필수적이다. 따라서 본 논문에서는 서비스들이 하나의 시스템으로 통합되는 과정에서 이벤트를 통해 서비스 간에 전송되는 XML데이터의 품질 관리를 수행하여, 이미 통합되어 저장된 데이터베이스 데이터의 오류를 탐지하여 정제하는 것이 아니라 상호 작용하는 서비스간의 데이터 정제에 초점을 두고 SOA를 기반으로 하는 오류 데이터 정제 서비스를 개발한다.

Abstract ▼ AI-Helper

Dirty Data Cleansing technique so far have aimed to integrate large amount of data from various sources and manage data quality resided in DB so that it enables to extract meaningful information. Prompt response to varying environment is required in order to persistently survive in rapidly changing business environment and the age of limitless competition. As system requirement is recently getting complexed, Service Oriented Architecture is proliferated for the purpose of integration and implementation of massive distributed system. Therefore, SOA necessarily needs Data Exchange among services through Data Cleansing Technique. In this paper, we executed quality management of XML data which is transmitted through events between services while they are integrated as a sole system. As a result, we developed Dirty Data Cleansing Service based on SOA as focusing on data cleansing between interactive services rather than cleansing based on detection of data error in DB already integrated.

Keyword

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

본 논문에서는 SOA의 기본 원리에 충실하면서 서비스간의 상호 작용하는 데이터의 품질을 보장할 수 있도록 서비스 간의 실시간 데이터의 오류를 탐지하고 정제할 수 있는 방법을 제안하고, SOA를 지원하는 표준으로 XML을 사용하여 데이터 집합과 제약 조건에 대한 변화를 융통성 있게 처리할 수 있는 서비스로 개발한다. 먼저 서비스간의 정제되어야 할 오류 데이터의 체계를 확립하고 오류를 탐지하고 정제하기 위한 규칙을 제안하며, 제안된 규칙을 기반으로 SOA의 기본 원리를 만족시키기 위한 서비스를 설계하고 개발 절차를 확립한다.
그러나 이미 데이터가 모두 수집된 데이터베이스 내에서의 데이터 정제 기법만을 고려한다면 웹 서비스를 이용하는 SOA기반 시스템들에서 상호 작용하는 데이터의 품질을 고려할 수 있는 방법이 없다. 본 논문에서는 서비스 통합시 데이터의 품질을 보장할 수 있는 방법을 제안한다. 이는 최근의 데이터 품질의 정의와 같이 프로세스 자체에 데이터 품질을 개선하려는 노력과 SOA의 서비스 작성과 관리를 위한 기본 원리를 따르는 목적에 부합한다.
따라서 본 논문에서는 데이터품질 정제 도구를 종속되는 시스템이나 어플리케이션과는 독립적으로 동작할 수 있는 서비스를 개발한다. 아래의 <표 1>은 지금까지 설명한 기존의 데이터 정제 도구들의 특성과 본 논문에서 제안한 CleanS (dirty data Clean Service) 서비스 데이터 정제 도구를 비교한 표이다.
따라서 본 논문에서는 SOA의 기본 원리에 충실하면서 서비스간의 상호 작용하는 데이터의 품질을 보장할 수 있도록 서비스 간의 데이터의 품질을 탐지하고 정제할 수 있는 방법을 제안하고 이를 서비스로 개발한다.
아직까지 대부분의 연구에서의 정제 과정은 도메인 전문가에게 맡기고 있다. 따라서 본 논문에서도 정제 행위의 주체는 서비스 사용자로서 앞의 탐지 과정에서 위배된 규칙과 카테고리를 제시함으로써 정제를 위한 최대 정보를 제공하는 것을 목표로 한다. 만약 서비스 사용자도 정제할 수 없는 데이터라면 그대로 처리하지 않고 본 서비스의 앞 단에 결합된(여기에서는 서비스 A) 서비스에 피드백 메시지를 줄 필요가 있다.
서비스들로 시스템을 구성하고 데이터 품질을 관리하면, 서비스가 실행된 후 서비스가 사용하는 데이터에 적합한 오류 데이터 측정 기준을 한번 설정한 이후 반복적인 이벤트 발생을 통해 입력된 데이터의 오류를 측정한 결과를 사용자가 얻게 된다. 본 논문에서는 개발한 서비스가 과연 얼마나 오류 데이터를 정제하는 데 효과적인지 보이기 위해 CRM에서 ERP로 총 데이터 이벤트를 200회 발생 시켰다.

가설 설정

개발된 서비스의 입력 변환, 탐지 및 정제 , 결과에 대한 단계별 사용자 시나리오를 시퀀스 다이어그램으로 표현하였다. 시나리오는 하나의 입력 이벤트에 대한 사용자의 시나리오를 가정하였고 여러 이벤트에 대한 통계는 5.3절의 적용 결과에서 설명한다.

제안 방법

본 논문에서는 SOA의 기본 원리에 충실하면서 서비스간의 상호 작용하는 데이터의 품질을 보장할 수 있도록 서비스 간의 실시간 데이터의 오류를 탐지하고 정제할 수 있는 방법을 제안하고, SOA를 지원하는 표준으로 XML을 사용하여 데이터 집합과 제약 조건에 대한 변화를 융통성 있게 처리할 수 있는 서비스로 개발한다. 먼저 서비스간의 정제되어야 할 오류 데이터의 체계를 확립하고 오류를 탐지하고 정제하기 위한 규칙을 제안하며, 제안된 규칙을 기반으로 SOA의 기본 원리를 만족시키기 위한 서비스를 설계하고 개발 절차를 확립한다.
개발된 오류 데이터 정제 서비스는 SOA를 기반으로 하여 작성되는 서비스의 질을 높이고 e-Business시스템과 같이 상호작용이 많은 시스템의 데이터를 효과적으로 관리할 수 있게 한다. 실제 개발된 서비스는 SOA를 기반으로 CRM(Customer Relationship Management) 시스템과 ERP(Enterprise Resource Planing) 서비스를 통합하는데 적용하여 두 서비스간의 상호작용하는 데이터의 오류를 정제하는 실험을 하였다. 실제 오류 데이터를 탐지 및 정제하고 이에 대한 통계를 제시함으로써 두 서비스간의 상호 작용하는 데이터의 오류를 30% 넘게 줄이는 효과를 보였다.
이 장에서는 본격적인 오류 데이터 정제 서비스를 설계하기 전에 서비스 간에 오류로 판단되는 데이터의 종류를 분류한다. 선행 연구로서 데이터베이스로의 데이터 수집, 통합, 저장 등에서 발생 할 수 있는 오류들을 33가지[17] 분류하였고, 본 논문에서 요구되는 서비스간의 상호 작용 시 발생할 수 있는 오류를 위해서는 재정리한 6가지[18] 데이터 오류 타입을 이용하여 SOA상에서 오류 데이터 정제를 위한 기본적인 서비스를 설계한다. 또한 입출력에 관련된 모든 명세를 데이터 교환의 표준으로 자리 잡은 XML로 명세화 한다[19].
(그림1)과 같이 오류 데이터 정제 서비스에서 오류 데이터 측정 기준은 데이터가 전송되는 단계에서의 오류데이터 분류 체계를 기반으로 하며, 실제로 사용되고 있는 여러 XML문서의 엘리먼트 태그를 통해서 어떠한 오류 데이터가 발생할 수 있는지를 분석한 후, 그 분석을 바탕으로 시스템을 구성하는 각 서비스들은 오류 데이터 정제 서비스에게 제공하는 오류 데이터 측정 기준을 바탕으로 자신의 XML 데이터와 기능에 맞는 기준을 선택한다.
XML 문서들에서 엘리먼트의 태그이름과 각 엘리먼트의 레벨 및 데이터들을 바탕으로 문서의 DTD(Document Type Description)와 실 데이터를 이용하여 오류 데이터의 측정기준을 분석한다. 각 엘리먼트의 태그들이 가지고 있는 데이터가 지닌 의미와 적용 가능한 오류 데이터의 기준을 찾아내고, 서비스들이 데이터를 전송할 때 검사해야 할 오류들을 분석하여 해당 기준을 설정한다.
XML 문서들에서 엘리먼트의 태그이름과 각 엘리먼트의 레벨 및 데이터들을 바탕으로 문서의 DTD(Document Type Description)와 실 데이터를 이용하여 오류 데이터의 측정기준을 분석한다. 각 엘리먼트의 태그들이 가지고 있는 데이터가 지닌 의미와 적용 가능한 오류 데이터의 기준을 찾아내고, 서비스들이 데이터를 전송할 때 검사해야 할 오류들을 분석하여 해당 기준을 설정한다.
XML 문서의 엘리먼트에 대한 분석을 통해 얻어진 오류 데이터 측정 기준들 가운데 각 서비스들은 자신들이 사용하는 데이터가 어떠한 측정 기준을 적용하여 오류 데이터를 분류할 것인지를 결정한다. XML 문서로부터 오류 데이터 분류 체계 중에서 관련 있는 항목들을 찾아내고, 필요에 따라 세부 카테고리를 지정하여 오류 데이터 측정을 위한 기준을 찾아낸다. XML 문서로 입력된 데이터의 오류는 사용자가 지정한 오류 데이터 측정 기준에 따라 탐지한다.
오류 데이터 정제 기법을 이용하여 SOA상에서 오류 데이터 정제를 위한 기본적인 서비스를 제안한다.
사용자 입력 데이터와 측정 기준이 포함되어 있는 XML 문서를 가지고 오류 데이터를 탐지하여 그 결과를 보여 주고, 서비스 사용자가 오류 데이터를 정제할 수 있는 환경을 제공한다. 오류 데이터를 정제한 후, 현재 입력된 데이터의 오류 데이터 측정 기준 및 데이터에 따른 오류 데이터 발생률과 서비스 적용 후 오류 데이터 발생률을 비교해줌으로써 오류가 얼마나 정제 되었는지를 보여준다.
본 논문에서는 CleanS 서비스 활용사례로써 아래 (그림 8)과 같이 SOA시스템에 적용한 환경은 물품 거래 시스템으로 제품을 주문하는 CRM 서비스(Service A), 주문에 대한 승인과 거절을 결정하는 ERP 서비스(Service B)를 중심으로, 거래 정보를 전달하고 보여주는 여러 서비스들을 통합하여 서비스를 구성하였다. Service A와 Service B를 결합할 때 두 시스템간의 상호 작용하는 데이터의 오류 관리를 위해 본 논문에서 개발한 “CleanS (dirty data Clean Service)”를 적용하였다.
다음 (그림 9)는 사용자 시나리오를 도식화 한 것이다. 개발된 서비스의 입력 변환, 탐지 및 정제 , 결과에 대한 단계별 사용자 시나리오를 시퀀스 다이어그램으로 표현하였다. 시나리오는 하나의 입력 이벤트에 대한 사용자의 시나리오를 가정하였고 여러 이벤트에 대한 통계는 5.
입력변환 과정에서 생성된 데이터와 제약 조건이 결합된 XML 문서를 바탕으로 데이터의 오류 탐지 알고리즘을 이용하여 오류 데이터를 분류하고, 사용자에게 보여줌으로써 사용자가 오류 데이터를 정제할 수 있는 환경을 제공한다.
기존의 데이터 품질 관리에 대한 연구는 시스템이 이미 사용한 데이터가 저장되어 있는 데이터베이스 내에 데이터를 대상으로 하고 있다면, 본 논문에서 제안한 CleanS 서비스는 각 서비스들이 상호 작용하여 데이터가 전송되는 단계에서 데이터의 품질 관리를 수행한다. 이를 통하여 대규모 시스템간의 통합 과정에서 안전한 데이터 사용과 정제된 데이터의 사용으로 시스템 품질 향상을 도모할 수 있다.
이를 통하여 대규모 시스템간의 통합 과정에서 안전한 데이터 사용과 정제된 데이터의 사용으로 시스템 품질 향상을 도모할 수 있다. 또한 데이터의 오류를 실시간으로 탐지하고, 개발된 오류 데이터 정제 서비스는 e-business 시스템과 같이 상호 작용이 빈번한 서비스의 통합 시 데이터의 품질관리를 위해 유용하게 사용될 수 있으며 XML을 이용한 탐지 규칙 설정으로 서비스 사용자의 데이터 제약 조건 설정에 융통성을 제공할 수 있는 SOA를 기반으로 하는 오류 데이터 탐지 및 정제 서비스를 개발하였다. 개발된 오류 데이터 탐지 서비스는 SOA를 기반으로 CRM 시스템과 ERP 서비스를 통합하는데 적용하여 두 서비스간의 상호 작용하는 데이터의 오류를 정제하는 실험을 통해 데이터의 오류를 30% 넘게 줄이는 효과를 보였다.

대상 데이터

이 규칙을 검사한 데이터는 총 2개의 데이터로 3번째(No.3) 데이터인 ‘Email’과 8번째(No.8) 데이터인 ‘PostalCode’를 보여주고 있다.

이론/모형

서비스는 Windows 2000 server 환경에서 Java 2 Platform, Enterprise Edition 1.4.2를 기반으로 구현되었고, SOA를 지원하는 ESB 상에서 서비스로 제공되기 위하여 Fiorano사의 Fiorano Business Integration Suite인 Fiorano ESB^TM을 사용하였다.
Service A와 Service B를 결합할 때 두 시스템간의 상호 작용하는 데이터의 오류 관리를 위해 본 논문에서 개발한 “CleanS (dirty data Clean Service)”를 적용하였다.

성능/효과

개발된 오류 데이터 정제 서비스는 SOA를 기반으로 하여 작성되는 서비스의 질을 높이고 e-Business시스템과 같이 상호작용이 많은 시스템의 데이터를 효과적으로 관리할 수 있게 한다. 실제 개발된 서비스는 SOA를 기반으로 CRM(Customer Relationship Management) 시스템과 ERP(Enterprise Resource Planing) 서비스를 통합하는데 적용하여 두 서비스간의 상호작용하는 데이터의 오류를 정제하는 실험을 하였다.
실제 개발된 서비스는 SOA를 기반으로 CRM(Customer Relationship Management) 시스템과 ERP(Enterprise Resource Planing) 서비스를 통합하는데 적용하여 두 서비스간의 상호작용하는 데이터의 오류를 정제하는 실험을 하였다. 실제 오류 데이터를 탐지 및 정제하고 이에 대한 통계를 제시함으로써 두 서비스간의 상호 작용하는 데이터의 오류를 30% 넘게 줄이는 효과를 보였다.
따라서 Null을 검사하거나 값의 범위를 검사하는 규칙 1, 2, 3, 5와 같은 경우에는 정제 율이 높지만 규칙 11과 21과 같이 오류로 탐지 하긴 하였지만 이를 정제할 옳은 데이터가 무엇인지 확신할 수 없는 경우는 낮은 정제 율을 보였다. 다음 (그림 14)은 이러한 현상을 규칙 별로 나타낸 것이다.
• XML 기반의 규칙 명세 방법은 개발자가 추가하고자 하는 규칙을 서비스의 인터페이스에 영향을 주지 않고 추가 정의하는 것이 가능하게 하였다.
전체적으로 초기에 입력된 전체 데이터의 오류 발생률과 서비스 적용 후 정제된 데이터 비율은 18.08%에서 12.31%로 감소된 결과를 보였다. 이는 정제 비율로만 보았을 때, 오류 데이터를 약 31.
이렇게 SOA를 기반으로 서비스를 작성하고 통합하여 새로운 서비스를 만드는 경우, 본 논문에서 개발한 서비스간의 상호 작용하는 데이터의 오류 탐지 및 정제 서비스를 이용한다면, 오류 데이터 정제를 이미 다 수집된 데이터베이스로 넘겨 오류 데이터를 쓸모없는 데이터로 만들 것이 아니라 사용자에게 피드백을 줌으로써 최대한 유효한 데이터로 만들 수 있다는 것을 보였다. 또한 개발된 CleanS는 기존의 정제도구가 가지고 있는 구현 플랫폼과 언어에 종속적이고 특정 애플리케이션을 위해 개발되어 확장성이 결핍되어 있는 문제를 다음과 같이 해결할 수 있음을 보였다.
기존의 데이터 품질 관리에 대한 연구는 시스템이 이미 사용한 데이터가 저장되어 있는 데이터베이스 내에 데이터를 대상으로 하고 있다면, 본 논문에서 제안한 CleanS 서비스는 각 서비스들이 상호 작용하여 데이터가 전송되는 단계에서 데이터의 품질 관리를 수행한다. 이를 통하여 대규모 시스템간의 통합 과정에서 안전한 데이터 사용과 정제된 데이터의 사용으로 시스템 품질 향상을 도모할 수 있다. 또한 데이터의 오류를 실시간으로 탐지하고, 개발된 오류 데이터 정제 서비스는 e-business 시스템과 같이 상호 작용이 빈번한 서비스의 통합 시 데이터의 품질관리를 위해 유용하게 사용될 수 있으며 XML을 이용한 탐지 규칙 설정으로 서비스 사용자의 데이터 제약 조건 설정에 융통성을 제공할 수 있는 SOA를 기반으로 하는 오류 데이터 탐지 및 정제 서비스를 개발하였다.
또한 데이터의 오류를 실시간으로 탐지하고, 개발된 오류 데이터 정제 서비스는 e-business 시스템과 같이 상호 작용이 빈번한 서비스의 통합 시 데이터의 품질관리를 위해 유용하게 사용될 수 있으며 XML을 이용한 탐지 규칙 설정으로 서비스 사용자의 데이터 제약 조건 설정에 융통성을 제공할 수 있는 SOA를 기반으로 하는 오류 데이터 탐지 및 정제 서비스를 개발하였다. 개발된 오류 데이터 탐지 서비스는 SOA를 기반으로 CRM 시스템과 ERP 서비스를 통합하는데 적용하여 두 서비스간의 상호 작용하는 데이터의 오류를 정제하는 실험을 통해 데이터의 오류를 30% 넘게 줄이는 효과를 보였다.

후속연구

이러한 SOA의 ESB 개념을 지원하기 위한 도구들은 IBM, BEA, SAP, HP, MS, Oracle, Temax, Fiorano Software등의 회사에서 개발 하고 있다. 본 논문에서도 Fiorano Software의 ESB를 기반으로 서비스를 개발하여 실제적인 적용 사례를 제시할 것이다.
이 장에서는 실제 본 논문에서 제안한 오류 탐지와 정제기법을 기반으로 ESB 상에서 오류 데이터 정제를 위한 서비스를 구현하고 이를 실제 분산 시스템에 적용한 결과를 보일 것이다.

질의응답

핵심어	질문	논문에서 추출한 답변
	현재 개발된 데이터 정제를 수행하는 다양한 도구에 대해 설명하라.	MonArch는 CRM 솔루션으로 .NET 기반의 컴포넌트로 개발되어 다양한 CRM 기능과 고객의 정보에 관련된 데이터를 정제하는 것이 특징이며, 컴포넌트 기반으로 개발되어 재사용 및 타 어플리케이션으로의 확장에 유리하다. 하지만, 플랫폼과 구현언어에 독립적이지 못하여 상호 운용 시 문제가 발생하게 된다. SLAAM(Systematic List Analysis And March)은 고객의 주소 이전 추적이나 중복자 검색 등에 사용하고 있으나 독립적인 컴포넌트나 서비스로 개발되어 있지 않다. ZipIt[11]은 우편번호 데이터의 정제를 수행하는 도구로 자신의 자료 특성에 맞는 동의어를 쉽게 등록하여 활용할 수 있으며, Eye checking 기능과 동의어 추가 기능을 활용하여 정제 효율을 높일 수 있는 특징을 가진다. ZipIt 또한 SLAMM과 유사하여, 컴포넌트 기반의 어플리케이션 개발에 사용하기가 어렵다는 문제점을 가진다. 더불어 우편번호 데이터라는 특정된 데이터만을 정제할 수 있어 활용범위가 좁다. The AscentialTM Enterprise Integration Suite은 기업에서 사용하는 데이터의 프로파일링, 데이터 평가, 데이터 정제, 메타데이터 관리와 데이터 통합을 위한 ETL(Extraction, Transform, and Load) 도구이다. 이 도구는 다양한 데이터 소스로부터 데이터를 가져 올 수도 있고 다시 소스나 타겟, 프레임 등을 고려하지 않고서도 데이터를 통합 할 수 있는 API를 제공한다. 그러나 순수한 데이터 정제를 위한 측면에서 활용되기 어렵고 독립적인 서비스로 작동할 수 없다. HummingBird는 기업의 포털, 문서, 기록, 지식관리 및 협업, BI(Business Intelligence), 데이터 통합을 위한 기술을 포함하는 어플리케이션의 통합 솔루션으로 BI 솔루션이 기업의 정보를 보고 및 분석하는 동안 정제 도구가 그 정보를 변환 및 정제하게 된다. 그러나 BI에 종속된 하나의 기능으로 독립적으로 사용될 수 있는 컴포넌트도, 서비스도 아니다. 이러한 기존의 데이터 정제 도구들은 데이터 소스로 이동하기 전 과정에서 데이터를 정제함으로써 어플리케이션 및 엔터프라이즈의 데이터 표준에 부합할 수 있도록 해주나, 개발된 어플리케이션에서 지원해주는 특정 데이터만 정제하는 단점을 가진다.
	ESB란?	SOA를 지원하기 위한 대표적인 최신 통합 기술로서 ESB(Enterprise Service Bus) 개념이 등장하였다. ESB는 SOA의 기본 원리를 따르면서 통합 인프라 구조를 제공하고 이벤트 중심의 분산 시스템 환경을 가능하도록 SOA를 지원하는 논리적인 버스의 개념이다.
	데이터 정제를 수행하는 다양한 도구에는 무엇이 있나?	데이터 마이닝에서는 정제된 데이터가 필수적이기에 데이터 마이닝을 기초로 하는 ERP, CRM과 같은 다양한 어플리케이션에서는 데이터 정제 도구를 필요로 하고 있으며, 이러한 이유로 MonArch[11], SLAAM[12], ZipIt[13], The AscentialTM Enterprise Integration Suite[14], HummingBird[15]와 같은 데이터 정제를 수행하는 다양한 도구들이 개발되었다.

참고문헌 (19)

P. Krogdahl, G. Luef, and C. Steindl, 'Service-Oriented Agility: An initial analysis for the Use of Agile methods for SOA development,' In Proceedings of the 2005 IEEE International Conference on Service Computing(SCC '05). Vol.2, pp.93-100, July, 2005
이경하, 이규철, '웹 서비스의 표준화 동향과 발전 방향', 한국정보과학회 데이터베이스 연구회지, 제19권 제1호, pp.80-87, March, 2003
M. P. Papazoglou and D. Georgakopoulos, 'Service-Oriented Computing,' Communication of the ACM, Vol.46, No.10, pp.25-28, Oct., 2003
지은미, 최병주, 이정원, 'SOA에서의 오류 데이터 정제 서비스 개발', 정보처리학회 2007년도 춘계학술발표대회 논문집(상) 우수논문, 제14권 제1호, pp.649-652, 2007
Theodore Johnson, and Tamraparni Dasu, 'Data Quality and Data Cleaning,' Tutorials of 10th SIGKDD, Aug., 2004
T. Dasu, T. Johnson, S. Muthukrishnan, V. Shkapenyuk, 'Mining Data Structure; Or, How to Build a Data Quality Browser,' In Proceedings of SIGMOD Conf., pp. 240-251, 2002
M. Hernandez and S. Stolfo, 'Real-world data is dirty: data cleansing and the merge/purge problem,' Data Mining and Knowledge Discovery, Vol.2, No.1, pp.9-37, 1998

상세보기
M. Lee, H Lu, T Ling, and Y. Ko., 'Cleansing Data for Mining and Warehousing,' In Proceedings of 10th DEXA, 1999
M. Hernandez, R. Miller, and L. Hass, 'Schema Mappings as Query Discovery,' In Proceedings of Intl. Conf. VLDB, 2001
M. M. Breunig, H.-P. Kriegel, R. Ng, J. Sander, 'LOF: Identifying Density-Based Local Outliers,' In Proceedings of SIGMOD Conf., 2000

상세보기
MonArch, www.00db.co.kr
SLAAM, www.slaam.co.kr
ZipIt, www.sujiewon.co.kr
The AscentialTM Enterprise Integration Suite, www.ascential.com
HummingBird, www.hummingbird.com
Ortiz Jr., Sixto; 'Getting on Board the Enterprise Service Bus,' Published by the IEEE computer Society, pp.15-17, 2007

상세보기
Won Kim, Byoung-Ju Choi, Eui-Kyeoung Hong, Soo-Kyoung Kim, Doheon Lee, 'A Taxonomy of Dirty Data,' The Data Mining and Knowledge Discovery Journal, Vol.7 No.1, pp.81-99, 2003

상세보기
J. W. Lee, E. Y. Moon, and B. J. Choi, 'Data cleansing for Service-Oriented Architecture,' Springer-Verlag, Lecture Notes in Computer Science Vol 3590, pp.87-97, 2005

상세보기
G. Shankaranarayanan and Y. Cai, 'A Web Services Application for the Data Quality Management in the B2B Networked Environment,' In Proceedings of 38th Hawaii International Conference on System Sciences, IEEE, 2005

저자의 다른 논문 :

LOADING...

활용도 분석정보

상세보기

다운로드

내보내기

활용도 Top5 논문

해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증