최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기정보처리학회논문지. The KIPS transactions. Part D. Part D, v.14D no.7, 2007년, pp.829 - 840
지은미 (이화여자대학교 컴퓨터학과) , 최병주 (이화여자대학교 컴퓨터학과) , 이정원 (아주대학교 정보통신대학 전자공학부)
Dirty Data Cleansing technique so far have aimed to integrate large amount of data from various sources and manage data quality resided in DB so that it enables to extract meaningful information. Prompt response to varying environment is required in order to persistently survive in rapidly changing ...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
현재 개발된 데이터 정제를 수행하는 다양한 도구에 대해 설명하라. | MonArch는 CRM 솔루션으로 .NET 기반의 컴포넌트로 개발되어 다양한 CRM 기능과 고객의 정보에 관련된 데이터를 정제하는 것이 특징이며, 컴포넌트 기반으로 개발되어 재사용 및 타 어플리케이션으로의 확장에 유리하다. 하지만, 플랫폼과 구현언어에 독립적이지 못하여 상호 운용 시 문제가 발생하게 된다. SLAAM(Systematic List Analysis And March)은 고객의 주소 이전 추적이나 중복자 검색 등에 사용하고 있으나 독립적인 컴포넌트나 서비스로 개발되어 있지 않다. ZipIt[11]은 우편번호 데이터의 정제를 수행하는 도구로 자신의 자료 특성에 맞는 동의어를 쉽게 등록하여 활용할 수 있으며, Eye checking 기능과 동의어 추가 기능을 활용하여 정제 효율을 높일 수 있는 특징을 가진다. ZipIt 또한 SLAMM과 유사하여, 컴포넌트 기반의 어플리케이션 개발에 사용하기가 어렵다는 문제점을 가진다. 더불어 우편번호 데이터라는 특정된 데이터만을 정제할 수 있어 활용범위가 좁다. The AscentialTM Enterprise Integration Suite은 기업에서 사용하는 데이터의 프로파일링, 데이터 평가, 데이터 정제, 메타데이터 관리와 데이터 통합을 위한 ETL(Extraction, Transform, and Load) 도구이다. 이 도구는 다양한 데이터 소스로부터 데이터를 가져 올 수도 있고 다시 소스나 타겟, 프레임 등을 고려하지 않고서도 데이터를 통합 할 수 있는 API를 제공한다. 그러나 순수한 데이터 정제를 위한 측면에서 활용되기 어렵고 독립적인 서비스로 작동할 수 없다. HummingBird는 기업의 포털, 문서, 기록, 지식관리 및 협업, BI(Business Intelligence), 데이터 통합을 위한 기술을 포함하는 어플리케이션의 통합 솔루션으로 BI 솔루션이 기업의 정보를 보고 및 분석하는 동안 정제 도구가 그 정보를 변환 및 정제하게 된다. 그러나 BI에 종속된 하나의 기능으로 독립적으로 사용될 수 있는 컴포넌트도, 서비스도 아니다. 이러한 기존의 데이터 정제 도구들은 데이터 소스로 이동하기 전 과정에서 데이터를 정제함으로써 어플리케이션 및 엔터프라이즈의 데이터 표준에 부합할 수 있도록 해주나, 개발된 어플리케이션에서 지원해주는 특정 데이터만 정제하는 단점을 가진다. | |
ESB란? | SOA를 지원하기 위한 대표적인 최신 통합 기술로서 ESB(Enterprise Service Bus) 개념이 등장하였다. ESB는 SOA의 기본 원리를 따르면서 통합 인프라 구조를 제공하고 이벤트 중심의 분산 시스템 환경을 가능하도록 SOA를 지원하는 논리적인 버스의 개념이다. | |
데이터 정제를 수행하는 다양한 도구에는 무엇이 있나? | 데이터 마이닝에서는 정제된 데이터가 필수적이기에 데이터 마이닝을 기초로 하는 ERP, CRM과 같은 다양한 어플리케이션에서는 데이터 정제 도구를 필요로 하고 있으며, 이러한 이유로 MonArch[11], SLAAM[12], ZipIt[13], The AscentialTM Enterprise Integration Suite[14], HummingBird[15]와 같은 데이터 정제를 수행하는 다양한 도구들이 개발되었다. |
이경하, 이규철, '웹 서비스의 표준화 동향과 발전 방향', 한국정보과학회 데이터베이스 연구회지, 제19권 제1호, pp.80-87, March, 2003
M. P. Papazoglou and D. Georgakopoulos, 'Service-Oriented Computing,' Communication of the ACM, Vol.46, No.10, pp.25-28, Oct., 2003
지은미, 최병주, 이정원, 'SOA에서의 오류 데이터 정제 서비스 개발', 정보처리학회 2007년도 춘계학술발표대회 논문집(상) 우수논문, 제14권 제1호, pp.649-652, 2007
Theodore Johnson, and Tamraparni Dasu, 'Data Quality and Data Cleaning,' Tutorials of 10th SIGKDD, Aug., 2004
M. Hernandez and S. Stolfo, 'Real-world data is dirty: data cleansing and the merge/purge problem,' Data Mining and Knowledge Discovery, Vol.2, No.1, pp.9-37, 1998
M. Hernandez, R. Miller, and L. Hass, 'Schema Mappings as Query Discovery,' In Proceedings of Intl. Conf. VLDB, 2001
M. M. Breunig, H.-P. Kriegel, R. Ng, J. Sander, 'LOF: Identifying Density-Based Local Outliers,' In Proceedings of SIGMOD Conf., 2000
MonArch, www.00db.co.kr
SLAAM, www.slaam.co.kr
ZipIt, www.sujiewon.co.kr
The AscentialTM Enterprise Integration Suite, www.ascential.com
HummingBird, www.hummingbird.com
Ortiz Jr., Sixto; 'Getting on Board the Enterprise Service Bus,' Published by the IEEE computer Society, pp.15-17, 2007
Won Kim, Byoung-Ju Choi, Eui-Kyeoung Hong, Soo-Kyoung Kim, Doheon Lee, 'A Taxonomy of Dirty Data,' The Data Mining and Knowledge Discovery Journal, Vol.7 No.1, pp.81-99, 2003
J. W. Lee, E. Y. Moon, and B. J. Choi, 'Data cleansing for Service-Oriented Architecture,' Springer-Verlag, Lecture Notes in Computer Science Vol 3590, pp.87-97, 2005
해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.