정보화 시대로의 진입 후 사회 전반에 걸친 급격한 변화와 발전이 있어 왔으며 그 근간에는 데이터라는 기반이 자리하고 있다. 현재를 데이터 시대라 규정하고 IT(정보기술)중심에서 DT(데이터기술)중심으로의 변화를 예상하는 전문가들은 많이 있지만 데이터에는 예상보다 많은 부정합과 오류가 존재하고 있다. 이는 사회적, 경제적 손실을 가져왔으며 데이터 의존도가 커질수록 그 피해 또한 커질 것이다. 데이터 품질 문제는 가볍게 다루어질 문제가 아니며 체계적이고 다양한 연구가 필요하다.
본 연구에서는 품질의 개념에서 시작하여 데이터 품질, ...
정보화 시대로의 진입 후 사회 전반에 걸친 급격한 변화와 발전이 있어 왔으며 그 근간에는 데이터라는 기반이 자리하고 있다. 현재를 데이터 시대라 규정하고 IT(정보기술)중심에서 DT(데이터기술)중심으로의 변화를 예상하는 전문가들은 많이 있지만 데이터에는 예상보다 많은 부정합과 오류가 존재하고 있다. 이는 사회적, 경제적 손실을 가져왔으며 데이터 의존도가 커질수록 그 피해 또한 커질 것이다. 데이터 품질 문제는 가볍게 다루어질 문제가 아니며 체계적이고 다양한 연구가 필요하다.
본 연구에서는 품질의 개념에서 시작하여 데이터 품질, 소프트웨어 품질의 관련연구를 살펴보고 기존 데이터 품질관리 모델들을 비교 분석하여 한계와 개선점을 찾아보았다. 제안한 데이터 품질관리 모델에서는 보다 객관적인 방법을 통한 DTI, CTQ, 중요도 계산을 수행하고 개선된 데이터 프로파일링 방법을 연구해 보았다. 또한 실제 운영 중인 시스템에 제안한 데이터 품질관리 모델을 검증하여 모델의 적용 가능성을 검토하였다.
추가로 정부 3.0과 함께 정책적으로 부각되고 있는 공공개방데이터와 빅 데이터 등의 데이터 품질 특성을 조사 연구했다.
본 연구의 의의는 데이터 품질관리의 중요성을 인식하고 기존 데이터 품질과 관련된 연구를 비교 조사하여 보다 나은 모델을 제안하고 공공데이터에 적용해 봄으로써 데이터 품질 향상에 기여하는 것이다.
정보화 시대로의 진입 후 사회 전반에 걸친 급격한 변화와 발전이 있어 왔으며 그 근간에는 데이터라는 기반이 자리하고 있다. 현재를 데이터 시대라 규정하고 IT(정보기술)중심에서 DT(데이터기술)중심으로의 변화를 예상하는 전문가들은 많이 있지만 데이터에는 예상보다 많은 부정합과 오류가 존재하고 있다. 이는 사회적, 경제적 손실을 가져왔으며 데이터 의존도가 커질수록 그 피해 또한 커질 것이다. 데이터 품질 문제는 가볍게 다루어질 문제가 아니며 체계적이고 다양한 연구가 필요하다.
본 연구에서는 품질의 개념에서 시작하여 데이터 품질, 소프트웨어 품질의 관련연구를 살펴보고 기존 데이터 품질관리 모델들을 비교 분석하여 한계와 개선점을 찾아보았다. 제안한 데이터 품질관리 모델에서는 보다 객관적인 방법을 통한 DTI, CTQ, 중요도 계산을 수행하고 개선된 데이터 프로파일링 방법을 연구해 보았다. 또한 실제 운영 중인 시스템에 제안한 데이터 품질관리 모델을 검증하여 모델의 적용 가능성을 검토하였다.
추가로 정부 3.0과 함께 정책적으로 부각되고 있는 공공개방데이터와 빅 데이터 등의 데이터 품질 특성을 조사 연구했다.
본 연구의 의의는 데이터 품질관리의 중요성을 인식하고 기존 데이터 품질과 관련된 연구를 비교 조사하여 보다 나은 모델을 제안하고 공공데이터에 적용해 봄으로써 데이터 품질 향상에 기여하는 것이다.
After entry into the information age, there has been rapid change and development across the social basis that there has been a data base as infrastructure. Today, many experts define the current era of data and expect change in the center DT(Data Technology) from the center of IT(information techno...
After entry into the information age, there has been rapid change and development across the social basis that there has been a data base as infrastructure. Today, many experts define the current era of data and expect change in the center DT(Data Technology) from the center of IT(information technology), but there are a lot of errors and mismatches than expected exist. This brought the larger social, economic losses will also increase the damage of data dependence. Data quality issues are not a problem to be dealt with lightly requires a systematic and various studies.
In this study, starting from the concept of quality of research looking at the data quality, software quality by comparative analysis of existing data quality management model looked limits and improvements. In the proposed model, data quality management, do the DTI, CTQ, the importance calculated through a more objective way and looked to study how to improve data profiling. Also data quality validation of the proposed model of the system under actual operating examined the applicability of the model.
Additionally, data quality characteristics of a public open data and big data, which is emerging as a policy together with the government 3.0, was researched.
The significance of this study is to contribute to the recognition of the importance of quality control data and the existing data quality and examine the comparative studies related to offer a better model and improve data quality by looking to apply to public data.
After entry into the information age, there has been rapid change and development across the social basis that there has been a data base as infrastructure. Today, many experts define the current era of data and expect change in the center DT(Data Technology) from the center of IT(information technology), but there are a lot of errors and mismatches than expected exist. This brought the larger social, economic losses will also increase the damage of data dependence. Data quality issues are not a problem to be dealt with lightly requires a systematic and various studies.
In this study, starting from the concept of quality of research looking at the data quality, software quality by comparative analysis of existing data quality management model looked limits and improvements. In the proposed model, data quality management, do the DTI, CTQ, the importance calculated through a more objective way and looked to study how to improve data profiling. Also data quality validation of the proposed model of the system under actual operating examined the applicability of the model.
Additionally, data quality characteristics of a public open data and big data, which is emerging as a policy together with the government 3.0, was researched.
The significance of this study is to contribute to the recognition of the importance of quality control data and the existing data quality and examine the comparative studies related to offer a better model and improve data quality by looking to apply to public data.
주제어
#데이터 품질
#공공데이터
#정부3.0
#데이터 품질 관리 모델
#데이터 프로파일링
#결합강도
#data quality
#public open data
#government3.0
#data quality management model
#data profiling
#coupling
학위논문 정보
저자
민병철
학위수여기관
연세대학교 공학대학원
학위구분
국내석사
학과
컴퓨터공학 전공
지도교수
박상현
발행연도
2016
총페이지
vii, 61장
키워드
데이터 품질,
공공데이터,
정부3.0,
데이터 품질 관리 모델,
데이터 프로파일링,
결합강도,
data quality,
public open data,
government3.0,
data quality management model,
data profiling,
coupling
※ AI-Helper는 부적절한 답변을 할 수 있습니다.