데이터 거버넌스는 연구초기 단계의 영역이므로 개념정의와 구성요소 정립에 연구가 집중되어 있다. 그러나 데이터 거버넌스의 도입에 대한 의사결정을 돕기 위해서 데이터 거버넌스의 평가에 관한 연구 또한 필요하다. 본 연구는 데이터 거버넌스 프레임워크에서 데이터 거버넌스를 평가하기 위한 속성지표에 관한 연구이다. 이를 위하여 RGT와 Laddering기법을 적용하여 전문가 인터뷰를 실시하였고, 이 결과를 제3자 차원의 검증을 위해서 설문과 통계적인 검증분석을 실시하였다. 통계적인 분석에는 크론바하 알파 계수, MANOVA, 상관분석을 실시하였다. 이를 통해서 데이터 거버넌스 속성지표를 데이터 통제영역에는 8개의 속성지표, 데이터 품질영역에 16개의 속성지표, 데이터 조직영역에 7개의 속성지표를 도출하였다. 또한 AHP기법을 적용하여 속성지표의 가중치와 우선순위를 선별하였다. 이 연구결과는 데이터 거버넌스의 개념정립과 구성요소의 명확한 이해 및 기업의 거버넌스 도입과 운영의 기초자료로 활용될 것이다.
데이터 거버넌스는 연구초기 단계의 영역이므로 개념정의와 구성요소 정립에 연구가 집중되어 있다. 그러나 데이터 거버넌스의 도입에 대한 의사결정을 돕기 위해서 데이터 거버넌스의 평가에 관한 연구 또한 필요하다. 본 연구는 데이터 거버넌스 프레임워크에서 데이터 거버넌스를 평가하기 위한 속성지표에 관한 연구이다. 이를 위하여 RGT와 Laddering기법을 적용하여 전문가 인터뷰를 실시하였고, 이 결과를 제3자 차원의 검증을 위해서 설문과 통계적인 검증분석을 실시하였다. 통계적인 분석에는 크론바하 알파 계수, MANOVA, 상관분석을 실시하였다. 이를 통해서 데이터 거버넌스 속성지표를 데이터 통제영역에는 8개의 속성지표, 데이터 품질영역에 16개의 속성지표, 데이터 조직영역에 7개의 속성지표를 도출하였다. 또한 AHP기법을 적용하여 속성지표의 가중치와 우선순위를 선별하였다. 이 연구결과는 데이터 거버넌스의 개념정립과 구성요소의 명확한 이해 및 기업의 거버넌스 도입과 운영의 기초자료로 활용될 것이다.
The academic research on data governance is still in its infancy and focused on the definition of concept and components. However, we need to study of evaluation on data governance to help make decision of establishment. The purpose of this paper is to develop of attribute index in data governance f...
The academic research on data governance is still in its infancy and focused on the definition of concept and components. However, we need to study of evaluation on data governance to help make decision of establishment. The purpose of this paper is to develop of attribute index in data governance framework. Therefore, in this paper, we used RGT (repertory grid technique) and Laddering techniques for experts interview and survey for validation of disinterested third party experts and analysis statistically. We completed data governance attribute index which is composed of data compliance area including 8 components, data quality area including 16 components and data organization area including 7 components. Moreover, the evaluation attributes is prioritized and ranked using the AHP. As a result of the study, this paper can be used for the base line data in introducing and operating data governance in an IT company.
The academic research on data governance is still in its infancy and focused on the definition of concept and components. However, we need to study of evaluation on data governance to help make decision of establishment. The purpose of this paper is to develop of attribute index in data governance framework. Therefore, in this paper, we used RGT (repertory grid technique) and Laddering techniques for experts interview and survey for validation of disinterested third party experts and analysis statistically. We completed data governance attribute index which is composed of data compliance area including 8 components, data quality area including 16 components and data organization area including 7 components. Moreover, the evaluation attributes is prioritized and ranked using the AHP. As a result of the study, this paper can be used for the base line data in introducing and operating data governance in an IT company.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
속성지표와 평가지표의 관계를 살펴보면, 속성지표는 특정 기능의 성질을 대표하며, 속성지표를 평가지표로 세분화하여 정량적으로 관리한다. 따라서 본 연구에서는 데이터 거버넌스를 도입한 조직에서 지속적으로 관리할 수 있도록 데이터 거버넌스 구성 요소에 해당하는 속성지표를 도출하고 정의하여 평가에 활용하기 위한 연구를 먼저 수행하였다.
데이터 거버넌스의 선행연구는 개념정립과 구성요소 연구에 한정되어 있어 평가를 위한 속성지표 혹은 평가 지표에 관한 연구는 부재한 상황이다. 따라서 본 연구에서는 데이터 거버넌스의 구성요소에 해당하는 성질을 정의하는 속성지표를 개발하였다.
또한 본 연구는 실제 주도적으로 도입을 추진하게 될 경영진과 IT그룹을 인터뷰에 참여시켜 데이터 거버넌스에 대해서 경험으로 축적된 중요요소를 도출한 연구로써 의의가 있다. 기존 연구에서 데이터 품질의 평가에 관한 연구와 표준은 제시되었으나, 데이터 거버넌스 평가에 관한 연구는 시초라는 점에서 그 의의가 크다고 할 수 있다.
조직에서는 이를 활용하여 데이터 거버넌스 도입 이후 관리가 적정한지 평가하고 개선점을 도출하여 지속적으로 개선할 수 있도록 평가에 활용할 수 있을 것이다. 또한 속성지표를 전문가의 경험에 기반하여 정량화하고 계층화하여 각 속성지표의 가중치와 우선순위를 개발하였으며, 이를 통하여 데이터 거버넌스를 적용하는 환경이나 자원의 제약에 따라 선별적으로 적용 가능하도록 하였다. 이 연구는 데이터 거버넌스의 구성요소 개발 연구[1]의 후속 연구로써, 속성지표를 통해서 한 단계 명확한 데이터 거버넌스의 개념을 구체화할 수 있을 것이 고, 조직에서 데이터 거버넌스를 도입할 때 의사결정의 기초자료로 활용될 것을 기대한다.
본 연구는 데이터 거버넌스 구성요소 개발의 확장으로 데이터 거버넌스를 적용한 조직에서 운영 및 관리의 적정성을 진단할 수 있는 속성지표를 개발하였다. 데이터 거버넌스를 적용한 조직에서는 이 결과를 활용하여 데이터 거버넌스의 평가에 적용할 수 있고, 데이터 거버너스를 도입하고자 하는 조직에서는 속성지표를 활용하여 데이터 거버넌스의 명확한 개념정립에 도움이 될 것이다.
본 연구는 데이터 거버넌스 평가를 위한 속성지표를 개발하고 가중치를 도출하는 연구이다. 이를 위하여 RGT와 Laddering 기법을 적용하여 해당분야의 전문가를 섭외하여 인터뷰를 수행하고 전문가의 경험치에서 중요하다고 판단되는 데이터 거버넌스 속성을 도출하였다.
본 연구에서는 데이터 거버넌스의 평가를 위한 속성지표를 도출하는 연구를 위하여 데이터[1]의 선행 연구에서 도출된 데이터 거버넌스 구성요소를 요소제로 사용하여 인터뷰를 실시하였다. RGT와 Laddering 인터뷰를 위하여 데이터 통제 및 조직 영역에는 CEO와 조직의 임원을 7명 섭외하였고, 데이터 품질 영역의 속성을 도출하기 위해 데이터 품질 시스 템을 기술적으로 지원하는 특급기술자 및 기술사로 구성된 8 명의 전문가를 섭외하였다.
본 연구에서는 정성적 인터뷰 기법으로 수집된 데이터의 신뢰도와 타당성을 높이기 위하여 통계분석 검증을 실시하였다. 신뢰도는 측정하고자 하는 데이터가 얼마나 일관성이 있지를 측정하는 지표로 데이터의 일관성을 검증한다.
속성 후보데이터의 전반적인 독립성은 Table 4와 같이 유의하게 나타났으나, 구성요소 개체 간의 독립성을 상세 분석하여 독립성이 부족한 요소를 식별하여 정제할 목적으로 분석을 실시하였다. 그 결과 Table 5와 같이 집단 간 평균차이에 대한 F값의 유의확률이 유의수준 0.
가설 설정
Laddering기법은 의사결정을 수행한 이유를 속성(Attribute), 결과/혜택(Consequence), 가치(Value) 로 상세화하여 도출할 수 있는 방법이다. 인간이 어떤 제품이나 서비스를 선택할 경우는 혜택이나 가치를 먼저 생각하고 선택한다는 가정을 기반으로 인터뷰를 실시하고 분석을 수행한다. 선행 연구[25-27]에서는 속성을 목적달성의 수단으로 보고 가치를 목적으로 보았으며, 속성은 추상적인 요소나 성분으로 구성된 특징을 의미하고, 결과 혹은 혜택은 선택된 서비스나 제품을 통해 즉시 얻어지는 만족감을 의미한다.
제안 방법
결과의 1차 구조화로는 제3자의 다중 전문 가의 검증을 위하여 전문가 설문을 실시하였다. 2차 구조화 에서는 전문가 설문의 신뢰도와 타당성을 통계적 기법으로 분석하고 정제하였다. 3차 구조화로는 이렇게 정제된 데이터를 델파이 기법과 KJ기법을 적용하여 속성지표를 확정하고 계층화 모델을 구성하였다.
이를 위해서 전문가들의 심층 인터뷰와 반복적인 검증작 업을 실시하여 속성지표의 신뢰도를 확보하였다. RGT와 Laddering 기법을 통해서 전문가의 경험치를 인지구조 형태로 도출하였다. 결과의 1차 구조화로는 제3자의 다중 전문 가의 검증을 위하여 전문가 설문을 실시하였다.
개발된 속성지표를 6명의 전문가를 초빙하여 KJ기법을 적용하여 정의된 데이터 거버넌스 속성지표를 계층화 하였 다. KJ분류는 3단계로 진행되었다.
RGT와 Laddering 기법을 통해서 전문가의 경험치를 인지구조 형태로 도출하였다. 결과의 1차 구조화로는 제3자의 다중 전문 가의 검증을 위하여 전문가 설문을 실시하였다. 2차 구조화 에서는 전문가 설문의 신뢰도와 타당성을 통계적 기법으로 분석하고 정제하였다.
3단계는 계층화 및 가중치 적용단계로써, 1,2단계에서 정제된 속성 후보 데이터를 전문가에 재확인하고 계층화하는 단계를 거쳐 속성지표를 확정하였다. 계층화 모형을 기준 으로 AHP설문과 분석을 수행하여 가중치와 우선순위를 도출하였다
본 연구에서는 RGT의 다이아딕방식을 사용하여 데이터 거버넌스 구성요소[1]를 요소제로 제시하여 중요한 두개를 선택하게 하고 차별되는 특성을 질문한다. 그 이후에 그것이 중요한 이유와 목적에 왜(Why)와 무엇(What)을 반복적으로 질문하는 Laddering인터뷰를 심층적으로 실시한다. 이를 통해서 RGT에서 도출되었던 인지구조를 속성과 혜택, 가치로 분류하고 그 결과를 표준화로 정규화하고 분석하여 데이터 거버넌스 평가속성을 개발한다.
그 이외는 연구자들에 의해서 소프트웨어 품질 평가속성, 데이터 품질 평가속성, 성과평가 및 문화평가 등의 평가속성들을 정의한 연구들이 이어지고 있다[10, 11, 14, 20, 21]. 그러나 데이터 거버넌스는 초기단계이므로 평가 속성에 관한 연구나 가이드는 부재한 상태이므로 본 연구에서 관련연구와 심층 인터뷰기법, 설문을 통해서 평가 속성을 정의한다.
먼저 RGT인터뷰를 통해서 데이터 구성요소 2레벨을 제시 하고 중요한 순서대로 나열하게하고, 하나가 다른 하나와 다른 차별점은 무엇인지를 질문한다. 그리고 그것이 주는 혜택과 가치를 도출하는 Laddering인터뷰를 실시한다. 기법은 RGT의 결과도출에서 왜(why)와 무엇(what)을 반복적으로 질문하여 Ladder을 구성하였다.
수집된 설문 데이터에 대해서 신뢰도와 타당성 검증을 통계적으로 수행하였다. 그리고 델파이기 기법과 KJ 기법으로 속성지표를 확정하고 계층화하여 AHP를 수행하였 다. 연구의 구성은 Fig.
그리고 그것이 주는 혜택과 가치를 도출하는 Laddering인터뷰를 실시한다. 기법은 RGT의 결과도출에서 왜(why)와 무엇(what)을 반복적으로 질문하여 Ladder을 구성하였다. 인터뷰결과 데이터통제 부분에 86개, 데이터품질 부분에 184개, 데이터 조직 부분에 32개의 Ladder이 도출하였다.
다변량분산분석에서 독립성이 유의하지 않은 구성요소와 상관관계의 속성을 도출하여 정제필요 요소로 선정하고 정제를 수행하였다.
데이터 거버넌스 구성요소 연구[1]에서 2레벨의 구성요소를 개발하였는데, 1레벨은 데이터 통제(Compliance), 데이터 품질(Quality), 데이터 조직(Organization)의 3가지로 구성되어 있고, 2레벨의 데이터 통제(Data Compliance)에는 Strategy & Mission, Policy, Method, Metrics, System & Tools 5개의 구성요소가 포함되어 있고, 데이터 품질(Data Quality)에는 Data lifecycle, Data Management, Monitoring, Quality Management, Quality Value, Data Security 6개의 구성요소가 포함되어 있고, 데이터 조직(Data Organization)에는 R& R, Organizational Structures 2가지의 구성요소가 포함되어 총 13개의 2레벨 구성요소가 개발되었다.
델파이 기법을 적용하여 Table 7과 같이 Rounding을 진행하여 최종 데이터 통제영역에 8개 속성, 데이터 품질영역에 16개 속성, 데이터 조직 영역에 7개의 속성을 개발하여총 31개의 속성지표를 개발하였다. 그 단계별 결과 예시는 Table 8과 같다.
도출된 속성을 검증하기 위해 제3의 전문가그룹의 설문을 수행하였다. 수집된 설문 데이터에 대해서 신뢰도와 타당성 검증을 통계적으로 수행하였다.
05기준보다 크게 나타나 유의하지 않은 속성들이 존재하였다. 독립성에서 유의하지 않은 속성은 상관관계를 분석하여 상관도가 높은 속성 후보와 통폐합하여 최종 속성지표를 개발하였다.
이를 위하여 데이터 거버넌스의 구성요소[1]에 해당하는 속성지표를 RGT(Repertory Grid Technique)와 Laddering기 법을 적용하여 전문가들의 경험으로 축적된 중요속성을 도출하고 설문 및 통계적 검증, 델파이 기법을 적용하였다. 또한 속성지표를 실제 현장의 여건과 조직이 보유한 자원에 따라 선택가능하도록 중요도 분석을 AHP기법으로 수행하여 가중치를 도출하였다.
먼저 RGT인터뷰를 통해서 데이터 구성요소 2레벨을 제시 하고 중요한 순서대로 나열하게하고, 하나가 다른 하나와 다른 차별점은 무엇인지를 질문한다. 그리고 그것이 주는 혜택과 가치를 도출하는 Laddering인터뷰를 실시한다.
본 연구에서는 RGT의 다이아딕방식을 사용하여 데이터 거버넌스 구성요소[1]를 요소제로 제시하여 중요한 두개를 선택하게 하고 차별되는 특성을 질문한다. 그 이후에 그것이 중요한 이유와 목적에 왜(Why)와 무엇(What)을 반복적으로 질문하는 Laddering인터뷰를 심층적으로 실시한다.
타당성을 측정하기 위해서는 데이터의 요인분석이나 상관 분석을 수행하고 상관도가 낮은 항목을 정제하는 방법을 사용하는데[28], 상관분석에는 서열척도에 적용하는 스피어만 (Spearman) 상관분석과 등간척도나 비율척도일 경우에 적용하는 피어슨(Pearson)상관분석이 있다. 본 연구에서는 비율척도의 설문결과에 대한 분석이므로 피어슨(Pearson)상관 분석을 통해서 상관도가 낮은 항목을 정제하였다.
7이상이면 신뢰도가 높다고 판단한다[28]. 본 연구에서는 설문결과에서 신뢰도가 낮은 측정치를 제거하여 신뢰도를 높이는 방법으로 사용하였다.
2단계에는 1단계 에서 도출된 속성 후보 데이터를 제3의 전문가그룹을 통해 설문으로 검증하는 단계이다. 설문 데이터를 수집하고 데이터 내에 신뢰도와 타당성이 저하되는 요소를 도출하여 정제하는 작업을 하였다. 이때 통계적인 기법으로 크론바하 알파 계수를 분석하고, 다변량분산분석과 상관분석을 실시하 였다.
속성 후보데이터를 제3의 전문가를 통해서 검증하기 위해 인터뷰에 사용된 구성요소와 속성 후보지표의 상관설문을 실시하였다. 이를 통해서 속성 후보지표의 일관성과 정확성을 분석하고 미흡한 데이터는 정제하는 작업을 거쳤다.
본 연구는 데이터 거버넌스 평가를 위한 속성지표를 개발하고 가중치를 도출하는 연구이다. 이를 위하여 RGT와 Laddering 기법을 적용하여 해당분야의 전문가를 섭외하여 인터뷰를 수행하고 전문가의 경험치에서 중요하다고 판단되는 데이터 거버넌스 속성을 도출하였다.
이를 위해서 전문가들의 심층 인터뷰와 반복적인 검증작 업을 실시하여 속성지표의 신뢰도를 확보하였다. RGT와 Laddering 기법을 통해서 전문가의 경험치를 인지구조 형태로 도출하였다.
그 이후에 그것이 중요한 이유와 목적에 왜(Why)와 무엇(What)을 반복적으로 질문하는 Laddering인터뷰를 심층적으로 실시한다. 이를 통해서 RGT에서 도출되었던 인지구조를 속성과 혜택, 가치로 분류하고 그 결과를 표준화로 정규화하고 분석하여 데이터 거버넌스 평가속성을 개발한다.
전문가의 심층 인터뷰와 설문을 분석한 결과에서 독립성이 유의하지 않은 속성 후보데이터를 선별하고 해당 속성과 상호의존적인 속성을 도출하였다. 도출된 의존 속성에 대한 통폐합을 위하여 5명의 익명의 데이터 전문가를 구성하여 델파이 기법을 적용하였다.
대상 데이터
Table 9와 같이 3레벨로 계층화된 모형을 구성하여 속성 지표 간의 중요도를 기준으로 가중치를 분석하기 위하여 항목간 쌍대비교를 수행하였다. AHP분석을 위해서 전문가 21 명에 중요도 쌍대비교 설문을 9점 척도로 실시하였으며, 그중 일관성 CI(Consistency Index)가 0.1보다 크게 나오거나미 응답이 존재한 경우는 재 응답을 요청해서 전체 21명의 자료를 채택하였다. 설문 참여자는 데이터 품질 및 데이터 시스템 사용 경험이 있는 전문가로 구성하였으며, 데이터 거버넌스의 의미를 이해하고 도입하였거나 도입계획 중인 전문가로 구성하였다.
본 연구에서는 데이터 거버넌스의 평가를 위한 속성지표를 도출하는 연구를 위하여 데이터[1]의 선행 연구에서 도출된 데이터 거버넌스 구성요소를 요소제로 사용하여 인터뷰를 실시하였다. RGT와 Laddering 인터뷰를 위하여 데이터 통제 및 조직 영역에는 CEO와 조직의 임원을 7명 섭외하였고, 데이터 품질 영역의 속성을 도출하기 위해 데이터 품질 시스 템을 기술적으로 지원하는 특급기술자 및 기술사로 구성된 8 명의 전문가를 섭외하였다.
1보다 크게 나오거나미 응답이 존재한 경우는 재 응답을 요청해서 전체 21명의 자료를 채택하였다. 설문 참여자는 데이터 품질 및 데이터 시스템 사용 경험이 있는 전문가로 구성하였으며, 데이터 거버넌스의 의미를 이해하고 도입하였거나 도입계획 중인 전문가로 구성하였다.
이를 통해서 속성 후보지표의 일관성과 정확성을 분석하고 미흡한 데이터는 정제하는 작업을 거쳤다. 설문은 1차 인터뷰 전문가와 다른 그룹에서 27명의 설문을 수집하고 SPSS로 분석하였다.
데이터처리
Table 9와 같이 3레벨로 계층화된 모형을 구성하여 속성 지표 간의 중요도를 기준으로 가중치를 분석하기 위하여 항목간 쌍대비교를 수행하였다. AHP분석을 위해서 전문가 21 명에 중요도 쌍대비교 설문을 9점 척도로 실시하였으며, 그중 일관성 CI(Consistency Index)가 0.
다음은 설문데이터의 타당성 검증을 위해서 구성속성간의 독립성을 검증하는 다변량분산분석과 상관분석을 실시하였 다. 다변량분산분석은 SPSS도구를 활용하였으며 검정통계량 값인 Pillai의 트레이스, Wilks의 람다, Hotelling의 트레 이스, Roy의 최대 근으로 검증하였다. 인터뷰와 설문을 통해서 정제된 속성 후보데이터의 독립성을 알아보기 위한 다변량분산분석 결과 Table 4와 같이 Pillai의 트레이스, Wilks 의 람다, Hotelling의 트레이스.
다음은 설문데이터의 타당성 검증을 위해서 구성속성간의 독립성을 검증하는 다변량분산분석과 상관분석을 실시하였 다. 다변량분산분석은 SPSS도구를 활용하였으며 검정통계량 값인 Pillai의 트레이스, Wilks의 람다, Hotelling의 트레 이스, Roy의 최대 근으로 검증하였다.
AHP는 계층화를 통해 평가하는 방법으로, 제한된 범위 내에 중요도에 대한 평가척도는 동일해야 하고, 상위 계층에 대해서는 종속성이 충족되고 동일 계층에서는 독립성이 존재해야 한다. 따라서 개발된 속성지표를 통계적 기법으로 검증하고 KJ기법으로 계층화하여 AHP기법을 적용하여 요소 간 가중치와 우선순위를 도출하였다.
또한 본 연구는 속성지표를 개발하는 연구이므로, 도출된 속성지표가 상호적 배타성(Mutually Exclusive)을 갖고 집합적 완결성(Collectively Exhaustive)을 갖고 있어야 한다. 따라서 속성지표의 독립성 검증을 위해서 다변량분산분석(MANOVA: Multivariate Analysis Of Variance)으로 검증 하였다. 분산분석(ANOVA: Analysis Of Variance)은 집단 간의 평균의 차이를 검증하는 분석방법이다[28].
도출된 속성을 검증하기 위해 제3의 전문가그룹의 설문을 수행하였다. 수집된 설문 데이터에 대해서 신뢰도와 타당성 검증을 통계적으로 수행하였다. 그리고 델파이기 기법과 KJ 기법으로 속성지표를 확정하고 계층화하여 AHP를 수행하였 다.
타당성은 측정하고자 하는 개념이나 속성이 얼마나 정확히 측정할 수있는가의 지표를 의미하며, 이를 통해서 연구의 정확성 정도를 검증한다[28]. 신뢰도 측정을 위해서 내적 일관성 방법의 크론바하 알파계수를 통한 신뢰도 검증을 실시하였다. 크론바하 알파계수는 0과 1사이의 값으로 나타나며 수치가 클수록 신뢰도가 높다고 보고, 0.
설문 데이터를 수집하고 데이터 내에 신뢰도와 타당성이 저하되는 요소를 도출하여 정제하는 작업을 하였다. 이때 통계적인 기법으로 크론바하 알파 계수를 분석하고, 다변량분산분석과 상관분석을 실시하 였다. 3단계는 계층화 및 가중치 적용단계로써, 1,2단계에서 정제된 속성 후보 데이터를 전문가에 재확인하고 계층화하는 단계를 거쳐 속성지표를 확정하였다.
분산분석(ANOVA: Analysis Of Variance)은 집단 간의 평균의 차이를 검증하는 분석방법이다[28]. 집단 간의 독립성 분석이나 유사성 분석을 하는 방법으로는 t-test, 분산분석이 있는데, 두 집단 간 분석 방법으로 t-test를 사용하고 두 집단 이상일 경우는 분산분석을 사용한다. 그런데 분산분석은 종속변수가 여러 개일 경우는 수용하기 어려우 므로, 독립변수와 종속변수가 모두 여러 개의 집단에 대한 분석은 다변량분산분석을 사용한다.
이론/모형
2차 구조화 에서는 전문가 설문의 신뢰도와 타당성을 통계적 기법으로 분석하고 정제하였다. 3차 구조화로는 이렇게 정제된 데이터를 델파이 기법과 KJ기법을 적용하여 속성지표를 확정하고 계층화 모델을 구성하였다. 4차 구조화로는 계층화 모델을 AHP기법을 적용하여 가중치와 우선순위를 도출하였다.
3차 구조화로는 이렇게 정제된 데이터를 델파이 기법과 KJ기법을 적용하여 속성지표를 확정하고 계층화 모델을 구성하였다. 4차 구조화로는 계층화 모델을 AHP기법을 적용하여 가중치와 우선순위를 도출하였다.
도출된 의존 속성에 대한 통폐합을 위하여 5명의 익명의 데이터 전문가를 구성하여 델파이 기법을 적용하였다. 델파이 기법은 3 Round를 적용 하였다. 1 Round에는 독립성 오류 및 의존데이터의 쌍을 보여주고 데이터 거버넌스의 속성에 대한 개방형 질문을 수집 하였다.
전문가의 심층 인터뷰와 설문을 분석한 결과에서 독립성이 유의하지 않은 속성 후보데이터를 선별하고 해당 속성과 상호의존적인 속성을 도출하였다. 도출된 의존 속성에 대한 통폐합을 위하여 5명의 익명의 데이터 전문가를 구성하여 델파이 기법을 적용하였다. 델파이 기법은 3 Round를 적용 하였다.
본 연구에서는 데이터 거버넌스 평가지표를 최종 점검하는 단계에서 전문가의 델파이 기법을 활용하였고, 평가지표의 유사요소를 찾아 그룹핑하는 단계에 KJ기법을 사용하였다.
이를 위하여 데이터 거버넌스의 구성요소[1]에 해당하는 속성지표를 RGT(Repertory Grid Technique)와 Laddering기 법을 적용하여 전문가들의 경험으로 축적된 중요속성을 도출하고 설문 및 통계적 검증, 델파이 기법을 적용하였다. 또한 속성지표를 실제 현장의 여건과 조직이 보유한 자원에 따라 선택가능하도록 중요도 분석을 AHP기법으로 수행하여 가중치를 도출하였다.
성능/효과
1레벨의 속성은 Data Quality, Data Compliance, Data Organization으로 [1] 의 연구결과와 동일한 결과가 도출되었다. 2레벨의 속성은 시행가능성, 조직신뢰성, 기준준수성, 계획절절성, 데이터유 용성, 데이터유효성, 데이터업무성, 조직생산성, 데이터보호 성, 환경대응성, 조직성장성으로 가중치와 우선순위가 도출 되었다. 이를 통해서 데이터 거버넌스는 실행 가능여부가 중요하고 기준 준수를 통해서 품질을 확보해야 하며 조직의 구성원 간의 상호 신뢰와 만족하는 문화를 형성하는 것이 데이터 거버넌스의 원동력이 됨을 확인할 수 있었다.
Roy의 최대근 모두 F값에 대한 유의확률 값이 0.001보다 작게 나타났으므로, 구성요소 간의 차이가 없다는 귀무가설은 기각되고 각각 구성요소는 유의한 차이(P<0.001)가 있음을 확인할 수 있었다.
데이터 통제영역은 환경변화 대응성, 전략적 기반마련 용이성, 평가 기반 마련 용이성 등 총 21개의 속성후보가 도출되었고, 데이터 품질영역은 유연성, 보안성, 분류성, 분석성 등 총 24개의 속성후보가 도출되었다. 또한 데이터 조직 영역은 환경변화 대응성, 커뮤니케이션 용이성, 지식 습득성등 총 14개의 속성후보가 도출되었다.
데이터 통제영역은 환경변화 대응성, 전략적 기반마련 용이성, 평가 기반 마련 용이성 등 총 21개의 속성후보가 도출되었고, 데이터 품질영역은 유연성, 보안성, 분류성, 분석성 등 총 24개의 속성후보가 도출되었다. 또한 데이터 조직 영역은 환경변화 대응성, 커뮤니케이션 용이성, 지식 습득성등 총 14개의 속성후보가 도출되었다.
2레벨의 속성은 시행가능성, 조직신뢰성, 기준준수성, 계획절절성, 데이터유 용성, 데이터유효성, 데이터업무성, 조직생산성, 데이터보호 성, 환경대응성, 조직성장성으로 가중치와 우선순위가 도출 되었다. 이를 통해서 데이터 거버넌스는 실행 가능여부가 중요하고 기준 준수를 통해서 품질을 확보해야 하며 조직의 구성원 간의 상호 신뢰와 만족하는 문화를 형성하는 것이 데이터 거버넌스의 원동력이 됨을 확인할 수 있었다. 지속성, 정확성, 성숙도, 통제성, 실행추적성, 작업효과성, 일관성 순으로 나타났다.
지속성, 정확성, 성숙도, 통제성, 실행추적성, 작업효과성, 일관성 순으로 나타났다. 이를 통해서 데이터 거버넌스를 위해서는 목표정립, 준거, 만족도, 품질지속 등이 보안성, 상호호환성, 통합성, 유지관리성, 학습성, 창의성 보다 우선하여 중요함을 확인할 수 있었다. 3레벨의 속성은 상위 10위 순위는 목표정립성, 준거성, 만족도, 품질지속성, 정확성, 성숙도, 통제성, 실행추적성, 작업효과성, 일관성 순으로 나타났다.
지속성, 정확성, 성숙도, 통제성, 실행추적성, 작업효과성, 일관성 순으로 나타났다. 이를 통해서 데이터 거버넌스를 위해서는 목표정립, 준거, 만족도, 품질지속 등이 보안성, 상호호환성, 통합성, 유지관리성, 학습성, 창의성 보다 우선하여 중요함을 확인할 수 있었다. 3레벨의 속성은 상위 10위 순위는 목표정립성, 준거성, 만족도, 품질지속성, 정확성, 성숙도, 통제성, 실행추적성, 작업효과성, 일관성 순으로 나타났다.
이를 통해서 데이터 거버넌스는 실행 가능여부가 중요하고 기준 준수를 통해서 품질을 확보해야 하며 조직의 구성원 간의 상호 신뢰와 만족하는 문화를 형성하는 것이 데이터 거버넌스의 원동력이 됨을 확인할 수 있었다. 지속성, 정확성, 성숙도, 통제성, 실행추적성, 작업효과성, 일관성 순으로 나타났다. 이를 통해서 데이터 거버넌스를 위해서는 목표정립, 준거, 만족도, 품질지속 등이 보안성, 상호호환성, 통합성, 유지관리성, 학습성, 창의성 보다 우선하여 중요함을 확인할 수 있었다.
후속연구
그러나 본 연구의 결과를 바탕으로 향후에는 데이터 거버 넌스의 평가를 위한 깊이 있는 연구가 필요하다. 데이터 거버넌스의 속성지표는 데이터 거버넌스 구성요소를 정량적으로 성질화한 지표이며, 이의 확장으로 데이터 거버넌스 평가지표, 수준지표, 평가 매트릭스, 평가등급 등 다양한 연구가 이론과 실증의 통합된 연구가 필요할 것이다.
본 연구는 데이터 거버넌스 구성요소 개발의 확장으로 데이터 거버넌스를 적용한 조직에서 운영 및 관리의 적정성을 진단할 수 있는 속성지표를 개발하였다. 데이터 거버넌스를 적용한 조직에서는 이 결과를 활용하여 데이터 거버넌스의 평가에 적용할 수 있고, 데이터 거버너스를 도입하고자 하는 조직에서는 속성지표를 활용하여 데이터 거버넌스의 명확한 개념정립에 도움이 될 것이다.
그러나 본 연구의 결과를 바탕으로 향후에는 데이터 거버 넌스의 평가를 위한 깊이 있는 연구가 필요하다. 데이터 거버넌스의 속성지표는 데이터 거버넌스 구성요소를 정량적으로 성질화한 지표이며, 이의 확장으로 데이터 거버넌스 평가지표, 수준지표, 평가 매트릭스, 평가등급 등 다양한 연구가 이론과 실증의 통합된 연구가 필요할 것이다.
또한 속성지표를 전문가의 경험에 기반하여 정량화하고 계층화하여 각 속성지표의 가중치와 우선순위를 개발하였으며, 이를 통하여 데이터 거버넌스를 적용하는 환경이나 자원의 제약에 따라 선별적으로 적용 가능하도록 하였다. 이 연구는 데이터 거버넌스의 구성요소 개발 연구[1]의 후속 연구로써, 속성지표를 통해서 한 단계 명확한 데이터 거버넌스의 개념을 구체화할 수 있을 것이 고, 조직에서 데이터 거버넌스를 도입할 때 의사결정의 기초자료로 활용될 것을 기대한다.
본 연구는 데이터 거버넌스 구성요소에서 속성지표 개발을 위한 최초의 연구로써 그 의의가 크다. 조직에서는 이를 활용하여 데이터 거버넌스 도입 이후 관리가 적정한지 평가하고 개선점을 도출하여 지속적으로 개선할 수 있도록 평가에 활용할 수 있을 것이다. 또한 속성지표를 전문가의 경험에 기반하여 정량화하고 계층화하여 각 속성지표의 가중치와 우선순위를 개발하였으며, 이를 통하여 데이터 거버넌스를 적용하는 환경이나 자원의 제약에 따라 선별적으로 적용 가능하도록 하였다.
질의응답
핵심어
질문
논문에서 추출한 답변
데이터 거버넌스의 의미는?
이를 위해서 데이터의 통합된 관점에서 통합관리체계와 조직을 구성 관리하여 데이터를 통제할 수 있는 데이터 거버넌스가 필요하다. 데이터 거버넌스는 원칙, 프로세스, 조직을 기반으로 데이터의 전반적인 활동을 관리하고 통제하여데이터 품질의 향상을 극대화하고 가치창출에 기여하기 위한 활동을 의미한다[1]. 따라서 데이터 거버넌스는 데이터를 통제하고 조직화하여 데이터의 품질수준을 향상시키는 원동력이 된다.
RGT기법은 무엇에 기반한 방법인가?
인터뷰 기법으로는 경험에 기반한 내면의 인지구조를 도출하는 방법으로 RGT(Repertory Grid Technique)기법과 Laddering 기법이 있다. RGT기법은 임상심리학자 George Kelly가 처음 제안한 개인인지구조 이론(Personal Construct Theory)에 기반한 방법론으로써 심리학 분야에서 많이 활용되는 방법이다 [22]. 이 방법론에서 인간의 인지구조는 수십년 간 경험에 의해서 축적되어 있으며 다른 요소를 구별하거나 선택할 때 경험에 기반한 요소의 특성에 대한 차별성과 유사성을 판별한다고 본다.
RGT기법의 유형 중 모나딕 방식이란?
RGT기법의 유형에는 모나딕(Monadic), 다이아딕(Dyadic), 트라이아딕(Triadic)방식이 있다. 먼저 모나딕(Monadic)은 하나의 요소를 통해 직접 간략한 답을 설명하도록 하는 방식이다. 다이아딕(Dyadic)은 제시하는 두개의 요소를 제시하고, 둘의 다른 차이점이 무엇인지 질문하여 인지구조를 도출하는 방식이다.
참고문헌 (34)
Kyoung-Ae Jang and Woo-Je Kim, "Components Development and Importance Weight Analysis of Data Governance," Journal of the Korean Operations Research and Management Science Society, Vol.41, No.3, pp.45-58, 2016.
OMB, Guidelines for Ensuring and Maximizing the Quality, Objectivity, Utility, and Integrity of Information Disseminated by Federal Agencies, Final Guidelines (corrected), 67, Fed. Reg., 8452, 2002.
ISO/IEC, ISO/IEC 25012, Software engineering -Software product Quality Requirements and Evaluation (SQuaRE) - Data quality model, 2008.
Korea Database Agency, "DQC-M: Data Quality Certification Management," Korea Database Agency, Seoul, 2010.
Korea Database Agency, "Data Quality Management Maturity Model," Korea Database Agency, 2006.
NIA, "Public Information Quality Management Manual," NIA, V1.1, 2014.
Mi Young Park, "A Study on the Development of Database System Quality Assessment Model Using Analytic Hierarchy Process," The Graduate School of Seoul Women's University, pp.39-45, 2008.
R. Y. Wang and D. M. Strong, "Beyond accuracy: What data quality means to data consumers," Journal of Management Information Systems, Vol.12, No.4, pp.5-33., 1996.
ISO/IEC, ISO/IEC 25010, Systems and software engineering - Systems and software Quality Requirements and Evaluation (SQuaRE) - System and software quality models, 2011.
SeungHee Kim, "Development of Quality Evaluation Models for Application Software by Software Life-cycle," Seoul National University of Science and Technology, pp. 148-160, 2014.
Korea Database Agency, "DQC-V: Data Quality Certification Value," Korea Database Agency, 2010.
Korea Database Agency, "DQC-S: Data Quality Certification Security," Korea Database Agency, 2010.
NIA, "Provide of diagnostic capabilities of Big Data Models," NIA, p.4, 2014.
Ministry of the Interior, "Performance Reference Model 2.0," Ministry of the Interior, pp.34-52, 2009.
National Information Society Agency, "A Performance Measurement Model of Public It Projects Using The Balanced Scorecard," National Information Society Agency, 2001.
Kyu-hwan Lee, Sang-yoon Rhee, and Jong-soo Lee, "A Study on Organizational Culture Index of Korean Local Public Enterprise's Managers," Journal of Local Government Studies, Vo1.17, No.4, pp.117-138, 2005.
G. Kelly, "The psychology of personal constructs," Vol.1. A theory of personality. Vol. 2. Clinical diagnosis and psychotherapy, Oxford, England, 1955.
Jankowicz Devi, "The easy guide to repertory grids," Graduate Business School University of Luton, UK, 2004.
Kyoung-Ae Jang, Ja-Hee Kim, and Woo-Je Kim, "Comparison of Data Quality Value Chain of the Contractor and the Contractee Using the RGT and Laddering Method," Journal of KIIT., Vol.14, No.4, pp.151-162, 2016.
F. Huber, A. Herrmann, and S. C. Beckmann, "Affective influence on infromation processing style: A means-end analysis," ANZMAC Visionary Marketing for the 21st Century: Facing the Challenge, pp.558-562, 2000.
J. Gutman, "A means-end chain model based on consumer categorization processes," Journal of Marketing, Vol. 46, No. 2, pp.60-72, 1982.
J. Reynolds Thomas and Gutman Jonathan, "Laddering theory, method, analysis, and interpretation," Journal of Advertising Research, Vo1.28, No.1, pp.11-31, 1988.
hunyoung Lee, "The research methodology of professor hunyoung-Lee," cheongram, pp.301-395, 2012.
N. C. Dalkey, "The Delphi method: An experimental study of group opinion," Rand Corporation Memorandum RM-5888-PR, 1969.
G. Rowe and G. Wright, "Expert opinions in forecasting: The role of the Delphi technique in J. Armstrong(Ed.) Principles of Forecasting," Boston: Kluwer Academic, pp.125-144, 2001.
Inja Ahn, "The Korean Biblia Society For Library And Information Science," Journal of the Korean Biblia Society For Library and Information Science, Vo1.16, No.2, pp.225-245, 2005.
T. L. Saaty, "Decision-making with the AHP: Why is the Principal Eigenvector Necessary," European Journal of Operational Research, Vol.145, No.1, pp.85-91, 2003.
Kyoung-Ae Jang, Ja-Hee Kim, and Woo-Je Kim, "Derivation of data quality attributes and their priorities based on customer requirements," Journal of Korea Information Processing Society, Vol.4, No.12, pp.549-560, 2015.
Kyoung-Ae Jang and Woo-Je Kim, "Developing and refining components in data governance framework," Journal of the Korean Institute of Information Technology, Vol.14, No.9, pp.93-108, 2016.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.