공공데이터 개방은 민간을 포함한 누구나 공공데이터를 자유롭게 재이용하여 국민 삶의 질을 높이고 신(新) 산업, 일자리 창출로 창조 경제 활성화에 기여하고자 하는 목표를 가진다. 공공데이터 개방은 전 세계적으로 중요성이 강조되고 있는 정책이며, 개방의 성공 사례들이 만들어지고 있다. 공공개방데이터는 공공의 목적을 달성하기 위해 이에 적합한 품질을 갖추어야 한다. 그러나 공공데이터 품질 관리와 표준화의 미흡으로 인한 오류데이터 발견 및 활용성 저하 문제가 제기되며, 품질에 관한 가이드라인이 미흡하다. 이에 본 연구에서는 기존의 데이터 품질과 공공데이터 품질, 공공 서비스 품질에 관한 복합적 시각을 적용한 연구를 통해 개방 공공데이터가 갖춰야 할 품질 특성에 대해 도출하고 전문가 설문을 통해 모델을 수정 및 검증하였으며, 그 결과 공공개방데이터의 품질 특성으로 공공성, 활용성, 신뢰성, 적합성을 도출하였다. 공공개방데이터의 품질 향상과 활용 활성화를 위해 갖춰야 할 품질 특성을 제시함에 본 연구의 의의가 있다.
공공데이터 개방은 민간을 포함한 누구나 공공데이터를 자유롭게 재이용하여 국민 삶의 질을 높이고 신(新) 산업, 일자리 창출로 창조 경제 활성화에 기여하고자 하는 목표를 가진다. 공공데이터 개방은 전 세계적으로 중요성이 강조되고 있는 정책이며, 개방의 성공 사례들이 만들어지고 있다. 공공개방데이터는 공공의 목적을 달성하기 위해 이에 적합한 품질을 갖추어야 한다. 그러나 공공데이터 품질 관리와 표준화의 미흡으로 인한 오류데이터 발견 및 활용성 저하 문제가 제기되며, 품질에 관한 가이드라인이 미흡하다. 이에 본 연구에서는 기존의 데이터 품질과 공공데이터 품질, 공공 서비스 품질에 관한 복합적 시각을 적용한 연구를 통해 개방 공공데이터가 갖춰야 할 품질 특성에 대해 도출하고 전문가 설문을 통해 모델을 수정 및 검증하였으며, 그 결과 공공개방데이터의 품질 특성으로 공공성, 활용성, 신뢰성, 적합성을 도출하였다. 공공개방데이터의 품질 향상과 활용 활성화를 위해 갖춰야 할 품질 특성을 제시함에 본 연구의 의의가 있다.
Public data open is one of the important tasks of Korea Government 3.0. By making open data available to the private sector, the goal is to create jobs, increase innovation and improve quality of life. Public data open is a policy that emphasized its importance worldwide. Open data should have adequ...
Public data open is one of the important tasks of Korea Government 3.0. By making open data available to the private sector, the goal is to create jobs, increase innovation and improve quality of life. Public data open is a policy that emphasized its importance worldwide. Open data should have adequate quality in order to achieve the object of the public. However, there are open data's quality problems due to the lack of data quality management and standardization. The purpose of this study is to derive data characteristics of public open data from existing researches. In addition, the model was modified and verified through a survey targeting the experts on public open data. The study indicates that public open data's quality characteristics as publicity, usability, reliability, suitability. This study is significant in that it suggests quality characteristics to improve the data quality and promote utilization of the open data.
Public data open is one of the important tasks of Korea Government 3.0. By making open data available to the private sector, the goal is to create jobs, increase innovation and improve quality of life. Public data open is a policy that emphasized its importance worldwide. Open data should have adequate quality in order to achieve the object of the public. However, there are open data's quality problems due to the lack of data quality management and standardization. The purpose of this study is to derive data characteristics of public open data from existing researches. In addition, the model was modified and verified through a survey targeting the experts on public open data. The study indicates that public open data's quality characteristics as publicity, usability, reliability, suitability. This study is significant in that it suggests quality characteristics to improve the data quality and promote utilization of the open data.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구의 목적은 공공개방데이터가 갖춰야 할 품질 특성 및 부특성의 도출을 목적으로 한다. 기존 연구에서 논의가 부족했던 공공개방데이터의 품질 향상과 활용 촉진을 위한 방향으로써의 품질 특성을 제시 한다는 것에 본 연구의 의의가 있다.
기존의 연구에서 미흡했던 개방 공공데이터가 갖추어야 할 특성에 대해 제시했다는 점에서 본 연구의 의의를 찾을 수 있다. 그러나 실제 개방되는 공공데이터에 적용 시켜 검증하지 못한 점이 한계로 남으며, 이 한계점을 극복하기 위해 실제 공공데이터에 적용 가능한 공공데이터 품질 특성 및 품질 관리의 실증적 연구를 본 논문의 향후과제로 한다.
본 연구에서는 공공개방데이터 품질특성을 도출하기 위해 먼저 데이터 품질, 공공데이터 품질, 공공 서비스 품질에 관해 사전 연구를 실시하였다. 또한 해외의 공공데이터 개방 사례를 조사하여, 그 중 미국의 공공개방데이터 품질에 관한 정의 및 기준에 대해 조사하였다.
본 연구의 목적은 공공개방데이터가 갖춰야 할 품질 특성 및 부특성의 도출을 목적으로 한다. 기존 연구에서 논의가 부족했던 공공개방데이터의 품질 향상과 활용 촉진을 위한 방향으로써의 품질 특성을 제시 한다는 것에 본 연구의 의의가 있다.
이는 제시된 품질 특성이 현장에서 실제로 얼마나 중요하게 인식되고 관리되어지는지에 대해 실제 공공데이터를 관리하고 있는 전문가들의 의견을 반영함으로써, 본 논문에서 제시하는 데이터 품질 특성은 실제로 현장에서 유효하게 활용이 가능한 속성임을 목표로 두고 연구되었다는 점을 검증하는 단계이다.
이렇게 가치와 위험요소를 동시에 지니고 있는 공공데이터의 개방 발전을 위해 각 데이터 보유 기관에서는데이터 품질 특성 기준을 세우고 세부 특성에 따른 관리 기준을 수립하여 양질의 데이터 제공과 위험요소의 선제적 관리가 필요하다는 것이 본 논문의 공공데이터 품질 특성을 통해 시사된다.
이에 본 연구는 기존 연구와 국제 표준에서 제시한 공공데이터의 품질특성을 참조하여 공공개방데이터가 갖추어야 할 품질 특성에 대해 제시하였다. 또한 공공데이터 관리자 설문을 통해 현장에서 공공데이터 관리에 중점을 두고 있는 사항을 도출하여 본 모델의 적합성을 검증하였다.
제안 방법
5 Stars 모델은 오픈데이터의 다섯 단계 발전방향을 별1개에서부터 별 5개까지 5단계로 제안하였다. 이 모델은 사용자의 데이터 활용 및 연관지식의 획득 효과가 높아질 수 있도록 데이터의 형식에 기반을 둔다.
각 설문항목은 ‘전혀 그렇지 않다‘를 1로 ’매우 그렇다‘를 7로 하는 7단계의 의미차별척도(Semantic Differentials)로, 응답자가 속한 기관의 데이터 관리 사항에 해당하는 수치에 대해 표시하도록 하였고, 응답자의 답변을 분석하여 앞서 제안한 공공개방데이터 품질특성에 수정을 가하였다.
이를 위해 각 품질특성을 대표하는 항목을 추출하여 요인분석을 실시하였다. 공공성의 5개의 항목(접근성, 객관성, 공익성, 요구반영성, 대응성), 활용성의 5개 항목(이 해성, 가공성, 연계성, 이용편의성, 표준준수성), 신뢰성의 2개의 항목(보호성, 보안성), 적합성의 5개의 항목(완전성, 정확성, 유효성, 적시성, 일관성)을 대표하는 문항을 각 하나씩 선별하였으며, 이들이 공통된 요인으로 구분되어 지는지 요인 분석하였다.
그 결과 기존의 모델에서 공공성을 구성하는 부특성 중 접근성이 활용성의 요인으로 구분되어졌으므로 기존 모델에 수정을 가했으며, 요인분석의 결과 값은 아래의 표와 같다[Table 10].
다음으로, 공공 서비스 품질과 사전연구 및 사례에서의 데이터 품질 특성을 통해 공공개방데이터 품질 특성 및 부특성을 도출해 냈다
이에 본 연구는 기존 연구와 국제 표준에서 제시한 공공데이터의 품질특성을 참조하여 공공개방데이터가 갖추어야 할 품질 특성에 대해 제시하였다. 또한 공공데이터 관리자 설문을 통해 현장에서 공공데이터 관리에 중점을 두고 있는 사항을 도출하여 본 모델의 적합성을 검증하였다.
본 연구에서는 공공개방데이터 품질특성을 도출하기 위해 먼저 데이터 품질, 공공데이터 품질, 공공 서비스 품질에 관해 사전 연구를 실시하였다. 또한 해외의 공공데이터 개방 사례를 조사하여, 그 중 미국의 공공개방데이터 품질에 관한 정의 및 기준에 대해 조사하였다.
본 연구는 기존의 공공데이터 특성에 관한 기존 연구와 시사점을 통해 개방 공공데이터 품질 특성을 도출하였다[Fig 1].
본 연구에서는 타당성(Validity) 검증을 위해 탐색적 요인분석을 실시하였다 요인분석을 통해 각 특성 및 부 특성을 구성하는 문항끼리 서로 의미 있게 구분되어지는지를 알 수 있다. 본 연구에서 요인분석을 위한 요인 수의 결정은 직각회전 방법 중 하나인 베리맥스(Varimax) 회전방식을 사용하였다.
설문 분석 결과를 반영하여 수정된 개방 공공데이터 품질 특성은 [Fig. 2]와 같으며, 4가지 주특성(공공성, 활용성, 신뢰성, 적합성)과 그에 따른 16가지 부특성을 갖춘다.
설문은 2015년 5월 10일부터 2015년 5월 24일까지 15일간 실시하였으며, 설문지배포는 메일 등 온라인을 이용한 비대면 설문 방식으로 80명에게 배포하여 53건의 유효 응답을 확보하였다. 이 중에서 아웃라이어(outlier)로 판단되는 4건을 배제하였다.
본 연구에서 도출한 품질 특성을 검증하기 위해서 공공기관에서 현재 공공데이터를 관리하는 관리자 및 실무자를 대상으로 설문을 실시하였다. 설문을 통해 본 연구의 품질특성들이 현 공공기관에서의 데이터 품질 관리 기준과 부합하는지 분석하고, 설문 결과를 반영하여 모델을 정제 및 수정하고, 5장에서 결론 및 추후 연구에 대해 기술하는 것으로 본 논문을 구성한다.
이를 위해 각 품질특성을 대표하는 항목을 추출하여 요인분석을 실시하였다. 공공성의 5개의 항목(접근성, 객관성, 공익성, 요구반영성, 대응성), 활용성의 5개 항목(이 해성, 가공성, 연계성, 이용편의성, 표준준수성), 신뢰성의 2개의 항목(보호성, 보안성), 적합성의 5개의 항목(완전성, 정확성, 유효성, 적시성, 일관성)을 대표하는 문항을 각 하나씩 선별하였으며, 이들이 공통된 요인으로 구분되어 지는지 요인 분석하였다.
이에 본 연구에서는 공공개방데이터는 ‘누구나 자유롭게 접근하고 재사용 하여 새로운 서비스와 공공의 가치를 창출하는 데이터’임에 초점을 맞추어, 공공개방데이터가 갖추어야 할 품질에 관해 공공성, 활용성, 신뢰성, 완전성의 4가지 관점으로 접근하고, 이에 따른 세부 특성들을 도출하였다.
정보의 일관성의 평가를 위해서 명명규칙의 준수, 데이터 형식, 데이터 값의 저장 형식, 표현 형식을 측정 범위에 포함시킨다.
대상 데이터
600)로 전체 18,327건이다. 데이터 분야는 교통물류(112건), 환경기상(90건), 산업고용(70건), 보건의료(54건)등이다.
본 논문에서 제안한 개방 공공데이터 품질 특성을 검증하기 위하여 53명의 공공데이터 관리자 및 실무자를 대상으로 설문을 진행하였다.
본 연구에서 도출한 품질 특성을 검증하기 위해서 공공기관에서 현재 공공데이터를 관리하는 관리자 및 실무자를 대상으로 설문을 실시하였다. 설문을 통해 본 연구의 품질특성들이 현 공공기관에서의 데이터 품질 관리 기준과 부합하는지 분석하고, 설문 결과를 반영하여 모델을 정제 및 수정하고, 5장에서 결론 및 추후 연구에 대해 기술하는 것으로 본 논문을 구성한다.
데이터처리
각 부특성들의 요인분석을 실시한 후 부특성을 구성하는 요인들이 하나의 주특성 아래 요인들로 분류되는지를 확인하기 위한 2차 요인 분석을 실시하였다.
요인분석을 통해 수정된 모델을 활용하여 각 응답 값의 T검정을 실시하였다. 유의수준은 95%, 검정 값은 5로 진행하였다.
이론/모형
본 연구에서는 타당성(Validity) 검증을 위해 탐색적 요인분석을 실시하였다 요인분석을 통해 각 특성 및 부 특성을 구성하는 문항끼리 서로 의미 있게 구분되어지는지를 알 수 있다. 본 연구에서 요인분석을 위한 요인 수의 결정은 직각회전 방법 중 하나인 베리맥스(Varimax) 회전방식을 사용하였다.
참고된 기준은 DQC의 DQI(Data Quality Indicator) (이하 DQI), 행정자치부의 공공이터 관리지침 상 품질 지표(이하, 공공데이터 관리지침), ISO/IEC 25012의 데이터 품질속성(이하, ISO 25012), 미국의 Data Quality Act 의 품질요소(이하, DQA)이다[8,9,11,12].
성능/효과
그 결과, 공공개방데이터가 갖추어야 할 특성으로 공공성(객관성, 공익성, 요구반영성), 활용성(접근성, 이해성, 가공성, 연계성, 이용편의성, 표준준수성), 신뢰성(보안성, 보호성), 적합성(완전성, 정확성, 유효성, 적시성, 일관성)의 4가지 주특성과 이에 속하는 16개의 부특성을 도출하였다.
분석 결과 공공성을 구성하는 21개의 문항 중 17개의 값이 요인 적재량의 절단값(0.5)에 의하여 5개의 요인(접근성, 객관성, 공익성, 요구반영성, 대응성)으로 분류됨을 확인하였다[Table 6]. 활용성의 21개 문항 중 17개의 문항이 5개의 요인(이해성, 가공성, 연계성, 이용편의성, 표준준수성)[Table 7]으로, 신뢰성의 11개 문항 중 9개의 문항이 2개의 요인(보호성, 보안성)[Table 8], 적합성의 17개 문항이 15개 문항을 통해 5개의 요인(완전성, 정확성, 유효성, 적시성, 일관성)[Table 9] 값을 가짐을 확인하였다.
유의수준은 95%, 검정 값은 5로 진행하였다. 분석 결과, 공공성의 대응성과 완전성의 적시성을 제외한 모든 특성의 2/3이 넘는 문항의 응답 값의 유의확률이 0.05를 넘지 않았으므로 채택하였다. 또한 응답 값의 평균이 4에 미달한 대응성과 적시성은 현 공공기관에서 의미 있게 관리 되고 있지 않은 기준이라 판단하고 모델에서 제외하였다.
이를 종합하여 본 논문에서는 데이터 품질을 ‘사용자의 활용 목적과 요구사항을 충족시키기 위한 데이터의 수준’이라 정의한다.
5)에 의하여 5개의 요인(접근성, 객관성, 공익성, 요구반영성, 대응성)으로 분류됨을 확인하였다[Table 6]. 활용성의 21개 문항 중 17개의 문항이 5개의 요인(이해성, 가공성, 연계성, 이용편의성, 표준준수성)[Table 7]으로, 신뢰성의 11개 문항 중 9개의 문항이 2개의 요인(보호성, 보안성)[Table 8], 적합성의 17개 문항이 15개 문항을 통해 5개의 요인(완전성, 정확성, 유효성, 적시성, 일관성)[Table 9] 값을 가짐을 확인하였다.
후속연구
기존의 연구에서 미흡했던 개방 공공데이터가 갖추어야 할 특성에 대해 제시했다는 점에서 본 연구의 의의를 찾을 수 있다. 그러나 실제 개방되는 공공데이터에 적용 시켜 검증하지 못한 점이 한계로 남으며, 이 한계점을 극복하기 위해 실제 공공데이터에 적용 가능한 공공데이터 품질 특성 및 품질 관리의 실증적 연구를 본 논문의 향후과제로 한다.
질의응답
핵심어
질문
논문에서 추출한 답변
공공데이터 개방의 목표는 무엇인가?
공공데이터 개방은 민간을 포함한 누구나 공공데이터를 자유롭게 재이용하게 하여, 이를 통해 국민 삶의 질을 높이고 신(新)산업, 일자리 창출로 창조 경제 활성화에 기여하고자 하는 목표를 가진다[1]
공공데이터는 무엇인가?
“공공데이터”란 데이터베이스, 전자화 된 파일 등 공공기관이 법령 등에서 정하는 목적을 위하여 생성 또는 취득하여 관리하고 있는 광(光) 또는 전자적 방식으로 처리된 자료 또는 정보를 말한다[10].
공공데이터 활용이 활발히 이루어지지 않고, 데이터 활용 성과는 기대에 미치지 못하는 이유는 무엇인가?
그러나 공공데이터 활용은 기대만큼 활발히 이루어지고 있지 않으며, 데이터 활용 성과들은 기대에 미치지 못하는 상황이다. 그 주요한 원인으로 제기되는 것으로 공공데이터의 품질 관리와 표준화의 미흡으로 인한 오류데 이터 발견 및 활용성 저하 문제를 들 수 있다[2].
더욱이 각 기관의 개방 데이터 품질 관리 방향 정립에 도움이 되는 공공개방데이터 품질에 관한 가이드라인이 부재하다. 공공데이터 개방이 공급자 중심의 개방 계획에 따라 추진되고 있어 그 활용도가 높지 않다는 문제 또한 공공데이터 관련 연구에서 제기되고 있는 실정에 품질 가이드라인의 부재는 문제점으로 지적된다.
참고문헌 (18)
National Information Society Agency Republic of Korea, "National Informatization White Paper", 2014
Ministry of Government Administration and Home Affairs, "Completion report for diagnosis and improvement of public data quality", 2014
English, L. P., "Improving Data Warehouse and Business Information Quality: Methods for Reducing Costs and Increasing Profits", John Wiley & Sons, 1999
Wang, R. Y. and D. M. Strong, "Beyond accuracy: what data quality means to data consumers," Journal of Management Information Systems, Vol.12, No.4, pp.5-34, 1996
Larry P. English, "Improving Data Warehouse and Business Information Quality.", New York : Wiley, 1999
Redman, T. C, Data Quality for the Information Age, Norwood, MA: Artech House, 1996
Wang, R. Y. et al. "Data quality", Vol. 23. Springer Science & Business Media., 2001
Korea Database Promotion Center, Data Quality Management Maturity Model Ver 1.0, 2006
ISO/IEC 25012:2008, "Software engineering -Software product Quality Requirements and Evaluation (SQuaRE) - Data quality model,", 2006
Ministry of Security and Public Administration, "Act On Promotion Of The Provision And Use Of Public Data", Article 2 (Definitions), 2013
Ministry of Government Administration and Home Affairs, "administrative guideline of public data", 2014
National Information Society Agency, "Public Information Quality Management Manual", 2012
US Office OF Management And Budget, "Guidelines for Ensuring and Maximizing the Quality, Objectivity, Utility, and Integrity of Information Disseminated by Federal Agencies", 2001
Davies, Tim, "Open data barometer: 2013 global report." World Wide Web Foundation and Open Data Institute, 2013
Hun Young Lee. "Data analysis using the SPSS.", Cheong Ram, 2016
Seung Ho Jung, D.H.Jeong, "A Study on the Influence Factors in Data Quality of Public Organizations", Journal of korea information processing society, Vol.3 No.4, pp.251-266, 2013
Parasuraman, A., Zeithaml, V. A., & Berry, L. L., "SERVQUAL: A Multiple-item Scale for Measuring Consumer Perceptions of Service Quality", Journal of Retailing. pp.15-29, 1998
Yang Ho Woo, M.Y. Hong, "A Feasibility Study on quality measurement of public service.", Journal of Korean Public Administration Quarterly, Vol.16 No.3, 2004
※ AI-Helper는 부적절한 답변을 할 수 있습니다.