주관연구기관 |
한국여성정책연구원 Korean Women’s Development Institute |
연구책임자 |
정성미
|
참여연구자 |
문유경
,
이수연
,
윤지소
,
임연규
,
박송이
|
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 |
한국어
|
발행년월 | 2019-12 |
과제시작연도 |
2019 |
주관부처 |
국무조정실 The Office for Government Policy Coordination |
등록번호 |
TRKO202000005530 |
과제고유번호 |
1105014768 |
사업명 |
한국여성정책연구원(R&D) |
DB 구축일자 |
2020-07-29
|
키워드 |
빅데이터.소셜빅데이터.토픽분석.의미망 분석.채용.알고리즘.거버넌스.
|
초록
▼
Ⅵ. 결론 및 정책적 제언
1. 여성가족 빅데이터 연구방향 제언
○ 시범분석이나 1회성 연구를 넘어서 연구 주제에 따라 지속적으로 분석 결과를 생산・관리할 수 있는 시스템적 접근이 필요하며, 향후 현황 분석을 넘어 예측 및 대응체계 구축까지 발전되기 위한 여성가족 빅데이터 거버넌스 및 플랫폼 구축이 필요함. 이때 여성가족 빅데이터 연구는 크게 기존 연구의 체계화, 새로운 빅데이터 기반 연구주제의 발굴, 빅데이터 분석방법 차원의 문제 개선 등 세 가지로 향후 연구방향을 제안함.
○ 기존 수행된 여성가족 빅데이터 분석
Ⅵ. 결론 및 정책적 제언
1. 여성가족 빅데이터 연구방향 제언
○ 시범분석이나 1회성 연구를 넘어서 연구 주제에 따라 지속적으로 분석 결과를 생산・관리할 수 있는 시스템적 접근이 필요하며, 향후 현황 분석을 넘어 예측 및 대응체계 구축까지 발전되기 위한 여성가족 빅데이터 거버넌스 및 플랫폼 구축이 필요함. 이때 여성가족 빅데이터 연구는 크게 기존 연구의 체계화, 새로운 빅데이터 기반 연구주제의 발굴, 빅데이터 분석방법 차원의 문제 개선 등 세 가지로 향후 연구방향을 제안함.
○ 기존 수행된 여성가족 빅데이터 분석 대부분이 시범적으로 수행되었기에 이를 지속화・체계화하는 연구로 확장가능성을 제안함. 특히 가장 많이 활용된 소셜데이터 분석은 정책입안 및 집행 과정에서 의견수렴을 위한 중요한 도구로 활용될 수 있으며 이를 위해 안정된 데이터 확보와지속적인 분석 도구 개발이 함께 해결해야 할 과제로 남아 있음. 또한 정책 운영의 관리 차원에서 지표를 생성하고 관리하는 방안도 연구가치가 있음. 가령 여성 온라인 범죄에 대한 빅데이터 분석 결과를 토대로 사이트별 지표를 만들고 이를 지속적으로 관리한다면 온라인 범죄를 줄이는데 영향을 줄 것이라 기대함. 그 밖에 안전이나 복지분야에서는 예측 및 대응체계를 마련하는 연구도 중요한 연구주제임.특빅데이터 분석 자체보다는 이를 활용하여 사전 예방체계나 사고 후대응체계를 마련하는 것이 필요하며, 타연구기관의 경우 재해방지나 범죄 대책 마련을 위한 시스템 구축을 이미 제안하고 있음.
○ 둘째, 새로운 여성가족 빅데이터의 발굴을 통한 연구주제 발굴임.빅데이터 연구는 데이터 가용성의 제한을 받을 수밖에 없어서 새로운 빅데이터와 여성 문제 간 연결은 새로운 연구주제가 될 수 있음. 예컨대,타연구기관에서 연구된 시설건축물 데이터나 사물인터넷 데이터, 타부처 행정데이터 등을 활용하여 여성 작업장 안전 연구나 직장내 양성평등,여성 콘텐츠 등의 주제와 연결한다면 새로운 주제가 될 수 있음.
○ 세 번째, 분석과정 및 방법론 차원에서의 개선방안 연구를 제안함. 지속적인 빅데이터 활용을 위해서 첫째, 기존의 데이터를 한 곳에 연계하여 빅데이터를 생산・관리하는 시스템을 구축하고 분석의 틀을 마련하는 것이 필요함. 두번째로는 인공지능이 확산되면서 편향(Bias) 문제가 부상하고 있는데, 특히 성적 편향 문제는 인종적 편향과 더불어 가장 큰 화두임. 그러므로 알고리즘에서 성편향성이 발생하는 분야를 발견하는 연구와 설명가능한 알고리즘 개발 등 이러한 편향성을 낮추기 위한 방법론 개발의 연구는 중요한 주제임. 마지막으로 빅데이터의활용도를 높이는 방안을 마련해야 함. 타기관 연구들은 수요자 관점에서 빅데이터 분석결과를 개방하고 수요자의 정보 접근성을 높이는 방법등을 모색 중임. 빅데이터 분석 결과에 대해 소셜데이터, 2차자료를 연계하여 해석에 개연성을 높이고 이용자 중심으로 정보제공하는 등 결과 활용도를 높이는 연구가 빅데이터 분석 연구와 더불어 병행되어야 할 것임.
2. 개인정보처리를 위한 법규정 개정
○ 빅데이터를 통한 연구과 산업이 활성화되면서 개인정보보호문제와 여러자료의 연계된 데이터의 개인식별 방지에 관한 이슈도 꾸준히 제기되고 있음. 현재 우리나라는 비교적 개인정보규제 수준이 높으나, 개인정보보호 규정의 모호성, 획일성으로 데이터 활용 및 유통이 제한적이라는한계점으로 데이터 접근 및 활용이 어려움.
○ 2016년 6월 ‘개인정보 비식별조치 가이드라인’을 발표하여 개인정보 비식별조치, 재식별여부에 대한 적정성 평가, 재식별방지를 위한 사후관리 등의 단계를 제시하였으나 이러한 가이드라인은 법적 규범적 효력이 없는 한계를 지니고 있었음. 이에 개인정보보호법을 수정 및보완하고자 하는 개정안(데이터3법)이 발의되었고, 2019년 12월 4일 국회에서 통과되었으나 정기국회처리가 무산되면서 연내처리를 기대하기 어렵게 되었음.
○ 유럽연합(EU)은 이러한 문제의 해결을 위해 2016년 GDPR(General Data Protection Regulation)을 규정하고 2018년부터 적용해 개인정보를 구체적으로 정의하고 개인정보를 보유한 기관이 개인정보처리의 위험성을 평가하여 가명처리 및 암호처리 등 안전조치를 취하도록 규정하고 있으며 중국, 일본 등 많은 국가가 이를 참고하여 법과 규정을도입함.
○ 우리나라도 공공데이터전략위원회를 비롯하여 행정안전부, 통계청 등 에서 공공데이터 개방 확대, 공공데이터 체계적 관리를 통한 접근성강화, 활성화 등을 위한 목표체계를 세우고 있지만, 현실적으로 법과 규정에 의해 공개되지 않거나 활용이 어려운 자료가 더 많은 실정임. 따라서 향후 구체적인 법과 규정 개정 등 보다 근본적인 제도변화가필요함.
3. 여성가족 빅데이터 거버넌스 구축
○ 여성가족 빅데이터의 활용을 활성화하기 위하여 데이터의 가용성,유용성, 통합성, 보안성을 관리하기 위한 정책과 프로세스를 다루며 프라이버시, 보안성, 데이터 품질, 관리규정 준수를 위한 데이터 거버넌스가 필요함.
○ 여성가족부는 이러한 거버넌스 체계가 마련되어 있지 않고 전담기관 또한 부재한 상황임. 여성가족 빅데이터 거버넌스 구축은 전문인력 확보와 조직 개편, 여성가족부 내부의 데이터 기반 정책 강화를 위한 인식 확산 등 업무 프로세스의 변화와 함께 유관기관과의 공감대 형성이 중요함. 따라서 다음과 같은 3단계 실행전략을 통해 거버넌스 구축을 제안함.
○ 1단계 : 빅데이터 거버넌스 구축 준비기
- 빅데이터 거버넌스 구축 전문성 강화를 위한 직무 분석
- 통계기획평가 전담기관 지정 타당성 검토
- 여성가족통계 및 빅데이터관리규정 제정 방향 정립
- 부처, 유관기관과 공감대 형성을 위한 교육 및 홍보 방안 수립
○ 2단계 : 빅데이터 거버넌스 체계 도입기
- 통계 전문 인력을 우선 확보하고 빅데이터 거버넌스 구축을 위한 조직 개편의 타당성 검토
- 여성가족통계 및 빅데이터 전담기관을 지정하고 여성가족통계관리규정을 우선적 제정
- 여성가족부 내부 인력과 유관기관 대상의 빅데이터 거버넌스 관련 교육과 홍보 시행
- 여성가족 주제의 빅데이터 분석 시범사업 개시
- 빅데이터통합정보시스템 구축(신규구축 또는 기존 시스템 성능보완)
○ 3단계 : 빅데이터 거버넌스 체계 확립기
- 빅데이터 거버넌스 구축에 부합하는 조직 개편과 이에 따른 업무 재정비
- 여성가족통계 및 빅데이터관리규정을 제정
- 여성가족부와 유관기관 대상의 빅데이터 거버넌스 확립을 위한 교육과 홍보를 내실화
- 도입기에서 시행한 빅데이터 분석 시범사업을 기반으로 여성가족 빅데이터 분석사업을 확대
- 빅데이터통합정보시스템 기능을 고도화
(출처 : 연구요약 20p)
Abstract
▼
This paper reports the findings of the last research of our 3-year research project (2017-2019). The goals of the research are the followings. First, it investigates a way to lay a foundation forthe use of big data regarding women and family. In the 1st and 3rd year of the proj
This paper reports the findings of the last research of our 3-year research project (2017-2019). The goals of the research are the followings. First, it investigates a way to lay a foundation forthe use of big data regarding women and family. In the 1st and 3rd year of the project, we conducted studies on how to improve, manage, and share data with an aim to facilitate the use of big data. Second, it explores the possible use of big data and its implications on policy improvement by performing a pilot analysis of big data in selected areas of women’s policy. For the pilot analysis, a wide range of subjects were selected over the course ofthree years to analyze related data.
Based on the findings of the first and second research, we examined the possibility of establishing a platform in the mid-to-long term for the use of big data on women and family.
We also discussed the creation of a platform and governance withan aim to explore the prospect of the use of big data in the field of women and family. The pilot analysis used social media data in order to examine gender differences in political discourse, whichis typically considered a male-dominant area, in online spaces.
Furthermore, we reviewed the likelihood of gender discrimination in data and algorithm and conducted an experimental study inorder to determine the potential reproduction of gender bias byalgorithm.
According to our study on gender differences in online political discourse, political discussions were routinely engaged in online community sites. Our research has also showed that the nature of political discourse changed depending on the gender-related characteristics of the site, implying that there may be distinctivegender differences in political needs. In addition, we haveidentified a need to keep track of easily accessible, opencommunity sites in order to avoid potential conflicts with research ethics and to create a platform to collect and store online postingsover a long term to track changes over time.
Through a hiring experiment performed to examine the potential reproduction of gender discrimination by big data algorithm, we proved that there was a potential for gender discrimination by big data algorithm. In particular, it was confirmed that a hiring algorithm which used intrinsically discriminatory data for learning reinforced and reproduced a discriminatory hiring practice. On the contrary, a hiring algorithm that learned from data clear from attributes pertaining todiscrimination, such as gender and number of children, madenon-discriminatory hiring recommendations.
Last, we performed research on measures to establish an infrastructure and governance to promote the use of big data on women and family and provided the following suggestions: toconstruct a platform for big data on women and family; and to link and complement the existing platform for big data on women and family. For the establishment of governance for big data on women and family, we recommend the Ministry of Gender Equalityand Family to secure personnel dedicated to statistics and big dataand reshuffle its organization. Second, it is necessary to introduce regulations on the management of statistics and data on women and family. Third, we recommend designating an organization (the Korean Women’s Development Institute) to plan, evaluate, and strengthen statistics on women and family. Last, there is a need tostrengthen cooperation with other relevant organizations andestablish strategies for the step-by-step implementation of the governance structure.
(출처 : Abstract 324p)
목차 Contents
- 표지 ... 1
- 발간사 ... 4
- 연구요약 ... 6
- 목차 ... 24
- 표목차 ... 28
- 그림목차 ... 31
- 부표목차 ... 33
- Ⅰ. 서 론 ... 34
- 1. 연구의 필요성 및 목적 ... 35
- 2. 연구내용 및 방법 ... 37
- 가. 연구내용 ... 37
- 나. 연구방법 ... 40
- Ⅱ. 여성가족 빅데이터 정책 및 연구동향 ... 44
- 1. 여성가족 빅데이터 연구배경 ... 45
- 가. 여성가족 빅데이터 연구검토 ... 45
- 나. 빅데이터 알고리즘 분석사례 ... 49
- 2. 빅데이터 연구 및 정책의 최신 동향 ... 53
- 가. 빅데이터 연구의 최근 이슈 ... 53
- 나. 국내 정책 동향 및 활용사례 ... 62
- 다. 국제기구 및 주요 국가 정책 동향 및 활용사례 ... 67
- 3. 국내 외 빅데이터 플랫폼 구축사례 ... 75
- 가. 국내 빅데이터 플랫폼 구축사례 ... 75
- 나. 국외 빅데이터 플랫폼 구축사례 ... 80
- 다. 시사점 ... 82
- Ⅲ. 온라인 커뮤니티를 통한 성별 정치담론 비교・분석 ... 85
- 1. 연구배경 및 목적 ... 86
- 가. 연구 필요성과 목적 ... 86
- 나. 연구 내용 및 방법 ... 88
- 2. 정치의식과 활동의 성별 차이 관련 선행 연구 ... 93
- 가. 일상정치와 인터넷 커뮤니티 ... 93
- 나. 성별화된 온라인 커뮤니티와 정치 담론 ... 95
- 3. 온라인 커뮤니티 정치담론 빅데이터 분석 ... 97
- 가. 남성 커뮤니티 A ... 97
- 나. 기타 남초 커뮤니티 ... 103
- 다. 여성 커뮤니티 A ... 107
- 라. 기타 여성 커뮤니티 ... 113
- 마. 성별 정치담론 비교 분석 ... 119
- 4. 소결 및 정책적 함의 ... 124
- 가. 소결 ... 124
- 나. 정책적 함의 ... 125
- Ⅳ. 빅데이터 알고리즘의 성차별 가능성에 관한 실증적 분석과 개선방안 ... 127
- 1. 빅데이터 알고리즘의 성차별 재생산에 관한 실험적 실증연구 ... 128
- 가. 문제제기 ... 128
- 나. 빅데이터 알고리즘의 개발과정과 차별의 재생산 가능성 ... 130
- 다. 실험적 실증연구 : 채용 알고리즘 ... 134
- 라. 분석결과 ... 151
- 마. 소결 ... 178
- 2. 빅데이터 알고리즘의 성차별 재생산 해결을 위한 제도적 제언 ... 181
- 가. 알고리즘의 관점과 부정적 측면 ... 181
- 나. 알고리즘의 부정적 측면을 극복하기 위한 원칙 : 공정성, 책무성, 투명성 ... 182
- 다. 공정성・책무성・투명성 세부내용 ... 184
- 라. 알고리즘 감사 ... 194
- 마. 소결 ... 199
- Ⅴ. 여성가족 빅데이터 활용촉진을 위한 인프라 전략과 거버넌스 구축 방안 ... 203
- 1. 서론 ... 204
- 가. 연구 필요성과 목적 ... 204
- 나. 연구 내용 및 방법 ... 206
- 2. 여성가족 빅데이터 활용현황 및 인식조사 ... 207
- 가. 여성가족 빅데이터 현황진단 ... 207
- 나. 여성가족 빅데이터에 대한 전문가 인식조사 ... 209
- 3. 여성가족 빅데이터 플랫폼 구축방안 ... 215
- 가. 여성가족 빅데이터 플랫폼 구축 가능성 검토 ... 215
- 나. 여성가족 빅데이터 플랫폼 강화 방안 ... 222
- 다. 시사점 ... 227
- 4. 여성가족 빅데이터 거버넌스 구축방향 ... 229
- 가. 데이터 거버넌스 정의와 필요 ... 229
- 나. 데이터 거버넌스 개선 사례 ... 235
- 다. 여성가족 빅데이터 거버넌스 구축방향 ... 240
- 5. 소결 ... 251
- Ⅵ. 결론 및 정책적 제언 ... 254
- 1. 분석주제별 결론과 정책적 제언 ... 255
- 가. 온라인 커뮤니티를 통한 성별 정치담론 비교・분석 ... 255
- 나. 빅데이터 알고리즘의 성차별 가능성에 관한 실증적 분석과 개선방안 ... 256
- 다. 여성가족 빅데이터 활용촉진을 위한 인프라 전략과 거버넌스 구축방안 ... 259
- 2. 여성가족 빅데이터의 활용촉진을 위한 정책 제언 ... 261
- 가. 여성가족 빅데이터 연구방향 제언 ... 261
- 나. 개인정보처리를 위한 법규정 개정 ... 269
- 다. 여성가족 빅데이터 거버넌스 구축 ... 270
- 참고문헌 ... 272
- 부록 ... 299
- 부록1. 여성가족부 분야별 정책(청소년 정책 제외) ... 300
- 부록2. 채용데이터의 탐색적 분석 결과 ... 302
- 부록3. 채용알고리즘 개발 프로그램 코드(R code) ... 306
- Abstract ... 324
- 끝페이지 ... 327
※ AI-Helper는 부적절한 답변을 할 수 있습니다.