보고서 정보
주관연구기관 |
고려대학교 Korea University |
연구책임자 |
정희태
|
참여연구자 |
김선업
,
안성아
,
신승준
|
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 |
한국어
|
발행년월 | 2019-12 |
과제시작연도 |
2019 |
주관부처 |
국무조정실 The Office for Government Policy Coordination |
등록번호 |
TRKO202000005528 |
과제고유번호 |
1105014770 |
사업명 |
한국여성정책연구원(R&D) |
DB 구축일자 |
2020-07-29
|
초록
▼
Ⅰ. 여성가족 빅데이터 연구방향 탐색
가. 연구배경 및 목적
○ 한국여성정책연구원에서는 지난 3년 동안 여성가족 빅데이터 활용 연구를 진행해 왔으며. 현재는 기수행된 연구 성과 점검 및 향후 여성가족 빅데이터 연구방향에 대해 논의가 필요한 시점임
○ 이에 한국여성정책연구원이 수행한 빅데이터 분석연구들을 검토하고 타분야 연구기관에서 수행한 빅데이터 연구들을 조사하여 여성가족 빅데이터 연구의 확장 방향을 탐색하고자 함
나. 타분야 빅데이터 분석 사례
○ 여성가족 빅데이터 연구방향을 탐색하기 위해 타분야
Ⅰ. 여성가족 빅데이터 연구방향 탐색
가. 연구배경 및 목적
○ 한국여성정책연구원에서는 지난 3년 동안 여성가족 빅데이터 활용 연구를 진행해 왔으며. 현재는 기수행된 연구 성과 점검 및 향후 여성가족 빅데이터 연구방향에 대해 논의가 필요한 시점임
○ 이에 한국여성정책연구원이 수행한 빅데이터 분석연구들을 검토하고 타분야 연구기관에서 수행한 빅데이터 연구들을 조사하여 여성가족 빅데이터 연구의 확장 방향을 탐색하고자 함
나. 타분야 빅데이터 분석 사례
○ 여성가족 빅데이터 연구방향을 탐색하기 위해 타분야 정책연구기관들의 빅데이터 분석 연구들을 살펴보고자 국무조정실 산하 26개 연구기관에서 수행한 빅데이터 연구 자료를 수집함
○ 조사결과 2013년 이래 총 84개의 빅데이터 연구가 진행되었으며,국토연구원에서 가장 많은 연구를 진행하였고 다음으로 환경연구원,보건연구원 순임.
○ 타 분야 빅데이터 연구는 빅데이터 알고리즘 연구 11건이 조사대상이 되었으며 구체적으로 안전분야는 ‘침수재해 모니터링 시스템’과 ‘생애주기 통합 건설정보 시스템’, ‘범죄예방시스템, 항만안전 시스템’, 경제분야는 ‘임대차수요 분석 및 예측시스템’과 ‘균형발전 대쉬보드’ 연구,보건 분야는 ‘저출산 연구’ 2개. 복지 분야는 ‘복지정책 지원시스템과 민감, 취약집단의 맞춤형 건강가이드라인 지원시스템’을 집중적으로살펴봄
○ 빅데이터 알고리즘 연구에 사용된 빅데이터 유형은 공공기관에서 제공하는 행정데이터, 온라인에서 생성된 의견데이터 순이며 가장 다양한 빅데이터를 활용한 분야는 안전분야와 보건분야임.
○ 결론적으로 타정책연구기관에서 수행한 빅데이터 알고리즘 연구들은 다음의 시사점을 제공함. 첫째, 지속적인 분석을 위한 시스템을 지향함. 실시간으로 정보를 제공하고 이를 가능하게 하기 위해 주제에 맞게 설정된 분석의 틀을 기반으로 지속적으로 빅데이터를 분석할 수 있는 방법론을 제시함. 둘째. 단일 유형의 데이터를 통한 단발적인 빅데이터 분석이 아닌 다양한 분야의 데이터를 융합하여 특정 주제에 맞는 데이터를 생산・관리하는 시스템을 구축하는 경향을 보임. 마지막으로 수요자 지향적인 시스템에 초점을 맞춰서 개발되는 추세를 보임. 수요자가 직접 생산한 소셜빅데이터를 행정데이터와 결합하여 수요자 중심의 빅데이터 시스템을 구축하고자 하며 수요자의 실질적인 이용을 위해 정보를 시각화하여 맞춤형 검색이 가능한 서비스를 개발하는 경향을 보임
다. 여성가족 빅데이터 연구방향 제언
○ 한국여성정책연구원의 여성가족 빅데이터 연구는 짧은 시간에 비해 다양한 빅데이터를 기반으로 여러 분야의 여성문제를 다루었다고 평가되며. 여성가족부 및 한국여성정책연구원의 정책 방향과 일관된 주제들을 연구하는 등의 기여를 하였음
○ 다만 이 연구들이 시범분석이나 1회성에 그치고 있는 점은 아쉬움. 연구주제에 따라 지속적으로 분석 결과를 생산・관리할 수 있는 시스템적 접근이 필요하며, 향후 현황 분석을 넘어 예측 및 대응체계 구축까지 발전된다면 여성문제 해결에 실질적인 도움을 제공할 수 있으리라 봄
○ 타분야 빅데이터 연구 조사결과를 토대로 여성가족 빅데이터 연구는 크게 기존 연구의 체계화, 새로운 빅데이터 기반 연구주제의 발굴, 빅데이터 분석방법 차원의 문제 개선 등 세 가지로 향후 연구방향을 제안함
○ 먼저 기존 수행된 여성가족 빅데이터 분석 대부분이 시범적으로 수행되었기에 이를 지속화・ 체계화하는 연구로 확장가능성을 제안함. 특히가장 많이 활용된 소셜데이타 분석은 정책입안 및 집행 과정에서 의견수렴을 위한 중요한 도구로 활용될 수 있으며 이를 위해 안정된 데이터 확보와 지속적인 분석 도구 개발이 함께 해결해야 할 과제로 남아있음. 또한 정책 운영의 관리 차원에서 지표를 생성하고 관리하는 방안도 연구 가치가 있음. 가령 여성 온라인 범죄에 대한 빅데이터 분석결과를 토대로 사이트별 지표를 만들고 이를 지속적으로 관리한다면 온라인 범죄를 줄이는데 영향을 줄 것이라 기대함. 그 밖에 안전이나 복지 분야에서는 예측 및 대응체계를 마련하는 연구도 중요한 연구주제임. 특빅데이터 분석 자체보다는 이를 활용하여 사전 예방체계나 사고후 대응체계를 마련하는 것이 필요하며, 타연구기관의 경우 재해방지나 범죄 대책 마련을 위한 시스템 구축을 이미 제안하고 있음
○ 둘째, 새로운 여성가족 빅데이터의 발굴을 통한 연구주제 발굴임. 빅데이터 연구는 데이터 가용성의 제한을 받을 수밖에 없어서 새로운 빅데이터와 여성 문제 간 연결은 새로운 연구주제가 될 수 있음. 예컨대,타연구기관에서 연구된 시설건축물 데이터나 사물인터넷 데이터, 타부처 행정데이터 등을 활용하여 여성 작업장 안전 연구나 직장내 양성평등, 여성 콘텐츠 등의 주제와 연결한다면 새로운 주제가 될 수 있음
○ 세 번째, 분석과정 및 방법론 차원에서의 개선방안 연구를 제안함. 지속적인 빅데이터 활용을 위해서 첫째, 기존의 데이터를 한 곳에 연계하여 빅데이터를 생산・관리하는 시스템을 구축하고 분석의 틀을 마련하는것이 필요함. 두번째로는 인공지능이 확산되면서 편향(Bias) 문제가 부상하고 있는데, 특히 성적 편향 문제는 인종적 편향과 더불어 가장 큰 화두임. 그러므로 알고리즘에서 성편향성이 발생하는 분야를 발견하는 연구와 설명가능한 알고리즘 개발 등 이러한 편향성을 낮추기 위한 방법론 개발의 연구는 중요한 주제임. 마지막으로 빅데이터의 활용도를 높이는 방안을 마련해야 함. 타기관 연구들은 수요자 관점에서 빅 데이터 분석결과를 개방하고 수요자의 정보 접근성을 높이는 방법 등을 모색 중임. 빅데이터 분석 결과에 대해 소셜데이터, 2차자료를 연계하여 해석에 개연성을 높이고 이용자 중심으로 정보제공하는 등 결과 활용도를 높이는 연구가 빅데이터 분석 연구와 더불어 병행되어야 할 것임.
(출처 : 연구요약 5p)
Abstract
▼
1. Review and research direction of gender Big Data research
The three-year project of gender big data’s utilization has been studied in the Korea Women's Development Institute. Now is the time to review the research results and discuss the future direction of big data research for women and fami
1. Review and research direction of gender Big Data research
The three-year project of gender big data’s utilization has been studied in the Korea Women's Development Institute. Now is the time to review the research results and discuss the future direction of big data research for women and families. In order to explore theresearch direction. we review big data research conducted by the Korea Women's Development Institute and 26 national researchinstitutes.
Overall, the research on gender big data has dealt with women's problems in various fields based on various big data compared to the short time. However, the most of the analysis has been piloted, which should be supplemented: a systematic approach to continuously produce and manage the information is required,
In conclusion, we suggest three directions for future research involving gender big data analysis: systematization and automation of analysis, discovery of new big data-based research topics, and methodology improvements.
2. Experimental study on Gender discrimination of Big Data Algorithm
The purpose of this study is to empirically identify the concern that big data algorithms reproduce and reinforce discrimination.
Hiring data were collected and analyzed using experimental methods of audit study on the SI industry. This confirms that there is gender discrimination in hiring in the SI industry. Also, we confirmed that the recruitment algorithm developed by learning data using thedata with the gender bias is reproducing by reinforcing genderdiscrimination. However, except for discriminatory attribute information like gender in the learning data, the algorithm wasfound to completely eliminate gender discriminative employmentand recommend gender fair employment.
Therefore, empirically confirming that the algorithm, especially the eligibility screening algorithm, should not contain discriminatory characteristic information to be protected. Recognizing the necessity of algorithmic audit study in order to not reproduce social discrimination such as gender discrimination in the age of AI, we secured the basis for expanding the research.
3. Institutional Initiatives on Gender discrimination of Big Data Algorithm
Counter measures against negative consequences such as discriminating reproduction of big data algorithms were developed to secure algoritm accountability, fairness and transparency. This study summarizes the existing discussions on this issue, and argues for the preferential execution of drawing up consensus and feasible measures to date. In order to secure accountability, it requires a design based on accountability in the planning stage of the algorithm and a continuous monitoring system on the operationprocess. In order to secure fairness, it is required to audit the fairness of the composition of the learning data and the prediction result so that the algorithm prediction does not discriminate minority group. To ensure transparency, it requires a minimum disclosure of data and disclosure of information that can explain algorithm results. Following this direction, it is recommended to establish guidelines for minimum algorithm governance of algorithm development, evaluation and use, report transparency, and audit of fairness. It is desirable that these activities begin in the public sector and extend to the private sector. Therefore, it is necessaryto start pilot study in terms of FAT for algorithms developed andutilized in the public sector.
(출처 : Abstract 231p)
목차 Contents
- 표지 ... 1
- 연구요약 ... 5
- 목차 ... 17
- 표목차 ... 20
- 그림목차 ... 22
- 부표목차 ... 23
- Ⅰ. 여성가족 빅데이터 연구방향 탐색 ... 25
- 1. 연구배경 및 목적 ... 27
- 2. 타분야 빅데이터 분석 사례 ... 29
- 가. 조사대상 ... 29
- 나. 빅데이터 분석 사례 ... 37
- 다. 요약 및 시사점 ... 52
- 3. 여성가족 빅데이터 연구방향 제언 ... 57
- 가. 분석의 체계화 ... 59
- 나. 새로운 빅데이터 주제 발굴 ... 63
- 다. 방법론 개선 연구 ... 70
- Ⅱ. 빅데이터 알고리즘의 성차별 재생산에 관한 실험적 실증연구 ... 75
- 1. 문제제기 ... 77
- 2. 빅데이터 알고리즘의 개발과정과 차별의 재생산 가능성 ... 79
- 가. 데이터의 수집 ... 79
- 나. 학습데이터셋의 구성 ... 81
- 다. 알고리즘 개발 ... 83
- 3. 실험적 실증연구: 직원채용알고리즘 ... 84
- 가. 개발 주제 선정 및 접근방법 ... 84
- 나. 기존 연구 검토 ... 85
- 다. 연구 설계 ... 92
- 라. 분석절차 ... 99
- 4. 분석 결과 ... 107
- 가. 채용 성차별의 확인 ... 107
- 나. 채용 알고리즘의 개발 결과 ... 113
- 다. 차별적 인적속성을 제거한 채용 알고리즘 결과 ... 116
- 라. 채용알고리즘 비교 평가 ... 123
- 마. 채용알고리즘의 변수별 영향력 ... 131
- 5. 결론 ... 137
- Ⅲ. 빅데이터 알고리즘의 성차별 재생산 해결을 위한 제도적 제언 ... 141
- 1. 문제제기 ... 143
- 2. 연구대상과 논의틀의 정의 ... 144
- 가. 연구 대상으로서의 알고리즘과 관점 ... 144
- 나. 알고리즘의 부정적 측면을 극복하기 위한 원칙들 ... 146
- 3. 공정성(Fairness) ... 149
- 가. 알고리즘 공정성의 정의 ... 149
- 나. 발생 원인과 쟁점 ... 151
- 다. 공정성 확보를 위한 해결방안 ... 153
- 4. 책무성(Accountability) ... 155
- 가. 알고리즘 책무성의 정의 ... 155
- 나. 발생 원인과 쟁점 ... 156
- 다. 책무성 확보를 위한 시도들과 해결 방안 ... 157
- 5. 투명성(Transparency) ... 159
- 가. 알고리즘 투명성의 정의 ... 159
- 나. 발생 원인과 쟁점 ... 160
- 다. 투명성 확보를 위한 시도들 ... 161
- 6. 알고리즘 감사(Algorithm Audit) ... 164
- 가. 알고리즘 감사 방안 ... 164
- 나. 알고리즘 외부감사 사례 ... 170
- 7. 결론 ... 173
- 참고문헌 ... 177
- 부록 ... 191
- 부록1. 여성가족 빅데이터 분석 사례 ... 193
- 부록2. 채용데이터의 탐색적 분석 결과 ... 203
- 부록3. 채용알고리즘 개발 프로그램 코드(R code) ... 208
- Abstract ... 231
- 끝페이지 ... 235
※ AI-Helper는 부적절한 답변을 할 수 있습니다.