보고서 정보
주관연구기관 |
분당서울대학교병원 |
연구책임자 |
신철민
|
참여연구자 |
김동길
,
김민규
,
김정연
,
김중희
,
김택균
,
박상준
,
안소연
,
온정헌
,
이미연
,
정성재
,
지은정
,
문창주
,
강길욱
,
구자훈
,
김영갑
,
김정석
,
김주엽
,
김주현
,
신수연
,
오세라
,
유진용
,
이기은
,
정일우
,
최나라
|
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 |
한국어
|
발행년월 | 2022-11 |
과제시작연도 |
2021 |
주관부처 |
보건복지부 [Ministry of Health & Welfare(MW)(MW) |
등록번호 |
TRKO202300004689 |
DB 구축일자 |
2023-08-09
|
키워드 |
클라우드기반 정보보안.데이터참조모델.속성기반 암복호화.재현데이터.통계적매칭.cloud based information security.data reference model.attribute based encryption.synthetic data.statistical matching.
|
초록
▼
○ 제1세부: - 빅데이터를 재현데이터로 가공하여 의학 발견, 정책 근거, 산업 발전을 위해 유용하게 사용되는 해외 사례가 증가하고 있음(영국 경시적 데이터 SYLLS 프로젝트, 영국 CRPD 심혈관계 질환과 코로나 환자 전자의무기록 제공,미국 450만명 N3C 코호트의 재현데이터 제공)
-본 연구과제는 (통계적 매칭을 이용한) 데이터 결합, 재현데이터 생성, 차등 개인정보호호(differential privacy) 등 응용통계학적으로 최근 각광받고 있는 이슈에 대한 실증 연구를 담고 있으며, 재현데이터를 이용한 결합은 향후
○ 제1세부: - 빅데이터를 재현데이터로 가공하여 의학 발견, 정책 근거, 산업 발전을 위해 유용하게 사용되는 해외 사례가 증가하고 있음(영국 경시적 데이터 SYLLS 프로젝트, 영국 CRPD 심혈관계 질환과 코로나 환자 전자의무기록 제공,미국 450만명 N3C 코호트의 재현데이터 제공)
-본 연구과제는 (통계적 매칭을 이용한) 데이터 결합, 재현데이터 생성, 차등 개인정보호호(differential privacy) 등 응용통계학적으로 최근 각광받고 있는 이슈에 대한 실증 연구를 담고 있으며, 재현데이터를 이용한 결합은 향후 빅데이터 결합의 한 대안이 될수 있음.
- 본 연구의 방법론은 재식별화 위험 및 개인정보보호 측면 뿐 아니라 자료의 유용성 측면에서도 적합한 연구를 진행할 수 있음.
- 재현데이터 결합 연구의 유용성 평가 연구는 전세계에서 사례를 찾기 어려워 본 연구에서 시도한 방법론과 결과는 학문적 측면으로도 의미가 있음.
- 또한 보건의료 빅데이터 연구에 즉시 적용할 수 있어 실용적 측면으로 활용도가 높음
- 본 세부과제에서 도출한 가이드라인은 보건의료 빅데이터를 중심으로 정보보호 이슈(가명처리, 익명처리)와 데이터 결합 과정이슈를 포괄하여 다루고 있어, 해당 연구에 관심 있는 연구자, 개발자, 정책 입안자에게 참고가 될 것으로 생각됨.
○ 제2세부: 클라우드 기반 보건의료 빅데이터 정보보호 기술 연구
- 보건의료 빅데이터 활용으로 얻을 수 있는 부가가치가 매우 크지만, 데이터에 포함된 개인의 프라이버시 보호는 데이터 활용의 선결 요건임.
- 제 2세부에서는 클라우드 기반의 빅데이터 활용 플랫폼 환경에서, 프라이버시를 보호하기 위한 다양한 방법을 고찰하였음.
- 현재 운영 중인 공공기관 자료연계를 위한 보건의료 빅데이터 플랫폼은 프라이버시 유출 우려로 기능을 다소 협소하게 구현한면이 있음(플랫폼에 데이터를 보관하지 않고 공공기관 데이터 연계 후 삭제하므로 플랫폼상에 보호할 데이터가 존재하지 않음)
- 본 연구에서는 보건의료 빅데이터 플랫폼의 역할과 기능을 미래지향적으로 설정하고, 플랫폼 안팎에서의 프라이버시 보호 빅데이터 활용방안과 시나리오를 다양한 각도로 제시하였음
- 특히 보건의료 데이터 참조모델의 메타데이터에 기반하여 사용자 역할 권한별 정보 접근 범위 설정 방안을 고찰하였으며, 기활용된 데이터 셋과 분석 알고리즘 등을 플랫폼 내에서 재활용하여 안전성과 유용성을 제고하기 위한 방안을 연구하였음.
- 데이터 접근자의 시공간, 접근장치, 생체정보, 자격 등 다양한 속성 조건에 따라 데이터 암복호화범위를 제어하는 속성기반 암복호화(Attribute Based Encryption: ABE) 기술을 구현하였음. 이러한 속성기반 암복호화 기술을 응용하여 보건의료 빅데이터 플랫폼 내부자 의료정보 유출 방지 방안과 발급데이터 사후 안전 관리방안을 고찰하였으며, 특히 발급데이터 사후 안전관리방안을 마련하기 위해 블록체인 기술을 도입하여 데이터 접근 기록의 무결성을 보장하도록 하였음..
- 추가적으로 4세대 암호기술로 일컫는 동형암호 기술을 보건의료 빅데이터 플랫폼 상에서 활용하기 위한 방안을 고찰하고 활용 시나리오를 제시하였음.
(출처 : 요약문 5p)
Abstract
▼
○ 제1세부
- Overseas cases of synthetically generated big data have increased. Synthetic data is used for medical research, policy basis, and industrial development.
- This research project addresses practical challenges such as statistical matching, data integration, synthetic data generation, a
○ 제1세부
- Overseas cases of synthetically generated big data have increased. Synthetic data is used for medical research, policy basis, and industrial development.
- This research project addresses practical challenges such as statistical matching, data integration, synthetic data generation, and differential privacy. Data integration using synthetic data, as proposed in this project, could be a potential strategy for bigdata integration.
- The methodology described in the project is appropriated for research in re-identification risk, data privacy issues, and data utility.
- The methodology and results attempted in this study are also academically significant because, to the best of our knowledge, it is the first research to evaluate the data utility using Data integration using synthetic data.
- It is also highly useful because it is immediately applicable to healthcare bigdata analysis.
- The resulting guideline covers the data privacy and protection issues (pseudonymization, anonymization techniques) as well as the data integration process with a focus on health and medical big data, and thus be used as a reference for researchers, industrial developers, and policy makers interested in the study.
○ 제2세부
- Despite the significant additional value that may be derived from the use of big data in health care, the protection of personal privacy contained in data is a must for data use.
- Various strategies to preserve privacy were studied in the bigdata platform context.
- The health and medical big data platform for data integration has narrowed its functionality due to worries about privacy issues. (The data is not stored on the platform and erased after integration)
- In this study, the many roles and functions of the healthcare big data platform were characterized as a future-oriented approach.
- The approach of determining the information access scope for each user position and authority was evaluated based on the metadata of the health and medical data reference model. We proposed the ways to improve the platform's safety and usefulness by recycling data sets and analysis algorithms.
- Attribute Based Encryption (ABE) technology was implemented, which controls the data encryption/decryption range based on multiple attribute conditions such as time and space, access device, biometric information, and the data accessor's credentials. Using ABE, we reviewed the healthcare big data platform’s strategy for preventing insider information leakage and a post-release safety management. We also introduced blockchain technology to secure the integrity of data access records and to construct a post-release safety management.
- A plan to use homomorphic encryption technology, often known as 4th generation encryption technology, on the health and medical big data platform was also discussed, along with an utilization scenario.
(source: SUMMARY 6p)
목차 Contents
- 표지 ... 1
- 제출문 ... 2
- 보고서 요약서 ... 3
- 요약문 ... 5
- SUMMARY ... 6
- 6.1 총괄연구개발과제의 연구성과 실적 및 향후 계획 ... 7
- 6.2 연구성과 유형별 세부 내역 ... 9
- 7. 참여연구원 현황표 ... 10
- 목차 ... 11
- 1. 연구개발과제의 개요 ... 12
- 2. 연구개발과제의 수행 과정 및 수행내용 ... 15
- 3. 연구개발과제의 수행 결과 및 목표 달성 정도 ... 61
- 1) 연구수행 결과 ... 61
- 2) 목표 달성 수준 ... 71
- 4. 목표 미달 시 원인분석 ... 72
- 1) 목표 미달 원인(사유) 자체분석 내용 ... 72
- 2) 자체 보완활동 ... 72
- 3) 연구개발 과정의 성실성 ... 73
- 5. 연구개발성과의 관련 분야에 대한 기여 정도 ... 74
- 6. 연구개발성과의 관리 및 활용 계획 ... 75
- 7. 참고문헌 ... 77
- 끝페이지 ... 78
※ AI-Helper는 부적절한 답변을 할 수 있습니다.