보고서 정보
주관연구기관 |
성균관대학교 SungKyunKwan University |
연구책임자 |
김효정
|
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 |
한국어
|
발행년월 | 2024-02 |
과제시작연도 |
2022 |
주관부처 |
교육부 Ministry of Education |
연구관리전문기관 |
한국연구재단 National Research Foundation of Korea |
등록번호 |
TRKO202400005781 |
과제고유번호 |
1345363020 |
사업명 |
이공학학술연구기반구축 |
DB 구축일자 |
2024-09-02
|
키워드 |
암생존자.건강의 사회적결정요인.지리정보시스템.공간역학.유방암.Cancer Survivor.Social Determinants of Health.Geographic Information System.Spatial Epidemiology.Breast Cancer.
|
초록
▼
□ 연구개발 목표 및 내용
○ 최종 목표
보건의료빅데이터와 지리공간데이터, 공간역학데이터를 geocode를 중심으로 연계하여 유방암 생존자의 사회적 건강결정요인을 암종별 특성과 치료경험에 따라 지역별로 분석하여 맞춤형 지지체계를 구체화 하는데 기여할 수 있는 다층적 연구 방법론과 기초자료를 제공하는 것이다. 본 연구에서는 암 생존자의 사회적 건강결정요인과의 연결고리로서 공간의 역할에 주목하고 사회적 건강요인의 개념적 기틀을 초기분석모델의 중심축으로 하여 초학제간 다면적 빅데이터셋을 연결한다. 동질한 물리적, 사회적 환경의
□ 연구개발 목표 및 내용
○ 최종 목표
보건의료빅데이터와 지리공간데이터, 공간역학데이터를 geocode를 중심으로 연계하여 유방암 생존자의 사회적 건강결정요인을 암종별 특성과 치료경험에 따라 지역별로 분석하여 맞춤형 지지체계를 구체화 하는데 기여할 수 있는 다층적 연구 방법론과 기초자료를 제공하는 것이다. 본 연구에서는 암 생존자의 사회적 건강결정요인과의 연결고리로서 공간의 역할에 주목하고 사회적 건강요인의 개념적 기틀을 초기분석모델의 중심축으로 하여 초학제간 다면적 빅데이터셋을 연결한다. 동질한 물리적, 사회적 환경의 영향 하에서 발생하는 지역사회의 특질은 곧 공간의 공유라는 접점을 통한 공간적 군집성으로서 발현되기 때문이다.
○ 전체 내용
연구에서는 스토리지에 잠들어 있는 데이터의 환자 중심 전향적 활용을 한 축으로 하여 1)전방위적인 데이터셋(유방암 생존자+사회적 건강결정요인 관련 요소들)의 탐색과 수집, 2) available dataset의 학제간 다형 데이터 연결을 위한 데이터 모델링, 3) 연계 분석을 위한 전처리 및 연구용 데이터 플랫폼 구축을 수행한다. 먼저 서울을 중심으로 초기분석모델을 생성하고 이를 기반으로 궁극적으로는 주요 도시(서울, 부산, 대구, 인천, 광주, 대전, 울산)로 데이터셋을 확장, 도시간 비교분석을 통해 도출된 사회적 결정요인들의 영향도를 고찰하였다.구체적으로는 전국 유방암환자의 10% 이상이 등록되어있는 일 병원 의무기록기반 유방암레지스트리의 500여개의 상세변수들을 활용하여 임상적 분류모델링을 수행하고, 공간역학 변수들과 연계하여 특별시 및 광역시로서 7개 도시를 대상으로 유방암생존자들의 암전주기에 따른사회적 건강결정요인을 고찰한다.
○ 1단계
● 목표
1) 데이터 전향적수집 및 연계모델링: integrative data modeling 국가/행정단위 수준의 다양한 도메인의 공공데이터를 지리정보를 중심으로 연계하여 활용하는 방법론의 모색
2) 암생존자 구분을 위한 분류 모델링: clinical classification 유방암환자의 암전주기를 이해하기 위해 주요 임상변수를 포함한 RWD의 이차적 사용방법의 고도화
3) 공간모델링을 통한 사회적건강결정요인분석: spatial analysis 암생존자의 사회적 건강결정요인에 대한 도시별 특성을 고려한 공간 분석연구
● 내용
1-1) 데이터 수집
▷ 삼성서울병원 유방암레지스트리 (1995~현재, N = 약 4만명)
▷ 국가단위 공공/공개데이터 수집 (가능하면 2000~2020년)
NVDI(녹지정보), air Korea(대기오염), 통계청 시군구별 인구밀도 등 기초통계, 국민건강영양조사, 국토교통부 공간정보 지적파일 및 주요도로 위치정보, 위험물질배출 업장정보, 한국행정구역코드 및 통계청 행정동법정동 연계표 등
▷ 시,군,구 단위 공공데이터 수집 (가능하면 2000~2020년)
서울 서베이, 도시별 녹지현황, 서울시 센서 조사 정보(소음, 진동, 빛), 주요 도로 교통량 정보, 질병관리청 지역사회건강조사, 대구시 구별 사회경제지표조사, 건강보험의료지도, 한눈에보는 대전, 울산의 사회조사, 지역내 총생산 조사표 등
▷ 보건의료빅데이터 결합사업 (2010~2019, N = 약 17만명, 2022년 신청, 2024년 2월 현재 결합데이터 폐쇄망에서 검토단계)
1-2) 데이터 연계
행정동/법정동의 불일치 문제를 확인 -> 주소API를 통한 위경도 시스템으로 경유하여 보완, 연계하는 방법 설계, 구축
2) 암생존자 정보의 분류 모델링
주요 임상변수인 clinical subtype을 병리검사결과로부터 도출하는 알고리즘을 개발, 적용하는 등 각각의 주요 질병 feature에 대해서 engineering하는 방안을 도출하였고 나아가 실사용데이터(RWD, real-world data)에서 연구에 필요한 주요 임상변수의 형태로 데이터를 도출하는데 있어서의 적정성을 확보하고 과정을 표준화 하기 위한 단계적 프로토콜인 FAR framework을 제시하고 효과성을 평가하였음.
3) 공간모델링을 통한 사회적건강결정요인분석
▷ 서울지역의 분석결과는“Traffic exposure and breast cancer mortality by area of residence: incoporating clinical and socieconomic data” 제목으로 국제학술대회에서 발표되었고 2024년 1월 Scopus journal인 Studies in Health Technology and Informatics에 초록출판, 발전시킨 최종 학술 논문은 Science of The Total Environment(IF 10.4)에 투고하여 심사 중. 서울지역 Overall survival의 multi-variable analysis 결과가 별도로 분석을 마치고 articulation 중임.
▷ 대전/울산 지역의 분석결과도 일병원 레지스트리를 활용한 공간분석과 문헌고찰 등은 마무리되었으나 도시별사회적건강결정요인의 데이터 접근성의 차이와 시군구 수준의 공간구획수의 차이가 커서 이를 보정하기위해 보건의료빅데이터 결합데이터 검토 후 articulation을 수행할 예정임.
▷ 부산, 대구, 인천, 광주지역은 각각 분석되었으며 지리/공간정보 데이터에서 대기물질구성, 화학물질배출지도, 녹지비율과 도로망과 교통량 등은 공통적으로 고려되었음. 주거 및 건강행태에 있어서도 인구밀도와 건물의 밀집도, 고도 정보들을 반영하며 적정한 지식표현과 수준으로 연구용 연계데이터셋을 도출, 확보하고 공간모델을 활용한 분석을 수행하였고 이 결과는 Medical Informatics Q1 SCIE 학술지인 Scientific Reports와 JMIR에 총 2편의 논문으로 투고하였음.
□ 연구개발성과
사회적 건강결정요인에 대한 연구들은 그 대상의 광범위함 때문에 여전히 질적인 연구 또는 설문조사 기반의 연구가 많이 시도되고 있다. 본 연구는 데이터 과학의 발전에 따른 새로운 접근 방법의 제안으로서, 개인을 중심으로 건강관련 지식표현으로서의 데이터 모델링과 통합을 일차적 방법론으로 적용하고 광범위한 도메인의 빅데이터를 수집, 통합하며, 유방암의 주요 임상변수인 clinical subtype과 치료방법 등의 변수를 발굴, 정의, 통제한 상태에서 7개의 도시를 아우르는 연구를 공공데이터와 RWD를 활용하여 의학통계와 공간분석의 방법론으로 수행하고자 하였다. 대부분의 사회적 영향요인들에 대한 척도가 surrogate로서 수집되고 공간을 중심으로 연결되었고 본 과제를 위해서 탐색한 데이터 원천들과 지역별, 대상자별 접근성의 격차 때문에 직접적인 연결성에 대한 해석과 인과성에 대한 해석의 시도 자체가 지양되어야 함은 분명하며, 이러한 현황 확인과 다학제-융복합 관점에서 유기적인 보완방안의 논의에 있어 본 연구 과정에서 얻은 경험과 구체적인 수치들이 기여할 수 있을 것으로 예상하였다.
초기 목표와 같이 본 연구 성과는 다음 세 가지 관점에서 갈무리된다. 1) 국가/행정단위 수준의 다양한 도메인의 공공데이터를 지리정보를 중심으로 연계하여 활용하는 방법론의 모색, 2) 유방암환자의 암전주기를 이해하기 위해 주요 임상변수를 포함한 RWD의 이차적 사용방법의 고도화, 그리고 이를 통해 3) 암생존자의 사회적 건강결정요인에 대하여 다학제적 연구로 접근하는 공간분석연구이다. 본 연구에서는 1) 국가 행정단위 수준의 다양한 도메인의 공공데이터를 탐색하면서 행정목적의 국가 생성데이터에서도 지리정보에 대해서 행정동/법정동의 불일치 문제를 확인하였고, 이를 주소API를 통한 위경도시스템으로 보완하여 연계하는 방법을 구축하였다. 또한 이 과정에서 본 연구 대상을 도시에 국한했음에도 불구하고 정보생산 및 제공에 있어서 체계성과 디지털 기술 적용, 관리되고 있는 변수들의 불균형의 정도가 매우 큼을 구체적으로 확인할 수 있었다. 2) 주요 임상변수를 포함한 RWD의 이차적 사용방법의 고도화 부분에서는 RWD에서 연구변수로의 자료 추출과정에서 신뢰성과 타당성을 담보할 수 있는 연구 방법론을 제안하였고, data maturity를 지속강화할 수 있는 정보처리파이프라인을 주요 유방암 임상변수에 대해 개발하였다. 마지막으로 암 생존자의 사회적 건강결정요인에 대해 서울, 울산 지역의 분석을 traffic과 대기오염, 녹지의 간섭효과를 고려한 논문을 학회에서 발표하였고 현재 각각 SCIE논문으로 submission한 상태이다. 일 병원 레지스트리를 통한 유방암환자 모집단의 bias를 보완하기 위하여 보건의료 빅데이터결합사업에 지원하여 2024년 2월 현재 폐쇄망 환경에서 최종 데이터 검토단계를 거치고 있다. 궁극적으로 유방암 생존자의 생애주기를 이해하고 이에 따른 맞춤형 지지체계를 구체화하는데 기여할 수 있는 연구 방법론과 기초자료를 점진적으로 구축하는 연구 목표를 종합적이고 순차적으로 달성하였으며, 공공데이터를 활용한 도시별 사회적건강결정요인의 공간중심 결합 데이터셋의 공개와 논문 출판 과정에 있는 연구 성과들이 2025년까지 지속 창출될 것으로 기대된다. 이를 정량 성과로서 요약하면, 본 연구 과제의 현재까지 의 연구개발성과는 SCIE 출판 2건(full paper 1, abstract 1), SCOPUS 2건(abstract), 국제학회발표 5건, 국내학회발표 3건, submission/under review중인 SCIE 논문 4건이 있다.
□ 연구개발성과 활용계획 및 기대 효과
1) 연구개발성과의 활용계획
● RWD와 공간/집단역학간의 연계분석을 위한 정제된 데이터셋과 선도적 방법론 확보
● 기 구축되어있는 산재된 대규모 공공 데이터셋과 기관별 RWD의 재활용 및 활용 가치 극대화를 위한 효율적인 데이터 연계 방안 모색
● 유방암 생존자들의 건강 관리 계획을 위한 암 주기 모델링 및 예측 모델 개발
● 유방암이 미치는 사회경제적 영향을 공간적 차원에서 시각화
● 한국인의 문화적, 지역적, 사회적 특성을 고려한 사회적 건강 결정 요인을 연구하여 다양한 질병 관리 및 사회 보장 체계 설계에 재활용 가능한 공간 중심 데이터셋 확보
● 암, 당뇨와 같이 단일기전에 의한 질환이 아니라 여러 복합요소에 의한 복합질환군으로 예상되는 주요 질환의 역학적 특성에 대한 분석 플랫폼으로의 확장
2) 연구개발성과의 기대효과
● 유방암 생존자의 사회적 건강 결정 요인을 파악하여 생존 기간 연장 및 삶의 질 향상을 위한 암 전주기에 대한 이해 증진
● 유방암 생존자의 도시유형별 특성을 고려한 사회적 건강결정요인을 파악함으로써 도시계획 및 지역사회 특이적 건강관리전략 및 정책수립의 방향을 제시
● 유방암 생존자의 전주기, 특히 무병 기간에 영향을 미치는 요인 탐색을 통해 생존 기간 예측 및 건강 관리/사회 역할 적응을 위한 기초 자료 제공
● 유방암 환자를 위한 통합지지체계 구축을 통해 맞춤형 접근으로 암부담 감소에 기여
● 유방암 생존자의 전주기, 특히 무병기간에 영향을 주는 인자들을 탐색함으로써 보다 구체적으로 생존기간의 경험을 예측가능케 하고 건강관리/사회역할의 양립의 도전에 대비하는 기초자료를 제공
● 궁극적으로 유방암 환자의 통합지지체계 구축에 있어 암종간, 지역간 차이를 반영한 맞춤형 접근을 통해 국가사회 수준에서 인적, 경제적 암 부담의 감소에 기여
● 본 연구에서 도출된 방법론과 성과는 도시유형별 공통점에 따라 국제적 비교연구와 주거환경 연구 등으로 확장될 수 있음
(출처 : 요약문 2p)
목차 Contents
- 표지 ... 1
- 요약문 ... 2
- 목차 ... 6
- 1. 연구개발과제의 개요 ... 7
- 2. 연구개발과제의 수행 과정 및 수행 내용 ... 8
- A. 전방위적인 데이터셋의 탐색과 수집 ... 8
- B. 학제간 데이터연결을 위한 데이터모델링 ... 9
- C. 연계 분석을 위한 전처리 및 연구용 데이터플랫폼 구축 ... 9
- D. 유방암환자의 암전주기 이해를 위한 주요 임상변수를 포함한 RWD의 이차적 사용방법 고도화 ... 9
- E. 도시별 공간분석모델 생성 ... 10
- 3. 연구개발과제의 수행 결과 및 목표 달성 정도 ... 11
- 1) 연구수행 결과 ... 11
- 2) 목표 달성 수준 ... 12
- 4. 연구개발성과의 관련 분야에 대한 기여 정도 ... 12
- 5. 연구개발성과 및 활용 계획 ... 13
- 1) 연구성과 ... 13
- 2) 연구성과 활용계획 ... 15
- 6. 참고문헌 ... 15
- 끝페이지 ... 15
※ AI-Helper는 부적절한 답변을 할 수 있습니다.