보고서 정보
주관연구기관 |
국립암센터 National Cancer Center |
연구책임자 |
남병호
|
참여연구자 |
박소희
,
임현선
,
박정인
,
신혜림
,
임민경
,
박은철
,
정경해
,
노정실
,
김흥태
,
김주영
,
김영우
,
박중원
,
김형숙
,
이애경
,
이상이
,
한준태
,
황승식
|
보고서유형 | 최종보고서 |
발행국가 | 대한민국 |
언어 |
한국어
|
발행년월 | 2007-12 |
과제시작연도 |
2007 |
주관부처 |
보건복지부 |
사업 관리 기관 |
한국보건산업진흥원 Korea Health Industry Development Institute |
등록번호 |
TRKO201100007107 |
과제고유번호 |
1465008817 |
사업명 |
국립암센터연구소지원 |
DB 구축일자 |
2013-04-18
|
키워드 |
암 발생위험예측 통계모델.Cancer Risk Prediction Models.
|
초록
▼
◆ 연구내용 및 방법
1. 데이터 확보, 정리 및 분석 : 국민건강보험공단 자료, 중앙암등록본부 자료, 통계청 자료
-국민건강보험공단 자료
ㆍ1996년 공무원 및 교직원(공교) 건강검진자료(1차 검진, 문진)
ㆍ1996년~1997년 공교와 그 피부양자에 대한 건강검진자료(1차 검진, 문진)
-중앙암등록본부 자료 : 1988년~2004년까지
-통계청 자료 : 1996년~2004년까지
2. 모델 개발
-암 종별로 관계하는 위험요소들이 다르기 때문에 각 전문가들의 의견과 지금까지 발표된
-
◆ 연구내용 및 방법
1. 데이터 확보, 정리 및 분석 : 국민건강보험공단 자료, 중앙암등록본부 자료, 통계청 자료
-국민건강보험공단 자료
ㆍ1996년 공무원 및 교직원(공교) 건강검진자료(1차 검진, 문진)
ㆍ1996년~1997년 공교와 그 피부양자에 대한 건강검진자료(1차 검진, 문진)
-중앙암등록본부 자료 : 1988년~2004년까지
-통계청 자료 : 1996년~2004년까지
2. 모델 개발
-암 종별로 관계하는 위험요소들이 다르기 때문에 각 전문가들의 의견과 지금까지 발표된
-여러 모델들을 바탕으로 병인학적, 생물학적으로 타당하고 정확한 모델을 개발함
-남자는 위암, 폐암, 대장암, 여자는 유방암, 자궁암을 우선적으로 개발하되 먼저 모델개발을
-위하여 각 위험요소마다 상대적 위험도를 다양한 통계모델을 사용하여 측정
-개발된 암 위험예측 모델들의 평가 후 가장 적합한 모델 선택
3. 사용할 통계 모델
-Cox proportional hazard model을 비롯한 비모수적, 모수적 통계모델
4. 모델 개발 방법
-다양한 모델들을 개발한 후 가장 적합한 모델을 선택
5. 모델 개발 순서
-First step
보험공단자료의 검토, cleaning, code화 작업
-Second step
모델개발에 사용되어질 자료의 구성, 암종 별 위험요소들의 정의
문헌고찰을 통한 암종 별 위험요소들을 정리, 사용된 위험요소들의 characteristics 구분
- Third step
Cox proportional hazard model을 이용한 단변량 분석
-Fourth step : Model Validation
Model Validation Criteria : Discrimination and Calibration
ㆍDiscrimination
-개발된 모델들이 실질적으로 고 위험군의 사람들에게 저 위험군의 사람들에 비해서 얼마만큼 정확하게 더 높은 암 발생 위험률을 제시하는가를 측정
-측정방법 : C statistics - area under the ROC curve
ㆍCalibration
-개발된 모델들이 실제의 암발생률에 비해서 얼마만큼 정확하게 발생위험을 예측하는가를 측정
-측정방법 : Hosmer-Lemeshow type chi-square statistics
ㆍInternal Validation
-data splitting : 70% development set, 30% validation set
-cross-validation : repeated data splitting
(samples leaving out 10000 observations each run, repeat 200 times, average results)
-Bootstrapping : large number of samples with replacement from original sample, estimate generalization error based on resampling.
ㆍ External Validation
-개발된 모델의 일반화를 위한 adjustment를 수행한 후에 국립암센터의 지역코호트자료 등 다른 인구에 적용하여, 개발된 모델의 예측능력을 평가함
Abstract
▼
The purpose of this project was to develop cancer risk prediction models for major solid
tumors (men: lung, stomach, colo-rectal, liver, women: stomach, breast, lung, liver, colo-rectal,
cervical). Various statistical models including the Cox proportional Hazard model were used.
We evaluate
The purpose of this project was to develop cancer risk prediction models for major solid
tumors (men: lung, stomach, colo-rectal, liver, women: stomach, breast, lung, liver, colo-rectal,
cervical). Various statistical models including the Cox proportional Hazard model were used.
We evaluated the models' performance with respect to the discrimination and the calibration
ability. C-statistic(ROC curve) was used for the discrimination and Hosmer-Lameshow type
chi-square was used for the calibration. Once we develop and evaluate the models, we will
develop a web-based service program so that people are able to know their risk of developing
cancer provided their information about the risk factors. Through this system, people can not
only know their risk level of developing cancers, but also how much the risk can be reduced
by changing the health status and modifying their life style. We will continue to study about
the possible risk factors of these solid tumor and incorporate those into the prediction models.
The data that was used for this project came from three different sources: The Korean Central
Cancer Registry (KCCR), The Korean Statistical Office, and the National Health Insurance
Corporation Study (NHICS). The physical examinations and the life-style questionnaires
measured in 1996-97 from the NHICS was the baseline data. Cancer Incidence information
upto 2004 came from the KCCR. and the death statistics upto 2004 came from the Korean
Statistical Office. The first step of this project was to generate a clean data set by merging
the three different data set. At the same time, we performed thorough literature review and
gathered risk factors for each cancer. Expert working groups for each cancer site was
organized and possible risk factors were selected from the data that we generated. In
developing the models, we split the data into two parts: a development and validation data set.
We developed the models from the development set and measured their performance in the
validation set. For Breast cancer, two separate models(<50 year, >=50year) were developed.
Age, height, age at the first menarche, menopausal status, age at first live birth were
identified as the major risk factors. The discrimination ability was reasonably high and the
calibration ability was very high. Lung and Stomach cancer models for men were also
developed. Smoking variables(smoking status, amount of smoking) were the major risk factors
for lung cancer. Smoking, Irregular eating habit, and alcohol intake were the major risk
factors for stomach cancer in men. The discrimination and calibration ability for both cancers
were very high.
목차 Contents
- 표지...1
- 제출문...3
- 목차...4
- 요약문...9
- Project Summary...11
- 1. 연구사업의 최종목표...12
- 2. 연구사업의 내용 및 결과...12
- 2.1 국내외에 발표된 암위험예측모델에 관한 문헌을 고찰 및 정리...12
- 2.2 암발생 위험지표 개발을 위한 전문가회의(cancer risk index working group)...16
- 2.3 각 암종별 위험요인 정리...18
- 2.4 연구 결과...25
- 2.4.1 암 발생여부에 따른 각 암종별 위험요인의 descriptive statistics...25
- ○ 연구자료의 검토 및 정리...25
- ○ 각 암종별 위험요인의 분석 결과...26
- 2.4.2 Nested age-matched Case-Control study의 오즈비(Odds Ratio)...30
- ○ Nested age-matched Case-Control study design...30
- ○ 연구자료의 검토 및 정리...30
- ○ 각 암종별 위험요인 분석...37
- A. 오즈비 결과 - 첨부9 자료 참조...38
- B. 각 암종별 결과 요약...50
- 2.4.3 Cohort Study의 단변량, 다중분석 및 모형 적합...52
- ○ 연구자료의 검토 및 정리...52
- ○ Cohort study design...53
- ○ 각 암종별 위험요인의 분석 결과 및 해석...54
- A. 1996년 공무원, 교직원 및 부양가족...54
- 여자 유방암 - 50세 미만...54
- 여자 유방암 - 50세 이상...60
- 여자 유방암 - 폐경 전...66
- 여자 유방암 - 폐경 후...72
- 남자 폐암...78
- 남자 위암...87
- B. 1996~1997년 공무원, 교직원 및 일반 전체...93
- 여자 유방암 - 50세 미만...93
- 여자 유방암 - 50세 이상...99
- 남자 폐암...105
- 남자 위암...114
- C. 각 암종별 결과 요약...120
- 3. 연구결과 고찰 및 결론...124
- 4. 연구성과 및 목표달성도...126
- (1) 연구성과...126
- (2) 목표달성도...127
- 5. 연구결과의 활용계획...129
- 6. 참고문헌...130
- 7. 첨부서류...136
- 첨부 1. 연구계획서 요약...137
- 첨부 2. 국민건강보험공단 1996년 검진자료 layout...138
- 첨부 3. Harvard 암예방센터에서 2000년 발표한 암발생위험요소 정리...142
- 첨부 4. (Harvard Report on Cancer Prevention: Harvard Cancer Risk Index,2000)...144
- 첨부 5. Harvard에서 제공하는 인터넷 웹페이지 암발생 위험 산출 - 폐암...148
- 첨부 6. 유방암 워크샵 회의 자료...162
- 첨부 7. 폐암 워크샵 회의 자료...190
- 첨부 8. 암 발생여부에 따른 각 암종별 위험요소의 descriptive statistics...205
- 첨부 9. 각 암종별 위험요소 및 문진 항목의 도수분포표, 오즈비, 그래프...244
- 첨부 10. 세계유방암학회(Global Breast Cancer Conference 2007) 포스터...307
- 첨부 11. 대한예방의학회 구연발표 초록...308
※ AI-Helper는 부적절한 답변을 할 수 있습니다.