[논문]후향적연구의 집단 간 동등성확보를 통한 임상자료분석

곽상규; 신임희

doi:10.7465/jkdi.2015.26.6.1317

[국내논문] 후향적연구의 집단 간 동등성확보를 통한 임상자료분석
Clinical data analysis in retrospective study through equality adjustment between groups 원문보기

Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지, v.26 no.6, 2015년, pp.1317 - 1325

곽상규 (대구가톨릭대학교 의과대학 의학통계학교실) , 신임희 (대구가톨릭대학교 의과대학 의학통계학교실)

초록
AI-Helper

두 집단간을 비교하는 다양한 임상연구에서 수집된 데이터를 분석할 때 질환에 미치는 영향을 알아보는 방법으로는 현 시점에서 어떤 특정 질환을 일으킬 수 있는 위험요인포함 우, 무에 띠라 연구대상자를 나누어, 추적 관찰하는 전향적 임상연구에서의 분석과 현 시점에서 질환 유, 무에 따라 위험요인을 과거의 연구대상자의 관찰기록을 바탕으로 확인하는 후향적 임상연구에서의 분석이 있다. 접근 방법과 연구 설계는 다르지만 두 가지 연구의 목적은 두 집단 간 명확한 차이를 확인하는데 있으며, 나아가 두집단의 분류에 영향을 주는 변수가 무엇인지를 알아보는 방법이다. 특히 임상연구에서 두 집단을 비교할 때 성별과 나이와 같은 기본적 특성변수의 영향을 통제한 상태에서 임상적 변수들의 집단 간 차이와 영향을 살펴보아야 한다. 하지만 후향적 연구에서는 과거의 관찰기록을 바탕으로 분석이 진행되는 연구이므로 연구대상자를 두 집단으로 무작위 할당하지 못했기 때문에 기본적인 특성변수들이 차이가 나는 경우가 빈번하게 발생할 수 있다. 이를 해결하기 위하여 임상자료를 분석하는 방법으로 공변량을 사용한다. 대표적으로 공변량을 사용하는 분석방법으로는 공분산분석, 수정회귀모형, propensity score matching 방법 등이 있다. 본 연구는 후향적 임상연구에서 공변량을 이용한 자료 분석 방법 및 propensity score matching 방법을 소개하고, 실제 위암 환자들의 재발관련 자료에 적용하여, 그 필요성을 확인한다.

Abstract ▼ AI-Helper

There are two types of clinical research to figure out risk factor for disease using collected data. One is prospective study to approach the subjects from the present time and the other is retrospective study to find the risk factor using the subject's information in the past. Both approached and study design are different but the purpose of the two studies is to identify a significant difference between two groups and to find out what the variables to influence groups. Especially when comparing the two groups in clinical research, we have to look at the difference between the impact clinical variables by group while controlling the influence of the baseline characteristics variables such as age and sex. However, in the retrospective study, the difference of baseline characteristic variables can occur more frequently because the past records did not randomly assign subjects into two groups. In clinical data analysis use covariates to solve this problem. Typically, the analysis method using the analysis of covariance of variance, adjusted model, and propensity score matching method. This study is introduce the way of equality adjustment between groups data analysis using covariates in retrospective clinical studies and apply it to the recurrence of gastric cancer data.

주제어

AI 본문요약
AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

우선적으로, 원자료를 이용하여 단변량 분석과 다변량 분석을 실시하였고, 공변량을 적용한 수정모형과의 비교를 통하여 공변량의 효과를 조정한 결과를 살펴볼 수 있었다. 또한 propensity score matching을 통한 방법을 적용하여 공변량의 효과를 제어한 상태에서 다른 변수들의 반응변수에 어떤 영향을 미치는지도 파악해 보았다.
후향적 임상연구에서 공변량을 이용한 자료 분석 방법 소개하고 또한 실제 위암환자 임상 자료에 적용해 보았다. 우선적으로, 원자료를 이용하여 단변량 분석과 다변량 분석을 실시하였고, 공변량을 적용한 수정모형과의 비교를 통하여 공변량의 효과를 조정한 결과를 살펴볼 수 있었다.

가설 설정

수정 모형은 회귀모형이나 로지스틱 회귀모형 등과 같이 반응변수에 영향을 주는 설명변수들을 분석할 때 공변량을 함께 설명변수로 설정함으로써 공변량이 다른 변수들의 영향을 조정해주는 분석방법이다. 가령 이분형 로지스틱 회귀분석에서 설명변수의 수가 p개 인 다음의 다중 이분형 로지스틱 회귀모형을 가정하여 보자.
먼저 A명의 시험군과 B명의 대조군으로 임상시험이 이루어 졌고 이때 A < B라고 가정해보자.

제안 방법

본 자료에 대한 임상연구는 각 병원의 연구윤리심의위원회 (IRB)의 승인을 받아 진행되었으며 본 병원의 승인번호는 DCMC-CR-13-011이다. 예제 자료를 이용하여 위암 수술 환자들의 재발에 미치는 위험요인을 살펴보았으며 이때 공변량으로 고려할 변수는 나이, 성별, 종양 위치이다. 또한 총 406명 중 11명에서 위암 수술 후 재발이 있었으며 전체에서 2.
후향적 임상연구에서 공변량을 이용한 자료 분석 방법 소개하고 또한 실제 위암환자 임상 자료에 적용해 보았다. 우선적으로, 원자료를 이용하여 단변량 분석과 다변량 분석을 실시하였고, 공변량을 적용한 수정모형과의 비교를 통하여 공변량의 효과를 조정한 결과를 살펴볼 수 있었다. 또한 propensity score matching을 통한 방법을 적용하여 공변량의 효과를 제어한 상태에서 다른 변수들의 반응변수에 어떤 영향을 미치는지도 파악해 보았다.
이에 따라 재발 유무에 따른 연구대상자 수의 비율은 1:3로 하였으며 propensity score matching에 사용된 초기값은 34567을 사용하였으며 나이, 성별, 종양의 위치를 공변량으로 고려하였다. 이에 따라 공변량이 주어졌을 때 각 그룹에 속할 조건부 확률 값 propensity score를 산출하였고 두 propensity score의 차이 값의 절대값이 0.2보다 적을 경우로 짝짓기하여 새로운 자료를 구성하였다. 그 결과 Figure 3.
이에 본 연구는 2절에서 후향적 임상연구로 확보된 데이터를 분석하는 방법으로 공변량을 사용하여 분석하는 수정회귀 모형과 propensity score matching 방법을 중심으로 소개한다. 그리고 3절에서는 실제 위암 환자에서 재발에 관한 임상데이터를 예제로 들어 2절에서 소개한 방법을 적용하여 보고, 4절에서 후향적 임상연구에서 집단간 동등성 확보의 필요성을 확인하여, 결론으로 맺고자 한다.
예제 자료로는 대구가톨릭대학교병원, 경북대학교병원, 계명대학교병원, 영남대학교병원의 4개 대학 병원에서 1998년 3월부터 2012년 3월까지 지난 13년간 수집된 위암 수술환자 중 면역조직학 검사에서 CD117, CD34가 모두 양성인 406명의 자료를 사용하였다. 자료는 후향적 접근방법으로 나이, 성별, 종양의 위치 (tumor location), 종양의 크기 (tumor size), 유사 분열 수 (mitotic count), 미국 국립보건원 분류 (NIH), AJCC (American Joint Committee on Cancer) 7번째 분류, 추적관찰기간 (follow up period), 병리학적 검사결과 (Histopathologic classification), 세포 수 (cellularity), 점막 침입 유무 (mucosal invasion), 재발유무 (recurrence)의 변수를 수집하였다. 본 자료에 대한 임상연구는 각 병원의 연구윤리심의위원회 (IRB)의 승인을 받아 진행되었으며 본 병원의 승인번호는 DCMC-CR-13-011이다.

대상 데이터

2보다 적을 경우로 짝짓기하여 새로운 자료를 구성하였다. 그 결과 Figure 3.1과 같이 새롭게 짝지은 자료로 재발 한 그룹에서 11명, 재발 안한 그룹에서 33명으로 선택되었다.
예제 자료로는 대구가톨릭대학교병원, 경북대학교병원, 계명대학교병원, 영남대학교병원의 4개 대학 병원에서 1998년 3월부터 2012년 3월까지 지난 13년간 수집된 위암 수술환자 중 면역조직학 검사에서 CD117, CD34가 모두 양성인 406명의 자료를 사용하였다. 자료는 후향적 접근방법으로 나이, 성별, 종양의 위치 (tumor location), 종양의 크기 (tumor size), 유사 분열 수 (mitotic count), 미국 국립보건원 분류 (NIH), AJCC (American Joint Committee on Cancer) 7번째 분류, 추적관찰기간 (follow up period), 병리학적 검사결과 (Histopathologic classification), 세포 수 (cellularity), 점막 침입 유무 (mucosal invasion), 재발유무 (recurrence)의 변수를 수집하였다.
다음으로 공변량을 사용하여 propensity score matching 방법을 사용하였다. 원자료에서 재발을 한 연구대상자 수가 11명이고 재발을 하지 않은 연구대상자 수가 395명으로 크게 차이가 나므로 재발 유무에 따른 두 그룹의 연구대상자수 비율은 새롭게 짝지은 자료에서 연구대상자 수를 전체 자료인 406명에서 10% 정도를 선택하기 위해 총 연구대상자 수를 44명으로 선정하였다. 이에 따라 재발 유무에 따른 연구대상자 수의 비율은 1:3로 하였으며 propensity score matching에 사용된 초기값은 34567을 사용하였으며 나이, 성별, 종양의 위치를 공변량으로 고려하였다.

데이터처리

우선 원자료에서 위암 재발 유무에 따라 차이가 나는 변수들을 살펴보기 위해 카이제곱검정, 두 집단 평균 차이 검정을 이용하여 단변량 분석 (univariate analysis)을 실시한 결과는 Table 3.1과 같다. 기본적 특성변수인 나이, 성별, 종양의 위치 중 나이에 따라 재발유무 그룹 간 이질한 것으로 나타났다.

이론/모형

다음으로 공변량을 사용하여 propensity score matching 방법을 사용하였다. 원자료에서 재발을 한 연구대상자 수가 11명이고 재발을 하지 않은 연구대상자 수가 395명으로 크게 차이가 나므로 재발 유무에 따른 두 그룹의 연구대상자수 비율은 새롭게 짝지은 자료에서 연구대상자 수를 전체 자료인 406명에서 10% 정도를 선택하기 위해 총 연구대상자 수를 44명으로 선정하였다.

성능/효과

3과 같다. 공변량으로 고려한 나이, 성별, 종양의 위치는 p-value가 1.000으로 재발유무에 따라 차이가 나지 않는 것을 확인할 수 있었다. 종양의 크기, 유사 분열 수, 미국 국립보건원 분류, 점막 침입 유무 변수가 재발유무에 따라 통계학적으로 유의한 차이가 나는 것으로 나타났다.
1과 같다. 기본적 특성변수인 나이, 성별, 종양의 위치 중 나이에 따라 재발유무 그룹 간 이질한 것으로 나타났다. 또한 종양의 크기, 유사 분열 수, 미국 국립보건원 분류, 세포 수, 점막 침입 유무는 재발 유무에 따라 통계학적으로 유의한 차이가 나는 것으로 나타났고 AJCC 7번째 분류, 추적관찰기간, 병리학적 검사결과는 재발 유무에 따라 통계학적으로 유의한 차이가 나지 않는 것으로 나타났다.
2에서 (b)와 같다. 나이, 성별, 종양의 위치를 공변량으로 고려한 분석 결과 유사 분열 수, 점막 침입 유무의 변수가 유의한 것으로 나타났으며 이 결과는 나이, 성별, 종양의 위치가 암환자의 재발 유무에 영향 주는 효과를 조정한 결과이다.
2에서 (a)와 같다. 다변량 분석 (multivariate analysis)결과 유사 분열 수, 세포 수, 점막 침입 유무의 변수가 유의한 것으로 나타났으나 이는 공변량으로 고려하여야 할 나이, 성별, 종양의 위치 변수가 재발 유무에 영향을 주는 효과를 전혀 고려하지 않은 결과이다. 따라서 다변량 분석으로 사용한 이분형 로지스틱 회귀모형에 공변량을 설명변수로 추가하여 공변량의 효과를 조정한 결과를 분석 하였으며 그 결과는 Table 3.
4와 같다. 다변량 분석결과 위암 수술 후 재발에 영향을 미치는 요인으로 종양크기 (cm)의 오즈비가 1.360, 오즈비의 95% 신뢰구간은 (1.018, 1.817)로 나타났으며 통계적으로 유의하였다 (p-value=0.037). 또한 유사분열 수의 오즈비가 0.
기본적 특성변수인 나이, 성별, 종양의 위치 중 나이에 따라 재발유무 그룹 간 이질한 것으로 나타났다. 또한 종양의 크기, 유사 분열 수, 미국 국립보건원 분류, 세포 수, 점막 침입 유무는 재발 유무에 따라 통계학적으로 유의한 차이가 나는 것으로 나타났고 AJCC 7번째 분류, 추적관찰기간, 병리학적 검사결과는 재발 유무에 따라 통계학적으로 유의한 차이가 나지 않는 것으로 나타났다.
000으로 재발유무에 따라 차이가 나지 않는 것을 확인할 수 있었다. 종양의 크기, 유사 분열 수, 미국 국립보건원 분류, 점막 침입 유무 변수가 재발유무에 따라 통계학적으로 유의한 차이가 나는 것으로 나타났다.

후속연구

임상연구에서는 연구대상자가 사람이므로, 자료를 수집하는데 비용과 시간이 많이 들지만, 공변량을 사용한 자료 분석인 경우 어느 정도의 자료는 탈락할 수 밖에 없으므로, 표본수의 고려도 동시에 이루어 져야 한다. 그러므로, 앞으로도 많이 이루어질 후향적 임상연구에 따른 통계적 분석 방법 또한 다양하게 적용되어 신뢰성 있는 분석결과를 바탕으로, 바람직한 임상해석에 기여하기를 기대한다.

질의응답

핵심어	질문	논문에서 추출한 답변
	후향적 연구의 한계는?	특히 임상연구에서 두 집단을 비교할 때 성별과 나이와 같은 기본적 특성변수의 영향을 통제한 상태에서 임상적 변수들의 집단 간 차이와 영향을 살펴보아야 한다. 하지만 후향적 연구에서는 과거의 관찰기록을 바탕으로 분석이 진행되는 연구이므로 연구대상자를 두 집단으로 무작위 할당하지 못했기 때문에 기본적인 특성변수들이 차이가 나는 경우가 빈번하게 발생할 수 있다. 이를 해결하기 위하여 임상자료를 분석하는 방법으로 공변량을 사용한다.
	후향적 임상연구에서의 분석이란?	두 집단간을 비교하는 다양한 임상연구에서 수집된 데이터를 분석할 때 질환에 미치는 영향을 알아보는 방법으로는 현 시점에서 어떤 특정 질환을 일으킬 수 있는 위험요인포함 우, 무에 띠라 연구대상자를 나누어, 추적 관찰하는 전향적 임상연구에서의 분석과 현 시점에서 질환 유, 무에 따라 위험요인을 과거의 연구대상자의 관찰기록을 바탕으로 확인하는 후향적 임상연구에서의 분석이 있다. 접근 방법과 연구 설계는 다르지만 두 가지 연구의 목적은 두 집단 간 명확한 차이를 확인하는데 있으며, 나아가 두집단의 분류에 영향을 주는 변수가 무엇인지를 알아보는 방법이다.
	후향적 연구의 한계 극복을 위한 방법은?	하지만 후향적 연구에서는 과거의 관찰기록을 바탕으로 분석이 진행되는 연구이므로 연구대상자를 두 집단으로 무작위 할당하지 못했기 때문에 기본적인 특성변수들이 차이가 나는 경우가 빈번하게 발생할 수 있다. 이를 해결하기 위하여 임상자료를 분석하는 방법으로 공변량을 사용한다. 대표적으로 공변량을 사용하는 분석방법으로는 공분산분석, 수정회귀모형, propensity score matching 방법 등이 있다.

참고문헌 (7)

D'agostino. R. B. (1998). Tutorial in biostatistics propensity score methods for bias reduction in the comparison of a treatment to a non-randomized control group. Statistical Medicine, 17, 2265-2281.
Dehejia, R. H. and Sadek, W. (1999). Causal effects in nonexperimental studies: Reevaluating the evaluation of training programs. Journal of American Statistic Association, 94, 1053-1062.

상세보기
Han G. H., Chung J. and Yoo J. K. (2014). A study on prediction for attendances of Korean probaseball games using covariates.Journal of the Korean Data & Information Science Society, 25, 1481-1489.

원문보기 상세보기
Kang K. J. and Lee J. H. (2010). Characteristics of Gastric Cancer in Korea - with an Emphasis on the Increase of the Early Gastric Cancer (EGC). Journal of Korean Medical Association, 53, 283-289.

상세보기
Park H. C. and Park J. P. (1998). Joint modeling of daeth times and counts considering a marginal frailty model. Journal of the Korean Data & Information Science Society, 9, 311-322.
Park J. (2015). Performance study of propensity score methods against regression with covariate adjustment. Journal of the Korean Data & Information Science Society, 26, 217-227.

원문보기 상세보기
Rosenbaum, P. R. and Rubin, D. B. (1983). The central role of the propensity score in observational studies for causal effects. Biometrika, 70, 41-55.

상세보기

저자의 다른 논문 :

표제어: PCR

동의어: Packet Collision Rate

용어 설명 출처 목록 (6)

용어 설명: PCR은 세균 특이성이 있는 primer를 이용하여 적은 수의 세균이 있을지라도 쉽게 검출할 수 있는 유용한 방법이며, 이를 이용하여 구강 내 치면세균막이나 타액에서 직접 세균을 검출할 수 있게 되었다[8].

내보내기 구분	파일저장 인쇄 메일전송
구성항목	기본정보 상세정보 관리번호, 논문명, 저널/프로시딩명, 저자 , 발행년, 권, 호, 시작페이지, 끝페이지, 발행기관 관리번호, 논문명, 대등논문명, 저자 , 저널/프로시딩명, 발행기관, 발행년, 발행언어, 권, 호, 시작페이지, 끝페이지, ISBN, ISSN, 주제분야, 키워드, 초록(한글), 초록(영문), 저자(소속기관)
저장형식	Text(ASCII format) Excel format RefWorks Direct Export RIS format (for Reference Manager, ProCite, EndNote), Scholar's Aids, Mendeley
메일정보	받는사람 (필수) @ 보내는사람 (선택) @ 제목 내용 KISTI 검색결과 이메일 서비스
안내	총 건의 자료가 검색되었습니다. 다운받으실 자료의 인덱스를 입력하세요. (1-10,000) 검색결과의 순서대로 최대 10,000건 까지 다운로드가 가능합니다. 데이타가 많을 경우 속도가 느려질 수 있습니다.(최대 2~3분 소요) 다운로드 파일은 UTF-8 형태로 저장됩니다. 파일의 내용이 제대로 보이지 않을실 때는 웹브라우저 상단의 보기 -> 인코딩 -> 자동선택 여부를 확인하십시오. ~ Text(ASCII format) Excel format

연합인증