본 연구에서는 직장암 환자들의 수술 후 재발까지의 시간 데이터에 대해 집단 간 생존함수 양상에 차이가 있는지 로그 순위 검정 결과 유의수준 10%에서 포도당 단일수송체 (GLUT1)의 수준, 수술 전 병기 (cstage), 수술 후 병기 (ypstage)에 따른 차이가 유의하며, Cox 비례위험률 모형을 이용하여 검정한 결과 가장 유의한 공변량은 포도당 단일수송체와 수술 후 병기였다. 지수분포를 따른다고 가정할 경우, 우도함수를 기반한 여러 가지 위험률 변화점을 추정하였다.
본 연구에서는 직장암 환자들의 수술 후 재발까지의 시간 데이터에 대해 집단 간 생존함수 양상에 차이가 있는지 로그 순위 검정 결과 유의수준 10%에서 포도당 단일수송체 (GLUT1)의 수준, 수술 전 병기 (cstage), 수술 후 병기 (ypstage)에 따른 차이가 유의하며, Cox 비례위험률 모형을 이용하여 검정한 결과 가장 유의한 공변량은 포도당 단일수송체와 수술 후 병기였다. 지수분포를 따른다고 가정할 경우, 우도함수를 기반한 여러 가지 위험률 변화점을 추정하였다.
In this research, we fit various survival models and conduct tests and estimation for the hazard change-point with the rectal cancer data. By the log-rank tests, at significance level ${\alpha}=0.10$, survival functions are significantly different according to the uniporter of glucose (GL...
In this research, we fit various survival models and conduct tests and estimation for the hazard change-point with the rectal cancer data. By the log-rank tests, at significance level ${\alpha}=0.10$, survival functions are significantly different according to the uniporter of glucose (GLUT1), clinical stage (cstage) and pathologic stage (ypstage). From the Cox proportional hazard model, the most significant covariates are GLUT1 and ypstage. Assuming that the rectal cancer data follows the exponential distribution, we estimate one hazard change-point using Matthews and Farewell (1982), Henderson (1990) and Loader (1991) methods.
In this research, we fit various survival models and conduct tests and estimation for the hazard change-point with the rectal cancer data. By the log-rank tests, at significance level ${\alpha}=0.10$, survival functions are significantly different according to the uniporter of glucose (GLUT1), clinical stage (cstage) and pathologic stage (ypstage). From the Cox proportional hazard model, the most significant covariates are GLUT1 and ypstage. Assuming that the rectal cancer data follows the exponential distribution, we estimate one hazard change-point using Matthews and Farewell (1982), Henderson (1990) and Loader (1991) methods.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
Matthews 등 (1982)과 Henderson (1990)은 우도함수에 근거한 변화 검정법을 제안하였으며 본 논문의 데이터에 대해 변화검정을 하고자한다. 두 방법 모두 관측데이터에 대한 방법이므로 직장암 데이터에 대해 절단성을 고려하지 않은 경우와 고려한 경우에 대해 각각 적용해 보고자한다.
본 연구에서는 수술 후 부터 재발까지의 시간인 무재발 생존시간 (recurrence free survival; RFS) 변수를 생존시간으로 사용하여 직장암 데이터에 대한 분석을 하고자 한다. 본 연구의 분석에서는 통계 시스템 R을 사용하였으며 패키지로는 survival과 ISwR을 사용하였다.
본 연구에서는 직장암 (rectal cancer) 생존시간 데이터에 대한 생존분석과 위험률의 변화존재 여부에 대한 검정을 하고자한다. 2절에서는 분석에 사용하는 직장암 생존데이터를 소개하고 3절에서는 직장암 데이터에 대해 여러 가지 생존분석모형을 적합하고 집단 간 생존함수 양상에 차이가 있는지 로그 순위 검정을 한다.
생존데이터에 대해 위험률에 변화가 존재하는지 검정해 보고자한다. 생존데이터 T1, · · · , Tn는 서로 독립이며 지수분포를 따른다고 가정한다.
모형이 만족스럽다면 잔차의 움직임에서도 나타나게 되므로 잔차 그림을 통해 잔차에 대한 검토가 필요하다. 생존분석에서 여러 종류의 잔차가 제안되었으나 여기서는 마팅게일 잔차를 데이터분석에 활용하고자한다.
Loader (1991)는 위험률 변화점에 대한 우도비 과정에 기반하여 변화 여부에 대한 검정통계량을 제안하였다. 임의 중도절단 (random censoring) 이 있는 경우에도 확장하여 사용할 수 있도록 유의수준 조절에 대해 언급하였다.
가설 설정
H0 : 비례위험률 모형에서 공변량에 대한 회귀계수가 모두 0이다. 대 H1 : not H0.
H0 : 위험률의 변화가 없다. 대 H1 : 위험률의 변화가 있다.
생존데이터 T1, · · · , Tn는 서로 독립이며 지수분포를 따른다고 가정한다. RFS에 대해 (t, -logS(t)) 그림을 그려본 결과 어느 순간까지 지수분포를 크게 벗어나지 않아 보이므로 지수분포를 가정한 위험률 변화점 추정을 하고자 한다.
: 위험률의 변화가 없다. 대 H1 : 위험률의 변화가 있다.
Zik가 한 단위 증가할 때마다 exp(βk) 만큼 위험률이 증가하게 된다. 비례위험 회귀모형을 가정하고 공변량을 다르게 고려하여 모형을 적합하였다. 모형적합도 검정의 귀무가설과 대립가설은 다음과 같다.
재발시간이 지수분포를 따른다는 가정 하에, 위험률 변화가 존재하는지 검정한 결과 변화점 존재가 유의하였다. 그러므로 변화점 추정 문제가 대두되어 한 개 변화점을 추정하였다.
제안 방법
생존함수 또는 위험률함수에 변화가 존재할 경우는 변화점에 따라 다르게 추정해야하는 문제가 대두된다. Matthews 등 (1982)과 Henderson (1990)은 우도함수에 근거한 변화 검정법을 제안하였으며 본 논문의 데이터에 대해 변화검정을 하고자한다. 두 방법 모두 관측데이터에 대한 방법이므로 직장암 데이터에 대해 절단성을 고려하지 않은 경우와 고려한 경우에 대해 각각 적용해 보고자한다.
재발시간이 지수분포를 따른다는 가정 하에, 위험률 변화가 존재하는지 검정한 결과 변화점 존재가 유의하였다. 그러므로 변화점 추정 문제가 대두되어 한 개 변화점을 추정하였다. Matthews and Farewell (1982) 방법으로는 35개월, Henderson (1990)과 Loader (1991) 방법에 의해서는 19개월로 같은 변화점을 추정했다.
그 결과 Cox 모형에서 GLUT1 단백질 수준과 당단백을 유의한 공변량으로 포함한 모형이 가장 적절하다고 여겨진다. 또한 65세 이상/이하 (Age 65)를 층화변수로 고려하여 Cox 층화 비례위험률 모형을 적합하였고 이러한 변수를 공변량으로 간주했을 때의 모형과 비교하였다. 두 경우 모두 GLUT1 단백질 수준과 당단백이 유의하다는 결과는 같았다.
직장암 환자들의 수술 후 재발까지의 시간에 대해 생존함수를 추정하기 위해 비모수적 Kaplan-Meier 방법, 그룹별 생존함수차이에 대한 로그 순위 검정, 준모수적 Cox 비례위험률 모형 등을 적합하였다. 또한 우도함수를 활용하여 위험률의 변화존재 여부에 대한 검정과 추정을 수행하였다.
본 연구에서는 수술 후 부터 재발까지의 시간인 무재발 생존시간 (recurrence free survival; RFS) 변수를 생존시간으로 사용하여 직장암 데이터에 대한 분석을 하고자 한다. 본 연구의 분석에서는 통계 시스템 R을 사용하였으며 패키지로는 survival과 ISwR을 사용하였다.
Cox 비례위험률 모형은 로지스틱 회귀 분석을 이용하여 중도절단 데이터를 처리하는 생존분석법으로 로지스틱 회귀 분석과 생존율의 개념을 혼합한 형태이다. 성별, 분석당시의 나이 등 생존율에 영향을 주는 많은 인자들을 반영하여 회귀분석을 시행하고 이들의 생존시간에 대한 영향력을 검정한다.
초기인 1기 직장암은 수술로 치료를 하고 전이가 있는 4기 직장암은 항암치료를 시행하고 보조적 치료로 방사선 치료를 한다. 직장암 2기와 3기의 진행 직장암은 항암방사선 치료를 6주간 시행 후 수술을 시행하고 그 후 보조 항암치료를 시행한다. 이런 과정으로 치료해도 5년 내에 20∼30% 재발 하는 경과를 보인다.
Matthews와 Farewell (1982)과 Henderson (1990) 검정은 중도절단자료를 고려하지 않은 검정법이다. 직장암 데이터는 우중도절단 데이터를 포함하나 본 논문에서는 관측값으로 간주하여 검정하였다. Loader (1991) 검정은 중도절단자료를 포함하므로 같이 비교하기 위하여 우중도절단인 경우를 관측값으로 간주하고 검정을 실시하였다.
직장암 데이터에 대해 위험률 변화 검정을 하였다. 한 개 변화점 추정은 중도절단된 자료를 제외한 관측된 자료만 포함하여 계산하였다.
직장암 데이터에 대해 지수분포를 가정하고 우도함수를 기반하여 위험률 변화에 대한 검정을 하고자 한다. Matthews와 Farewell (1982)과 Henderson (1990) 검정은 중도절단자료를 고려하지 않은 검정법이다.
직장암 환자들의 수술 후 재발까지의 시간에 대해 생존함수를 추정하기 위해 비모수적 Kaplan-Meier 방법, 그룹별 생존함수차이에 대한 로그 순위 검정, 준모수적 Cox 비례위험률 모형 등을 적합하였다. 또한 우도함수를 활용하여 위험률의 변화존재 여부에 대한 검정과 추정을 수행하였다.
생존율은 어떤 질병에 걸린 환자가 해마다 어느 정도 생존하고 있는지에 대한 비율이다. 환자들에게 각각 적용한 여러 가지 치료 방법에 의해 생존율에 차이가 있는지 알고자 생존분석을 수행한다. 환자들마다 병의 위중 등에 차이가 있으므로 이런 차이를 통제한 상태에서 이 질병의 사망 유무와 생존기간에 영향을 미치는 요인에 대하여 비교 조사할 목적으로 Cox 비례위험률 모형을 활용한 통계분석을 선호하기도 한다.
대상 데이터
본 연구에 쓰인 직장암 데이터는 2005년과 2008년 사이에 한국 수원에 위치한 성 빈센트 병원에서 신 보조 화학방사선요법과 복강경 수술을 겪은 104명의 직장암 환자에 대해 조사한 것이다. 104명의 환자는 남자 71명, 여자 33명으로 구성된다. 직장암 2기와 3기의 환자들이 각각 50%씩 차지하며 환자들의 기록, 방사선 발견, 수술 후의 병리학적 슬라이드들이 검토되었다.
본 연구에 쓰인 직장암 데이터는 2005년과 2008년 사이에 한국 수원에 위치한 성 빈센트 병원에서 신 보조 화학방사선요법과 복강경 수술을 겪은 104명의 직장암 환자에 대해 조사한 것이다. 104명의 환자는 남자 71명, 여자 33명으로 구성된다.
이론/모형
직장암과 관련된 공변량을 고려한 생존함수를 구하기 위해 Cox 비례위험률 모형을 이용한다. 비례위험 회귀모형은
성능/효과
Cox 비례위험률 모형에서 수술 전 병기, 수술 후 병기, 단계감소, GLUT1, LDH5, PDK1과 HIF-1α, 당단백, 나이, 성별 등 공변량의 조합을 다양하게 고려하여 여러 가지 모형을 적합해보았으며 각 모형에서 유의성 검정 결과 수술 후 병기가 가장 유의한 변수였다.
그러나 수술 후 병기는 수술 후의 결과이기 때문에 그것을 제외한 모형을 시도해보았다. 그 결과 Cox 모형에서 GLUT1 단백질 수준과 당단백을 유의한 공변량으로 포함한 모형이 가장 적절하다고 여겨진다. 또한 65세 이상/이하 (Age 65)를 층화변수로 고려하여 Cox 층화 비례위험률 모형을 적합하였고 이러한 변수를 공변량으로 간주했을 때의 모형과 비교하였다.
5는 down stage, ypstage, GLUT1을 공변량으로 고려하여 모형 적합을 한 결과로 ypstage만 유의하다. 이러한 검정 결과 검정 결과 가장 유의한 공변량은 ypstage, 그 다음 유의한 공변량은 GLUT1이라고 할 수 있다.
104명의 환자는 남자 71명, 여자 33명으로 구성된다. 직장암 2기와 3기의 환자들이 각각 50%씩 차지하며 환자들의 기록, 방사선 발견, 수술 후의 병리학적 슬라이드들이 검토되었다. 104명의 환자 중 77명이 우중도절단된 경우이다.
후속연구
암 연구에서 생존데이터에 대한 분석은 필수적이며 최근 여러 가지 생존 분석 방법이 개발되고 있으며 각 상황을 고려한 새로운 모형 개발을 기대한다.
질의응답
핵심어
질문
논문에서 추출한 답변
직장암이란 무엇인가?
직장암이란 직장에 생긴 암세포로 이루어진 악성 종양을 말한다. 대장은 크게 결장과 직장으로 구분되는데, 암이 발생하는 위치에 따라 결장에 생기는 암을 결장암, 직장에 생기는 암을 직장암이라고 하며, 이를 통칭하여 대장암 혹은 결장 직장암이라고 한다.
생존분석은 암 연구에서 어디에 이용되는가?
생존분석은 생존기간을 분석하여 생존함수 (survival function) 또는 생존곡선 (survival curve)을 추정하는 통계기법으로서 암 연구에서는 치료방법이나 예후인자, 그리고 폭로인자 등이 생존에 미치는 효과 등을 추정하는데 이용된다. 생존분석에서는 사건의 발생 여부에 대해 불완전한 관측값인 중도절단된 데이터(censored data)가 포함되어 있다는 특징을 가지고 있다.
생존분석의 예시로는 무엇이 있는가?
생존분석 (survival analysis)은 어떤 사건이 발생할 때까지의 시간 (time to event)이 관심 있는 반응 변수이다. 예를 들어, 기계부품의 고장, 환자의 죽음, 실직 후 재 구직 같은 사건 발생 시간 등이 있다. 이러한 생존시간에 대한 분포뿐만 아니라 생존에 영향을 미치는 설명변수들의 효과에도 관심이 많다.
참고문헌 (23)
Ahn, J. E. (2010). Statistical analysis of biomedical data using SPSS 18.0, Hannarae Publishing, Seoul.
Collectt, D. (1994). Modelling Survival Data in Medical Research. Chapman & Hall, New York.
Cox, D. R. and Snell, E. J. (1968). A general definition of residuals. Journal of the Royal Statistical Society. Series B (Methodological), 30, 248-275.
Jung, S. W., Park, J. Y., Kiim, Y. S., Jeen, Y. T., Lee, H. S., Chun, H. J., Um, S. H., Lee, S. W., Choi, J. H., Kim, C. D., Ryu, H. S. and Hyun, J. H. (2005). Survival analysis according to treatment modality in pancreatic cancer patients. Korean Journal of Gastroenterology, 46, 120-128.
Kim, J. (2009). A change-point estimator with the hazard ratio. Journal of the Korean Statistical Society, 38, 377-382.
Maas, M., Nelemans, P. J., Valentini, V., Das, P., Rodel, C., Kuo, L.-J., Calvo, F. A., Garcia-Aguilar, J., Glynne-Jones, R., Haustermans, K., Mohiuddin, M., Pucciarelli, S., William Small, W. Jr., Suarez, J., Theodoropoulos, G., Biondo, S., Beets-Tan, R. G. and Beets, G. L. (2010). Long-term outcome in patients with a pathological complete response after chemoradiation for rectal cancer: A pooled analysis of individual patient data. Lancet Oncology, 11, 835-844.
Oh, J. S. and Lee, S. Y. (2014). An extension of multifactor dimensionality reduction method for detecting gene-gene interactions with the survival time. Journal of the Korean Data & Information Science Society, 25, 1057-1067.
Seo, M. R., Lee, E. B., Yang, W. S., Kim, S. B., Park, S. K., Lee, S. G., Park, J. S. and Hong, C. G. (2002). Survival analysis of hemodialysis patients - A single center study. Korean Society of Nephrology, 21, 636-644.
Shim, B. Y., Jung, J. H., Lee, K. M., Kim, H. J., Hong, S. H., Kim, S. H., Sun, D. S. and Cho, H. M. (2013). Glucose transporter 1 (GLUT1) of anaerobic glycolysis as laparoscopic surgery for locally advanced rectal cancer. International Journal of Colorectal Disease, 28, 375-383.
Shin, S. B. and Kim, Y. J. (2014). Statistical analysis of recurrent gap time events with incomplete observation gaps. Journal of the Korean Data & Information Science Society, 25, 327-336.
Zhang, W., Qian, L. and Li, Y. (2014). Semiparametric sequential testing for multiple change points in piecewise constant hazard functions with long-term survivors. Communications in Statistics - Simulation and Computation, 43, 1685-1699.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.