$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

로지스틱모형에서 그래픽을 이용한 회귀와 모형평가
Graphical regression and model assessment in logistic model 원문보기

Journal of the Korean Data & Information Science Society = 한국데이터정보과학회지, v.21 no.1, 2010년, pp.21 - 32  

강명욱 (숙명여자대학교 통계학과) ,  김부용 (숙명여자대학교 통계학과) ,  홍주희 (숙명여자대학교 통계학과)

초록
AI-Helper 아이콘AI-Helper

그래픽적 회귀는 모형에 대한 가정을 하지 않고 회귀정보를 모두 포함하는 충분요약그림을 찾아내는 분석 방법으로 모든 회귀정보를 저차원의 그림으로 표현할 수 있게 하는 데에 그 목적이 있다. 잔차산점도를 이용한 모형의 평가는 적용 범위가 선형회귀모형에 국한되는 문제점이 있기 때문에 일반화선형모형에서는 그 대안으로 주변모형 산점도를 이용하여 모형의 적절성을 평가한다. 본 논문에서는 일반화선형모형 중에서 이진반응변수를 갖는 로지스틱모형에서의 그래픽적 회귀 방법과 주변모형 산점도를 이용한 모형평가 방법을 알아본다.

Abstract AI-Helper 아이콘AI-Helper

Graphical regression is a paradigm for obtaining regression information using plots without model assumptions. The general goal of this approach is to find lowdimensional sufficient summary plots without loss of important information. Model assessments using residual plots are less likely to be succ...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 반응변수가 이진변수인 경우에도 선형회귀모형에서와 같이 그래픽적인 회귀가 가능하지만 반응변수의 특성상 선형회귀모형에 적용했던 방법과는 다른 방법으로 접근하여야 한다. Weisberg (2005)에 소개된 사과나무 자료를 로지스틱모형인 경우의 그래픽적 회귀를 적용하고 모형의 적절성을 평가하고자 한다.
  • 본 연구에서는 일반화선형모형 중에서 특히 이진반응변수를 가진 로지스틱모형에서의 Cook과 Weisberg (1999)이 제안한 그래픽적 회귀에 대한 방법을 확장하여 제시하고 로지스틱모형의 적절성을 평가하는 방법 중에서 그래픽적인 방법으로 주변모형 산점도를 이용한 모형평가 방법을 제시하고자 한다.

가설 설정

  • 반응변수 y와 선형의 관계에 있는 p개의 설명변수 x = (x1, · · · , xp)T를 갖는 회귀를 가정하자.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
그래픽적 회귀란? 일반적으로 통계분석방법은 자료가 가지고 있는 정보를 하나의 숫자로 표현하는 요약통계량에 의존한다. 반면 그래픽적 회귀 (graphical regression)는 자료를 통해 얻을 수 있는 모든 정보를 분포에 대한 가정 없이 그림으로 나타내는 그래픽적인 접근이며 회귀정보 (regression information)를 모두 포함하는 충분요약그림 (sufficient summary plot)을 찾아내는 방법을 제시한다.
그래픽적 회귀의 핵심은 무엇인가? 그러나 설명변수가 2보다 많은 p개인 경우, (p +1)차원의 산점도를 구현하기는 매우 힘들다. 그러므로 정보의 손실 없이 우리가 인지할 수 있는 2차원이나 3차원으로 차원을 축소하는 것이 그래픽적 회귀의 핵심이다.
설명 변수가 하나인 단순회귀의 그래픽적 회귀에서 무엇이 충분 요약 그림이 되나? 설명변수가 하나인 단순회귀의 그래픽적인 분석은 반응변수를 수직축으로 하고 설명변수를 수평축으로 하는 2차원 산점도에 기초하고 있고 이 산점도가 곧 충분요약그림이 된다. 설명변수가 2개인 경우에는 반응변수를 수직축인 V축 (vertical-axis)으로 하고, 설명변수를 V축에 수직이며 서로 직각인 두 개의 축인 H축 (horizontal-axis)과 O축 (out-of-page axis)축으로 하는 3차원 산점도가 충분요약그림이 된다.
질의응답 정보가 도움이 되었나요?

참고문헌 (17)

  1. Atkinson, A. C. (1985). Plots, transformations, and regression, Oxford University Press, Oxford. 

  2. Azzalini, A. and Bowman, A. W. (1993). On the use of nonparametric regression for checking linear relationships. Journal of the Royal Statistical Society, Ser. B, 55, 549-557. 

  3. Chambers, J. M., Cleveland, W. S., Kleiner, B. and Tukey, P. (1983). Graphical methods for data Analysis, Chapman and Hall, New York. 

  4. Cleveland, W. and Devlin, D. J. (1988). Locally weighted regression: An approach to regression analysis by local fitting. Journal of the American Statistical Association, 83, 596-610. 

  5. Cleveland, W. S. (1987). Research in statistical graphics. Journal of the American Statistical Association, 82, 419-423. 

  6. Cook, R. D. (1998). Regression graphics: Idea for studying regressions through graphics, John Wiley & Sons, New York. 

  7. Cook, R. D. and Weisberg, S. (1982). Residuals and influence in regression, Chapman and Hall, New York. 

  8. Cook, R. D. and Weisberg, S. (1994). An introduction to regression graphics, John Wiley & Sons, New York. 

  9. Cook, R. D. and Weisberg, S. (1997). Graphics for assessing the adequacy of regression models. Journal of the American Statistical Association, 92, 490-499. 

  10. Cook, R. D. and Weisberg, S. (1999). Applied regression including computing and graphics, John Wiley & Sons, New York. 

  11. Ezekiel, M. (1924). A method for handling curvilinear correlation for any number of variables. Journal of the American Statistical Association, 19, 431-453. 

  12. Kahng, M. (2005). Exploring interaction in generalized linear models. Journal of Korean Data & Information Science Society, 16, 13-18. 

  13. Kahng, M. and Kim, M. (2004). A score test for detection of outliers in generalized linear models. Journal of Korean Data & Information Science Society, 15, 129-139. 

  14. Lee, J. and Rhee, S. (2003). Logistic model for normality by neural networks. Journal of Korean Data & Information Science Society, 14, 119-129. 

  15. Seo, M. and Kim, J. (2006). Estimation of odds ratio in proportional odds model. Journal of Korean Data & Information Science Society, 17, 1067-1076. 

  16. Tierney, L. (1990). Lisp-Stat: An object-oriented environment for statistical computing and dynamic graphics, John Wiley & Sons, New York. 

  17. Weisberg, S. (2005). Applied linear regression, 3rd Ed., John Wiley & Sons, New York. 

저자의 다른 논문 :

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로