교육 및 사회 현상에서 이분형 준거변수의 사건 발생 확률을 예측해야 하는 경우가 발생함에도 불구하고, 기존의 통계모형은 확실한 대안이 되지 못하였다. 로지스틱 함수는 이를 극복할 수 있게 한 대안으로, 이를 접합한 로지스틱 회귀모형은 사용 및 분석이 용이하여 다양한 분야에서 활발히 응용되어 왔다. 한편 로지스틱 다층모형은 다층모형과 로지스틱 함수를 연결함으로써 이분형 준거변수와 다층자료라는 두 가지 한계를 동시에 뛰어넘은 통계모형이다.본 연구는 이러한 로지스틱 ...
교육 및 사회 현상에서 이분형 준거변수의 사건 발생 확률을 예측해야 하는 경우가 발생함에도 불구하고, 기존의 통계모형은 확실한 대안이 되지 못하였다. 로지스틱 함수는 이를 극복할 수 있게 한 대안으로, 이를 접합한 로지스틱 회귀모형은 사용 및 분석이 용이하여 다양한 분야에서 활발히 응용되어 왔다. 한편 로지스틱 다층모형은 다층모형과 로지스틱 함수를 연결함으로써 이분형 준거변수와 다층자료라는 두 가지 한계를 동시에 뛰어넘은 통계모형이다.본 연구는 이러한 로지스틱 회귀모형과 로지스틱 다층모형의 방법론적 특성 및 경험적 분석 결과를 비교·검토한 연구가 발견되지 않는다는 점에 착안하여, 두 모형의 이론적 특성을 비교 분석하고 경험적 증거에 의한 체계적인 비교를 통해 모형의 타당도를 실증적으로 제시하고, 최종적으로는 연구자들이 적절한 통계모형을 선택하는 데에 지침을 주고자 하였다. 이를 위해 설정한 연구문제는 다음과 같다.첫째, 예측변수가 투입되지 않은 기초모형에서 로지스틱 회귀모형과 로지스틱 다층모형의 구조 및 이들이 제시하는 정보의 양과 유형에는 차이가 있는가? 둘째, 학생수준의 예측변수가 투입된 모형에서 로지스틱 회귀모형과 로지스틱 다층모형의 구조 및 제시되는 정보의 유형, 모수 추정치의 크기와 방향 및 양호도에는 차이가 있는가? 셋째, 학생수준과 학교수준의 예측변수가 투입된 모형에서 로지스틱 회귀모형과 로지스틱 다층모형의 구조 및 제시되는 정보의 유형, 모수 추정치의 크기와 방향 및 양호도에는 차이가 있는가?연구문제를 해결하기 위해 이론적 검토와 경험적 분석이 실시되었다. 이론적 검토의 결과는 첫째, 두 모형은 모두 로지스틱 연결함수를 이용하여 준거변수를 로짓 변환(logit transfer)하며, 해석 시 승산과 확률의 단위로 변환이 가능하며, 회귀계수의 유의도 검정 및 모형의 적합도 검정을 위한 검정통계량을 공유하여 적용할 수 있었다. 반면에 두 모형은 기초모형에서의 모수의 의미, 모수 추정방법, 분석 결과 제공되는 정보의 유형 및 종류에 차이가 있었다.경험적 분석 결과는 다음과 같다. 첫째, 예측변수를 포함하지 않은 기초모형 분석 결과, 로지스틱 회귀모형과 로지스틱 다층모형의 절편계수의 유의도는 동일한 수준으로 검정되었다. 회귀계수의 절대값은 로지스틱 다층 단위중심모형에서 가장 컸으며, 추정치의 표준오차는 로지스틱 다층모형에서 더 큰 것으로 확인되었다.둘째, 학생수준 예측변수를 투입한 모형에서, 예측변수별 회귀계수의 유의도는 모든 모형에서 동일한 수준으로 산출되었다. 로지스틱 회귀모형보다 로지스틱 다층모형에서 예측변수 투입에 따른 절편계수의 크기, 방향, 표준오차의 안정성이 높았다.셋째, 학생수준과 학교수준 예측변수를 투입한 모형에서 예측변수의 고정효과 유의도는 로지스틱 회귀모형과 로지스틱 다층모형에서 유사한 수준으로 나타났으나, 학교수준 변수의 유의도는 로지스틱 회귀모형과 로지스틱 다층모형에 차이가 있었다. 로지스틱 회귀모형보다 로지스틱 다층모형에서 추정치와 표준오차, 모형 적합도 등의 여러 정보가 더 다양하게 제시되었다. 모형별 계수의 크기는 모형의 구조와 임의효과의 투입 여부 등에 따라 차이가 발생하였으며 로지스틱 회귀모형 또는 로지스틱 다층모형으로 확연히 구분되는 차이는 발생하지 않았다. 모든 모형에서 학교수준 예측변수의 투입은 계수의 표준오차를 증폭시켰으며, 절편계수 추정치와 표준오차는 로지스틱 회귀모형보다 로지스틱 다층모형에서 더 안정적인 수치를 나타내었다.
교육 및 사회 현상에서 이분형 준거변수의 사건 발생 확률을 예측해야 하는 경우가 발생함에도 불구하고, 기존의 통계모형은 확실한 대안이 되지 못하였다. 로지스틱 함수는 이를 극복할 수 있게 한 대안으로, 이를 접합한 로지스틱 회귀모형은 사용 및 분석이 용이하여 다양한 분야에서 활발히 응용되어 왔다. 한편 로지스틱 다층모형은 다층모형과 로지스틱 함수를 연결함으로써 이분형 준거변수와 다층자료라는 두 가지 한계를 동시에 뛰어넘은 통계모형이다.본 연구는 이러한 로지스틱 회귀모형과 로지스틱 다층모형의 방법론적 특성 및 경험적 분석 결과를 비교·검토한 연구가 발견되지 않는다는 점에 착안하여, 두 모형의 이론적 특성을 비교 분석하고 경험적 증거에 의한 체계적인 비교를 통해 모형의 타당도를 실증적으로 제시하고, 최종적으로는 연구자들이 적절한 통계모형을 선택하는 데에 지침을 주고자 하였다. 이를 위해 설정한 연구문제는 다음과 같다.첫째, 예측변수가 투입되지 않은 기초모형에서 로지스틱 회귀모형과 로지스틱 다층모형의 구조 및 이들이 제시하는 정보의 양과 유형에는 차이가 있는가? 둘째, 학생수준의 예측변수가 투입된 모형에서 로지스틱 회귀모형과 로지스틱 다층모형의 구조 및 제시되는 정보의 유형, 모수 추정치의 크기와 방향 및 양호도에는 차이가 있는가? 셋째, 학생수준과 학교수준의 예측변수가 투입된 모형에서 로지스틱 회귀모형과 로지스틱 다층모형의 구조 및 제시되는 정보의 유형, 모수 추정치의 크기와 방향 및 양호도에는 차이가 있는가?연구문제를 해결하기 위해 이론적 검토와 경험적 분석이 실시되었다. 이론적 검토의 결과는 첫째, 두 모형은 모두 로지스틱 연결함수를 이용하여 준거변수를 로짓 변환(logit transfer)하며, 해석 시 승산과 확률의 단위로 변환이 가능하며, 회귀계수의 유의도 검정 및 모형의 적합도 검정을 위한 검정통계량을 공유하여 적용할 수 있었다. 반면에 두 모형은 기초모형에서의 모수의 의미, 모수 추정방법, 분석 결과 제공되는 정보의 유형 및 종류에 차이가 있었다.경험적 분석 결과는 다음과 같다. 첫째, 예측변수를 포함하지 않은 기초모형 분석 결과, 로지스틱 회귀모형과 로지스틱 다층모형의 절편계수의 유의도는 동일한 수준으로 검정되었다. 회귀계수의 절대값은 로지스틱 다층 단위중심모형에서 가장 컸으며, 추정치의 표준오차는 로지스틱 다층모형에서 더 큰 것으로 확인되었다.둘째, 학생수준 예측변수를 투입한 모형에서, 예측변수별 회귀계수의 유의도는 모든 모형에서 동일한 수준으로 산출되었다. 로지스틱 회귀모형보다 로지스틱 다층모형에서 예측변수 투입에 따른 절편계수의 크기, 방향, 표준오차의 안정성이 높았다.셋째, 학생수준과 학교수준 예측변수를 투입한 모형에서 예측변수의 고정효과 유의도는 로지스틱 회귀모형과 로지스틱 다층모형에서 유사한 수준으로 나타났으나, 학교수준 변수의 유의도는 로지스틱 회귀모형과 로지스틱 다층모형에 차이가 있었다. 로지스틱 회귀모형보다 로지스틱 다층모형에서 추정치와 표준오차, 모형 적합도 등의 여러 정보가 더 다양하게 제시되었다. 모형별 계수의 크기는 모형의 구조와 임의효과의 투입 여부 등에 따라 차이가 발생하였으며 로지스틱 회귀모형 또는 로지스틱 다층모형으로 확연히 구분되는 차이는 발생하지 않았다. 모든 모형에서 학교수준 예측변수의 투입은 계수의 표준오차를 증폭시켰으며, 절편계수 추정치와 표준오차는 로지스틱 회귀모형보다 로지스틱 다층모형에서 더 안정적인 수치를 나타내었다.
Researchers often confronts difficulties in model selection when the dependent variable has a binary outcome. This study focuses on analyzing similarities and dissimilarities between two types of statistical models for binary outcomes: the logistic regression models and the logistic multilevel model...
Researchers often confronts difficulties in model selection when the dependent variable has a binary outcome. This study focuses on analyzing similarities and dissimilarities between two types of statistical models for binary outcomes: the logistic regression models and the logistic multilevel models. The investigation was done by both a theoretical and an empirical way.In a theoretical approach, both types of models applied the logit tranfer process and provided coefficients that are tranferable to a logit unit, to a probability unit, and to an odds unit. However, each model had dissimilarities in the interpretation of coefficitions, estimation methods, and the variety of information provided in the output.For an empirical comparison, a national data of 178 high schools and 4,445 students was adjusted to the five different logistic models in each of the three stages of adding up independent variables. In conclusion, the empirical comparison revealed that both types provided similar results for the significance tests, while adding level-two variables produced some differences in the test results. The author did not find out any significant pattern in the size of coefficients between the models. As for the size of standard errors(SE), the logistic regression models provided smaller SEs than the logistic multilevel models. For the multilevel models, application of the penalized quasi-likelihood(PQL) estimation method resulted in smaller SEs than the Laplace6(LP) method when adjusted to the population-average models, while applying the LP method provided smaller SEs than the PQL method when adjusted to the unit-specified models.
Researchers often confronts difficulties in model selection when the dependent variable has a binary outcome. This study focuses on analyzing similarities and dissimilarities between two types of statistical models for binary outcomes: the logistic regression models and the logistic multilevel models. The investigation was done by both a theoretical and an empirical way.In a theoretical approach, both types of models applied the logit tranfer process and provided coefficients that are tranferable to a logit unit, to a probability unit, and to an odds unit. However, each model had dissimilarities in the interpretation of coefficitions, estimation methods, and the variety of information provided in the output.For an empirical comparison, a national data of 178 high schools and 4,445 students was adjusted to the five different logistic models in each of the three stages of adding up independent variables. In conclusion, the empirical comparison revealed that both types provided similar results for the significance tests, while adding level-two variables produced some differences in the test results. The author did not find out any significant pattern in the size of coefficients between the models. As for the size of standard errors(SE), the logistic regression models provided smaller SEs than the logistic multilevel models. For the multilevel models, application of the penalized quasi-likelihood(PQL) estimation method resulted in smaller SEs than the Laplace6(LP) method when adjusted to the population-average models, while applying the LP method provided smaller SEs than the PQL method when adjusted to the unit-specified models.
주제어
#로지스틱 회귀모형 로지스틱 다층모형 위계적 선형 모형 logistic regression models logistic multilevel models hierarchical linear models HLM
학위논문 정보
저자
최진이
학위수여기관
연세대학교 대학원
학위구분
국내석사
학과
교육학과
지도교수
강상진
발행연도
2005
총페이지
v, 93 p.
키워드
로지스틱 회귀모형 로지스틱 다층모형 위계적 선형 모형 logistic regression models logistic multilevel models hierarchical linear models HLM
※ AI-Helper는 부적절한 답변을 할 수 있습니다.