최소 단어 이상 선택하여야 합니다.
최대 10 단어까지만 선택 가능합니다.
다음과 같은 기능을 한번의 로그인으로 사용 할 수 있습니다.
NTIS 바로가기응용통계연구 = The Korean journal of applied statistics, v.30 no.1, 2017년, pp.119 - 133
송은정 (인하대학교 통계학과) , 원성호 (서울대학교 보건대학원) , 이우주 (인하대학교 통계학과)
Corrected Akaike's information criterion (AICc) is known to have better finite sample properties. However, Akaike's information criterion (AIC) is still widely used to select an optimal prediction model among several candidate models due to of a lack of research on benefits obtained using AICc. In t...
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
핵심어 | 질문 | 논문에서 추출한 답변 |
---|---|---|
예측력을 평가하는 판단기준으로 어떤 두 가지 측도를 이용하였는가? | 본 논문에서는 예측력을 평가하는 판단기준으로 두 가지 측도를 이용하였다. 첫 번째는 피어슨 잔차의 제곱합을 이용하여 얻은 통계량이고, 두 번째 측도는 로그 가능도 함수를 이용하여 구한 통계량이다. 본 논문에서는 두 측도를 이용하여 예측력이 좋은 모형인지 아닌지 확인 할 뿐만 아니라,두 측도를 비교해 봄으로써 선택된 모형의 예측력에 대한 평가가 사용되는 측도에 크게 의존하는지를 추가적으로 확인해 보고자 한다. | |
AIC란 무엇인가? | 이러한 모형선택 문제에 대한 하나의 해결책으로 Akaike(1973)는 Akaike’s information criterion(AIC)를 제안하였다. AIC는 참모형과 후보 모형 사이의 불일치 정도를 수치화한 통계량으로, 각 모형에 대응하는 AIC 값 중 가장 작은 값에 대응하는 모형을 선택함으로써 예측력이 가장 좋은 모형을 선택하게 해주는 것으로 알려져 있다 (Shmueli, 2010). 그러나AIC는 통계량을 유도하는 과정에서 최대가능도 추정량의 점근적 성질들을 이용하기 때문에 모형에서 추정해야 할 모수의 개수에 비해 자료수가 충분히 많지 않으면 예측력이 높은 모형을 선택하는데 어려움을 가진다. | |
AIC의 단점은? | AIC는 참모형과 후보 모형 사이의 불일치 정도를 수치화한 통계량으로, 각 모형에 대응하는 AIC 값 중 가장 작은 값에 대응하는 모형을 선택함으로써 예측력이 가장 좋은 모형을 선택하게 해주는 것으로 알려져 있다 (Shmueli, 2010). 그러나AIC는 통계량을 유도하는 과정에서 최대가능도 추정량의 점근적 성질들을 이용하기 때문에 모형에서 추정해야 할 모수의 개수에 비해 자료수가 충분히 많지 않으면 예측력이 높은 모형을 선택하는데 어려움을 가진다. 이와 같은 한계점을 보완하기 위해 Hurvich와 Tsai (1989)는 corrected Akaike’s information criterion(AICc)를 제안하였다. |
Akaike, H. (1973). Information theory and an extension of the maximum likelihood principle. In 2nd International Symposium on Information Theory (pp. 267-281), Akademia Kiado, Budapest.
Bloom, M. and Milkovich, G. T. (1998). Relationships among risk, incentive pay, and organizational performance, Academy of Management Journal, 41, 283-297.
Burnham, K. P. and Anderson, D. (2003). Model Selection and Multi-Model Inference: a Practical Informatio-Theoric Approach, Springer, New York.
Cavanaugh, J. E., Davies S. L., and Neath, A. A. (2008). Discrepancy-based model selection criteria using cross-validation. In Statistical Models and Methods for Biomedical and Technical Systems (pp. 473-486), Birkhauser, Boston.
Debrock, C., Preux, P. M., Houinato, D., Druet-Cabanac, M., Kassa, F., Adjien, C., Avode, G., Denis, F., Boutros-Toni, F., and Dumas, M. (2000). Estimation of the prevalence of epilepsy in the Benin region of Zinvie using the capture-recapture method, International Journal of Epidemiology, 29, 330-335.
Harada, T., Ariyoshi, N., Shimura, H., Sato, Y., Yokoyama, I., Takahashi, K., Yamagata, S., Imamaki, M., Kobayashi, Y., Ishii, I., Miyazaki, M., and Kitada, M. (2010). Application of Akaike information criterion to evaluate warfarin dosing algorithm, Thrombosis Research, 126, 183-190.
Hinde, J. and Demetrio, C. G. B. (2007). Overdispersion: models and estimation. In A Short Course for 13th Brazilian Symposium of Probability and Statistics (SINAPE 1998), Brazil.
Hurvich, C. M. and Tsai, C. L. (1989). Regression and time series model selection in small samples, Biometrika, 76, 297-307.
Johnson, R. J., Kerr, C. L., Enouri, S. S., Modi, P., Lascelles, B. D. X., and Castillo, J. R. E. (2016). Pharmacoki-netics of liposomal encapsulated buprenorphine suspension following subcutaneous administration to cats, Journal of Veterinary Pharmacology and Therapeutics, Available from: http://dx.doi.org/10.1111/jvp.12357
Kim, H. J., Cavanaugh, J. E., Dallas, T. A., and Fore, S. A. (2014). Model selection criteria for overdispersed data and their application to the characterization of a host-parasite relationship, Environmental and Ecological Statistics, 21, 329-350.
Lebreton, J. D., Burnham, K. P., Clobert, J., and Anderson, D. R. (1992). Modeling survival and testing biological hypotheses using marked animals: a unied approach with case studies, Ecological Monograph, 62, 67-118.
McDonald, G. C. and Schwing, R. C. (1973). Instabilities of regression estimates relating air pollution to mortality, Technometrics, 15, 463-481.
Shmueli, G. (2010). To explain or to predict?, Statistical Science, 25, 289-310.
Takeuchi, K. (1976). Distribution of informational statistics and a criterion of model fitting, Suri-Kagaku (Mathematic Sciences), 153, 12-18.
Zampetakis, L. A., Bouranta, N., and Moustakis, V. S. (2010). On the relationship between individual creativity and time management, Thinking Skills and Creativity, 5, 23-32.
*원문 PDF 파일 및 링크정보가 존재하지 않을 경우 KISTI DDS 시스템에서 제공하는 원문복사서비스를 사용할 수 있습니다.
오픈액세스 학술지에 출판된 논문
※ AI-Helper는 부적절한 답변을 할 수 있습니다.