$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

비모수 베이지안 겉보기 무관 회귀모형
A nonparametric Bayesian seemingly unrelated regression model 원문보기

응용통계연구 = The Korean journal of applied statistics, v.29 no.4, 2016년, pp.627 - 641  

조성일 (고려대학교 통계학과) ,  석인혜 (고려대학교 통계학과) ,  최태련 (고려대학교 통계학과)

초록
AI-Helper 아이콘AI-Helper

본 논문에서는 겉보기 무관 회귀모형을 고려하고 디리크레 프로세스 혼합모형을 오차항의 분포로 하는 비모수 베이지안 방법을 제안한다. 제안된 모형을 바탕으로 사후분포를 유도하고 디리크레 프로세스 혼합모형의 붕괴깁스표집 방법을 통해 마코프 체인 몬테 칼로 알고리듬을 구성하고 사후추론을 실시한다. 모형의 성능을 비교하기 위해 모의실험을 실시하고, 더 나아가 한국지역의 강수량 예측에 대한 실제 자료에 적용해 본다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we consider a seemingly unrelated regression (SUR) model and propose a nonparametric Bayesian approach to SUR with a Dirichlet process mixture of normals for modeling an unknown error distribution. Posterior distributions are derived based on the proposed model, and the posterior infe...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 비록, MOS 방법으로 한 많은 연구가 이루어지고 있으나 (Baran와 Lerch, 2015; Jo 등 2012; Kang 등 2011; Lim 등 2012; 등), 각 지역별로 편향수정을 하기 때문에 기상자료가 가지고 있는 지역별 상관관계를 고려하지 않으며, 강수량의 경우 오차의 정규성 가정이 적절하지 않음이 알려져 왔다 (Raftery 등, 2005). 따라서 본 절에서는 비모수적 SUR모형을 이용하여 기존의 MOS방법이 가진 단점을 보완하고, 동시에 오차의 정규성 가정에 영향을 받지 않는 강수량 예측 실증분석을 하고자 하였다.
  • 그러나 이러한 t-분포를 바탕으로 한 SUR 모형 역시 오차항의 분포가 치우침(skewness)이 있거나, 다봉성(multi-modality)을 갖거나, 특정한 분포로 가정하는 것이 어려운 관측값들을 설명하기 위한 SUR 모형이 필요한 경우에는 적용하기 어렵다는 것을 알 수 있다. 따라서, 이러한 오차항 분포에 대하여 보다 영향을 받지 않고, 다양한 분포에서 적용 가능한 새로운 베이지안 SUR 모형의 개발이 필요하며, 이를 위하여 본 논문에서는, 비모수 베이지안(nonparametric Bayesian)에서 대표적으로 사용되는 모형인 디리슈레 프로세스 혼합모형(Dirichlet process mixture model)을 오차항의 분포로 가정한 비모수 베이지안 SUR 모형을 제안하고자 한다.
  • 본 논문에서는 비모수 베이지안에서 주로 사용되는 디리슈레 프로세스 혼합모형을 바탕으로 한 DPMSUR 모형을 제안하였다. DPM-SUR 모형은, 오차항의 분포에 자유로우며, 특정한 모수적 가정에 영향을 받지 않는 강건한 모형으로서, 기존에 연구된 베이지안 SUR 모형에 비해 여러가지 측면에서 우수한 성능을 보임을 확인할 수 있었다.
  • 본 절에서는 본 논문에서 제안한 DPM-SUR 모형을 우리나라의 강수량 자료에 대한 실증적 분석을 통해 DPM-SUR 모형의 우수성을 보이고 기존의 모형들과 성능을 비교 분석 하고자 한다. 강수량의 계절 예측에 있어서 가장 널리 사용되는 방법은, 기후의 실제 관측값과 편미분 방정식으로 구현된 동적모형(dynamic model)으로 부터 얻어지는 예측값과의 통계적 함수관계를 이용하는 Model Output Statistics(MOS) 방법 (Glahn과 Lowry, 1972)으로, 동적모형으로 부터 얻어지는 예측값과 실제 관측값의 선형 회귀모형을 통해 편향수정(bias correction)을 실시하는 방식이다.
  • 본 절에서는 비모수 베이지안 SUR 모형의 기본이 되는 모수적 SUR 모형을 소개한다. 이를 위해 y j는 j번째 회귀 모형의 반응변수를 포함한 n × 1 벡터라 하고, Xj를 j번째 회귀모형의 설명변수(explanatory variables)에 대응하는 n × pj 차원의 계획행렬(design matrix)이라 하자.

가설 설정

  • 마지막으로 기저분포의 모수 (µ0 , τ, S0)와 회귀계수 β에 대하여 다음의 사전분포를 가정한다.
  • 먼저 정밀 모수 α는 형태모수(shape parameter) aα와 척도모수(scale parameter) 1/bα를 갖는 감마 분포(gamma distribution)를 할당하고, 기저 분포 G0는 공액 분포인 정규-역 위샤트(normal-inverse Wishart) 분포를 가정한다.
  • 차원의 계수 벡터(vector of coefficients)를 나타낸다. 모형 (2.1)에서 j번째 회귀 모형은 l번째 회귀 모형과 서로 다른 설명변수를 갖지만, 회귀 모형 사이에는 오차항 벡터를 통해 서로 종속관계가 있다고 가정한다# 이라고 가정하며, I n는 n차원의 단위행렬을 나타낸다.
  • 자료분석에서는 각 지역별 앙상블들의 평균을 설명변수(x)로 이용하였다. 실제 관측값과 앙상블 평균 간의 선형관계를 설명하기 위해서는 12개 지역 간의 종속적인 관계를 반영하는 것이, 보다 합리적인 분석이라고 할 수 있으며, 이에 다음과 같이, 12개 지역을 설명하는 SUR 모형을 가정하도록 한다.
  • 특히 본 논문에서 제안하는 DPM-SUR 모형이 오차항 분포 가정에 영향을 받지 않는 강건한 모형임을 보이기 위하여, 구체적으로, 정규성이 만족되는 경우, 두꺼운 꼬리를 가지는 경우, 그리고 분포가 다봉성을 띄는 경우의 세 가지로 나누어 모의실험을 진행하였다. 아울러, 모의실험자료 생성을 위한 SUR 모형은 다음과 같이 회귀 방정식 m = 2개로 이루어져 있다고 가정하였고, 모든 실험에서 각각 50번의 반복을 실시하였다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
겉보기 무관 회귀모형은 어디에 활용되는가? 겉보기 무관 회귀(seemingly unrelated regression; SUR)모형은 서로 관련이 없는 것처럼 보이는 여러 개의 연립 방정식으로 표현되는 다중 회귀 방정식들을 동시에 적합하는 모형으로서, 통계학 뿐 아니라 계량 경제학, 금융, 심리학, 사회과학 등의 다양한 분야에서 활용되며, 많은 연구가 이루어져 왔다 (Aliprantis 등 2007; Ando와 Zellner, 2010; Wang, 2010; Zellner와 Chen, 2002; 등). Zellner (1962, 1963)에 의해 처음 제안된 겉보기 무관 회귀 모형은 주어진 여러 개의 회귀식들의 설명변수간에는 상관관계는 적고 오차(error)항들 간에는 상관관계가 높을 때, 이러한 종속적 구조를 공분산 행렬(covariance matrix) 반영함으로써, 오차항들간에 독립성을 가정하는 선형 회귀 모형에서의 추정 방법보다 효율적인 방법으로 알려져 있다.
지금까지 사용해온 SUR 모형의 한계는 무엇인가? 대표적인 SUR 모형의 장점은 여러 개의 다중 회귀 방정식의 계수들을 동시에 추정하기 때문에 주어진 다중 회귀 모형의 구조를 동시에 파악할 수 있다는 것이다. 하지만, 지금까지 사용해온 모형은 오차항의 분포를 다변량 정규분포(multivariate normal distribution)로 가정하기 때문에, 이상치(outlier)가존재하는 경우나, 정규분포를 따르지 않는 관측값에 대한 분석 등에 있어서는 이를 적용하는데 한계가 있어왔다 (Kowalski 등, 1999; Ng, 2002; Zellner와 Ando, 2010b). 이러한 단점들을 해결하기 위하여 Kowalski 등 (1999)과 Ng (2002)는 오차의 분포를 다변량 스튜던트-t 분포(multivariate student-tdistribution)로 가정한 SUR 모형을 개발하였고, 최근, Zellner와 Ando (2010b)는 스튜던트-t 오차 분포에 대해 디렉트 몬테 칼로 방법을 이용한 SUR 모형을 개발하였다.
겉보기 무관 회귀 모형은 어떤 모형인가? 겉보기 무관 회귀(seemingly unrelated regression; SUR)모형은 서로 관련이 없는 것처럼 보이는 여러 개의 연립 방정식으로 표현되는 다중 회귀 방정식들을 동시에 적합하는 모형으로서, 통계학 뿐 아니라 계량 경제학, 금융, 심리학, 사회과학 등의 다양한 분야에서 활용되며, 많은 연구가 이루어져 왔다 (Aliprantis 등 2007; Ando와 Zellner, 2010; Wang, 2010; Zellner와 Chen, 2002; 등). Zellner (1962, 1963)에 의해 처음 제안된 겉보기 무관 회귀 모형은 주어진 여러 개의 회귀식들의 설명변수간에는 상관관계는 적고 오차(error)항들 간에는 상관관계가 높을 때, 이러한 종속적 구조를 공분산 행렬(covariance matrix) 반영함으로써, 오차항들간에 독립성을 가정하는 선형 회귀 모형에서의 추정 방법보다 효율적인 방법으로 알려져 있다.
질의응답 정보가 도움이 되었나요?

참고문헌 (41)

  1. Aitken, A. C. (1935). On least-squares and linear combination of observations. In Proceedings of the Royal Society of Edinburgh, 55, 42-48. 

  2. Aliprantis, C. D., Barnett, W. A., Cornet, B., and Durlauf, S. (2007). The interface between econometrics and economic theory, Journal of Econometrics, 136, 325-724. 

  3. Ando, T. and Zellner, A. (2010). Hierarchical Bayesian analysis of the seemingly unrelated regression and simultaneous equations models using a combination of direct Monte Carlo and importance sampling techniques, Bayesian Analysis, 5, 65-96. 

  4. Antoniak, C. E. (1974). Mixtures of Dirichlet processes with applications to Bayesian nonparametric problems, The Annals of Statistics, 2, 1152-1174. 

  5. Baran, S. and Lerch, S. (2015). Log-normal distribution based Ensemble Model Output Statistics models for probabilistic wind-speed forecasting, Quarterly Journal of the Royal Meteorological Society, DOI:10.1002/qj.2521 

  6. Chib, S. and Greenberg, E. (2010). Additive cubic spline regression with Dirichlet process mixture errors, Journal of Econometrics, 156, 322-336. 

  7. Deque, M. (2003). "Continuous Variable" Chapter 5, Forecast Verification: A Practitioner's Guide in Atmospheric Science, Wiley, New York. 

  8. Escobar, M. D. and West, M. (1995). Bayesian density estimation and inference using mixtures, Journal of the American Statistical Association, 90, 577-588. 

  9. Ferguson, T. S. (1973). A Bayesian analysis of some nonparametric problems, The Annals of Statistics, 1, 209-230. 

  10. Ferguson, T. S. (1983). Bayesian density estimation by mixtures of normal distributions. In M. Rizvi, J. Rustagi and D. Siegmund (Ed), Recent Advances in Statistics (pp. 287-302), Academic Press, New York. 

  11. Fraser, D. A. S., Rekkasb, M., and Wong, A. (2005). Highly accurate likelihood analysis for the seemingly unrelated regression problem, Journal of Econometrics, 127, 17-33. 

  12. Geisser, S. and Eddy, W. F. (1979). A predictive approach to model selection, Journal of the American Statistical Association, 74, 153-160. 

  13. Gelman, A., Carlin, J. B., Stern, H. S., Dunson, D. B., Vehtari, A., and Rubin, D. B. (2014). Bayesian Data Analysis (3rd ed), Chapman & Hall/CRC, Florida. 

  14. Glahn, H. R. and Lowry, D. A. (1972). The use of model output statistics (MOS) in objective weather forecasting, Journal of Applied Meteorology, 11, 1203-1211. 

  15. Greene, W. H. (2003). Econometric Analysis (5th ed), Prentice Hall, New Jersey. 

  16. Hjort, N. L., Holmes, C., Muller, P., and Walker, S. G. (2010). Bayesian Nonparametrics, Cambridge Series in Statistical and Probabilistic Mathematics, Cambridge University Press. 

  17. Henningsen, A. and Hamann, J. D. (2007). systemfit: A package for estimating systems of simultaneous equations in R, Journal of Statistical Software, 23, 1-40. 

  18. Jo, S., Lim, Y., Lee, J., Kang, H., and Oh, H. (2012). Bayesian regression model for seasonal forecast of precipitation over Korea, Asia-Pacific Journal of Atmospheric Sciences, 48, 205-212. 

  19. Kang, J., Suh, M., Hong, K., and Kim, C. (2011). Development of updateable Model Output Statistics (UMOS) System for Air Temperature over South Korea, Asia-Pacific Journal of Atmospheric Sciences, 47, 199-211. 

  20. Koop, G., Poirier, D. J., and Tobias, J. (2005). Semiparametric Bayesian inference in multiple equation models, Journal of Applied Econometrics, 20, 723-747. 

  21. Kowalski, J., Mendoza-Blanco, J. R., Tu, X. M., and Gleser, L. J. (1999). On the difference in inference and prediction between the joint and independent t-error models for seemingly unrelated regressions, Communications in Statistics - Theory and Methods, 28, 2119-2140. 

  22. Lang, S., Adebayo, S. B., Fahrmeir, L., and Steiner, W. J. (2003). Bayesian geoadditive seemingly unrelated regression, Computational Statistics, 18, 263-292. 

  23. Lim, Y., Jo, S., Lee, J., Oh, H., and Kang, H. (2012). An improvement of seasonal climate prediction by regularized canonical correlation analysis, International Journal of Climatology, 32, 1503-1512. 

  24. Lo, A. Y. (1984). On a class of Bayesian nonparametric estimates: I. Density estimates, The Annals of Statistics, 12, 351-357. 

  25. Muller, P., Quintana, F. A., Jara, A., and Hanson, T. (2015). Bayesian Nonparametric Data Analysis, Springer Series in Statistics. 

  26. Muller, P. and Rodriguez, A. (2013). Nonparametric Bayesian Inference, NSF-CBMS Regional Conference Series in Probability and Statistics, Volume 9, Institute of Mathematical Statistics. 

  27. Neal, R. M. (2000). Markov chain sampling methods for Dirichlet process mixture models, Journal of Computational and Graphical Statistics, 9, 249-265. 

  28. Ng, V. M. (2002). Robust Bayesian inference for seemingly unrelated regressions with elliptical errors, Journal of Multivariate Analysis, 83, 409-414. 

  29. Park, H. and Hong, S.-Y. (2007). An evaluation of a mass-flux cumulus parameterization scheme in the kma global forecast system, Journal of the Meteorological Society of Japan, 85, 151-169. 

  30. Potts, J. M., Folland, C. K., Jolliffe, I. T., and Secton, D. (1996). Revised LEPS scores for assessing climate model simulations and long-range forecasts, Journal of Climate, 9, 34-54. 

  31. Raftery, A. E., Gneiting, T., Balabdaoui, F., and Polakowski, M. (2005). Using Bayesian model averaging to calibrate forecast ensembles, Monthly Weather Review, 133, 1155-1174. 

  32. Rodriguez, C. E. and Walker, S. G. (2014). Univariate Bayesian nonparametric mixture modeling with unimodal kernels, Statistics and Computing, 24, 35-49. 

  33. Sethurman, J. (1994). A constructive definition of Dirichlet priors, Statistica Sinica, 4, 639-650. 

  34. Wang, H. (2010). Sparse seemingly unrelated regression modelling: applications in finance and econometrics, Computational Statistics and Data Analysis, 54, 2866-2877. 

  35. Zellner, A. (1962). An efficient method of estimating seemingly unrelated regressions and tests for aggregation bias, Journal of the American Statistical Association, 57, 348-368. 

  36. Zellner, A. (1963). Estimators for seemingly unrelated regression equations: some exact finite sample results, Journal of the American Statistical Association, 58, 977-992. 

  37. Zellner, A. (1971). An Introduction to Bayesian Inference in Econometrics, Wiley, New York. 

  38. Zellner, A. and Ando, T. (2010a). A direct Monte Carlo approach for Bayesian analysis for the seemingly unrelated regression model, Journal of Econometrics, 159, 33-45. 

  39. Zellner, A. and Ando, T. (2010b). Bayesian and non-Bayesian analysis of the seemingly unrelated regression model with Student-t errors, and its application for forecasting, International Journal of Forecasting, 26, 413-434. 

  40. Zellner, A. and Chen, B. (2002). Bayesian modeling of economies and data requirements, Macroeconomic Dynamics, 5, 673-700. 

  41. Zellner, A. and Tobias, J. (2001). Further results on Bayesian method of moments analysis of the multiple regression model, International Economic Review, 42, 121-139. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로