$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

계수형 시계열 모형을 위한 자동화 차수 선택 알고리즘
Automatic order selection procedure for count time series models 원문보기

응용통계연구 = The Korean journal of applied statistics, v.33 no.2, 2020년, pp.147 - 160  

지윤미 (중앙대학교 응용통계학과) ,  성병찬 (중앙대학교 응용통계학과)

초록
AI-Helper 아이콘AI-Helper

본 논문은 시계열 일반화 선형 모형의 하나인 계수형 시계열 모형에서 중요한 역할을 하는 과거 관측값과 조건부 평균값의 차수를 자동으로 결정하는 알고리즘을 연구한다. 본 알고리즘은 ARIMA 모형의 차수를 기반으로 시계열 일반화 선형 모형의 차수 후보군을 만들고, 차수 후보군의 조합을 이용하여 정보량 기준으로 최종 모형으로 선택한다. 제안된 알고리즘을 평가하기 위하여, 내재적 모형 및 내재적 시계열의 종류에 따른 시뮬레이션 및 실증 분석을 수행하고 예측력을 ARIMA 모형과 비교한다. 예측 성능 평가 결과, 계수형 시계열 분석에서 ARIMA 모형에 비해 시계열 일반화 선형 모형의 예측 성능이 우수함을 확인할 수 있다. 또한 실증분석으로서, 살인사건 발생 건수의 예측결과 ARIMA 모형보다 중기 및 장기 예측에서 우수한 성능을 나타내는 것을 확인할 수 있다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we study an algorithm that automatically determines the orders of past observations and conditional mean values that play an important role in count time series models. Based on the orders of the ARIMA model, the algorithm constitutes the order candidates group for time series general...

주제어

표/그림 (13)

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 유사한 방법을 통해 모형의 차수를 결정하는 ARIMA 모형의 경우 자동화 차수 결정 알고리즘이 이미 존재하지만 차분의 개념과 계절형 승법 구조를 시계열 일반화선형 모형에 그대로 반영하기 어려워 ARIMA 모형의 차수 결정을 바로 이용할 수 없다. 따라서 본 논문에서는 이를 고려하여 시계열 일반화 선형 모형의 차수 후보군을 만들고, 후보군의 조합을 이용하여 적합한 모형 중 AIC가 가장 작은 모형을 최종 모형으로 선택하는 ARIMA 모형 차수 결정에 기반한 자동 차수 결정 알고리즘을 고안하였다.
  • 먼저, 시계열 일반화 선형 모형의 차수에 따른 자기상관함수와 편자기상관함수(partial ACF; PACF)의 특징을 살펴보기 위해 대표적인 차수에 의해 생성된 계수형 자료의 자기상관함수와 편자기상관함수 그 림을 살펴보고자 한다. 그리고, 이것을 ARIMA 모형의 차수에 따른 형태와 비교한다.
  • 본 논문에서는 R 패키지 tscount (Liboschik 등, 2017)의 tsglm 함수에 의하여 계산되는 정보량 기준값(Akaike information criterion; AIC)을 이용하여 차수 결정 자동화 알고리즘을 고안한다. 참고로 tsglm 함수에서 차수 P 와 Q에 해당하는 인자는 각각 past obs과 past mean이다.
  • 본 논문에서는 계수형 시계열 자료에 대하여 포아송 또는 음이항 분포를 가정하는 시계열 일반화 선형 모형에 대해 소개하고 모형에 사용되는 차수를 자동으로 결정하는 자동화 알고리즘을 제안하고 있다. 또한, 제안한 자동화 차수 결정 알고리즘을 이용하여 시뮬레이션을 통한 시계열 일반화 선형 모형과 ARIMA 모형의 예측 성능을 비교하고, 실증분석으로 국내 살인 사건 발생 건수에 대하여 분석하였다.
  • 일반적으로 관측치의 값이 큰 경우, 중심극한정리(central limit theorem)에 의하여 경험적 분포의 형태는 대칭적이며 정규 분포에 가까워지는 경향이 있다. 즉, 시계열의 평균이 큰 경우 계수형 시계열 자료 분석에 ARIMA 모형도 사용 가능하며 이 경우 일반화 선형 모형이 ARIMA 모형에 비해 좋은 성능을 갖는지 살펴보고자 한다. 이를 위하여 내재적 프로세스(underlying or true process)의 평균의 크기를 µ = 10, 40, 100, 200으로 다르게 설정하여 각각 N = 100개의 관측치를 생성하였다.
  • 추가적으로 일반화 선형모형의 분포와 연결함수를 다르게 설정한 경우에도 ARIMA 모형에 비해 좋은 예측 성능을 갖는지 살펴보고자 한다. 2가지 분포(포아송, 음이항)와 2가지 연결함수(항등, 로그)의 조합에 관계없이 모두 Table 3.

가설 설정

  • 내재적 모형(underlying or true model)을 시계열 일반화 선형 모형으로 가정하여, past obs 차수만 있거나 past obs과 past mean 차수가 모두 있는 다음 의 6가지 모형들을 고려하였다.
  • 시계열 일반화 선형 모형에서 과거의 정보 F t−1 에 대하여 Y t 의 분포는 포아송 분포 또는 음이항 분포를 가정한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
계수형 시계열 자료란? 예를 들면, 월별 승합차 운전자의 사상자 수, 주별 자동차 서비스 부품의 재고량, 일별 말라리아 감염 환자 수 등 다양한 분야에서 횟수로 구성된 시계열자료를 접할 수 있다. 이와 같이 일정한 시간 간격 동안 발생하는 사건의 수에 관련된 시계열 자료를 계수형 시계열 자료(count time series)라고 한다. 계수형 시계열 자료의 가장 큰 특징은 음이 아닌 정수의 값(non-negative integer value)을 갖는다는 것이다.
계수형 시계열 모형에 대한 가장 편리하고 유연한 접근 방법은? 계수형 시계열의 모형은 관측치가 음수가 아닌 정수임을 고려해야 하며, 관측치 사이의 의존성을 적절히 포착해야 한다. 가장 편리하고 유연한 접근 방법은, Fahrmeir과 Tutz (2001, 6장) 그리고 Kedem과 Fokianos (2002, 1-4장)가 제안한 과거 정보에 대한 관측치를 조건부로 모형화하기 위해 일반화 선형 모형(generalized linear model; GLM)을 사용하는 것이다. 이 모형은 계수형 자료에 대한 적절한 분포와 연결 함수를 선택하여 사용한다.
ARIMA 모형의 표본 공간은? 일반적으로 편향된 자료에 대해 로그 변환을 한 후 정규분포 가정을 하는 경우도 있지만 0을 많이 포함하고 있는 계수형 시계열 자료인 경우에는 적용이 어렵다. 둘째, ARIMA 모형의 표본 공간은(−∞, ∞)의 범위를 갖는 실수(real-valued)이다. 즉, 계수형 시계열 자료에 ARIMA 모형을 적용할 경우 이산형(discrete) 표본 공간의 특성이 고려되지 않는다.
질의응답 정보가 도움이 되었나요?

참고문헌 (12)

  1. Christou, V. and Fokianos, K. (2014). Quasi-likelihood inference for negative binomial time series models, Journal of Time Series Analysis, 35, 55-78. 

  2. Doukhan, P., Fokianos, K., and Tjostheim, D. (2012). On weak dependence conditions for Poisson autoregressions, Statistics & Probability Letters, 82, 942-948. 

  3. Fahrmeir, L. and Tutz, G. (2001). Multivariate Statistical Modelling based on Generalized Linear Models (2nd ed), Springer, New York. 

  4. Ferland, R., Latour, A., and Oraichi, D. (2006). Integer-valued GARCH process, Journal of Time Series Analysis, 27, 923-942. 

  5. Fokianos, K., Rahbek, A., and Tjostheim, D. (2009). Poisson autoregression, Journal of the American Statistical Association, 104, 1430-1439. 

  6. Fokianos, K. and Tjostheim, D. (2011). Log-linear Poisson autoregression, Journal of Multivariate Analysis, 102, 563-578. 

  7. Hyndman, R. J. and Khandakar, Y. (2008). Automatic time series forecasting: the forecast package for R, Monash Econometrics and Business Statistics Working Papers 6/07, Monash University, Department of Econometrics and Business Statistics. 

  8. Hyndman, R. (2017). Forecast: forecasting functions for time series and linear models, R package version 8.2. 

  9. Kedem, B. and Fokianos, K. (2002). Regression Models for Time Series Analysis, John Wiley & Sons, Chichester. 

  10. Liboschik, T., Fokianos, K., and Fried, R. (2017). tscount: An R package for analysis of count time series following generalized linear models, Journal of Statistical Software, 82, 1-51. 

  11. Tjostheim, D. (2015). Count time series with observation-driven autoregressive parameter dynamics, Handbook of Discrete-Valued Time Series, Handbooks of Modern Statistical Methods, 77-100. 

  12. Weiss, C. H. (2008). Thinning operations for modeling time series of counts-a survey, AStA Advances in Statistical Analysis, 92, 319. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로