$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

벌점-최소제곱법을 이용한 다중 변화점 탐색
Detection of multiple change points using penalized least square methods: a comparative study between ℓ0 and ℓ1 penalty 원문보기

응용통계연구 = The Korean journal of applied statistics, v.29 no.6, 2016년, pp.1147 - 1154  

손원 (서울대학교 통계학과) ,  임요한 (서울대학교 통계학과) ,  유동현 (계명대학교 통계학과)

초록
AI-Helper 아이콘AI-Helper

본 연구에서는 다중 변화점 탐색과 관련하여 최근 많은 관심을 받고 있는 ${\ell}_0$-벌점 최소제곱법과 fused-라쏘-회귀(fused lasso regression; FLR)방법을 모의 실험을 통하여 비교하였다. 모의 실험의 결과로 FLR방법은 비-변화점을 변화점으로 잘못 탐색하는 경향이 ${\ell}_0$-벌점 최소제곱법과 비교할 때 상대적으로 높게 나타났으며 ${\ell}_0$-벌점 최소제곱법이 전반적으로 FLR방법에 비하여 좋은 성능을 보였다. 더불어 ${\ell}_0$-벌점 최소제곱법은 동적프로그래밍을 통하여 FLR 방법과 유사하게 효율적인 계산이 가능하다.

Abstract AI-Helper 아이콘AI-Helper

In this paper, we numerically compare two penalized least square methods, the ${\ell}_0$-penalized method and the fused lasso regression (FLR, ${\ell}_1$ penalization), in finding multiple change points of a signal. We find that the ${\ell}_0$-penalized method perfor...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 변화점의 위치와 수준을 추정하는 문제, 특히 최근 통계학 분야에서 많은 관심을 받고 있는 벌점 최소제곱법을 이용한 변화점의 추정 방법들을 살펴보고자 한다. 먼저 우리가 다루고자 하는 자료와 이에 대한 통계적 모형을 살펴보면 다음과 같다.
  • 본 논문에서는 의미의 명확성과 명칭의 편의성을 위하여 “FLR”이라는 약어를 사용하고자 한다.
  • 본 연구에서는 ℓ0와 ℓ1-벌점 최소제곱법을 이용한 다중-변화점 탐색에 대하여 살펴보았다. ℓ1-벌점 최소제곱법(또는 FLR)은 최근 많은 관심을 받고 있으며 다양한 분야에 적용, 활용되고 있으나 변화점 탐색에 있어서는 특정한 상황 하에서 점근적 일치성을 보장하지 못하는 단점이 있다.
  • 2)의 문제는 좋은 계층적 구조를 지니고 있어 동적프로그래밍(dynamic programming)방법을 이용하여 빠른 계산이 가능함이 알려져 있다. 본 연구에서는 다중-변화점 탐색의 관점에서 FLR과 ℓ0-벌점 최소제곱법의 성능을 수치적 실험을 통하여 비교함을 목적으로 하며, 특히 변화점 탐색의 성능 측면에서 ℓ0-벌점 최소제곱법의 우월성을 이야기하고자 한다.
  • 본 절에서는 모의 실험을 통하여 ℓ0-벌점과 FLR의 다중-변화점 탐색의 성능을 비교하고자 한다. 모의 실험에서는 길이가 100인 관측 값 Y = (Y1, Y2, .

가설 설정

  • 관측값 y1, . . . , yn들이 서로 독립이고 동일한 분포를 따르는(IID) 확률분포로부터 추출되었고 확률밀도함수가 시점 t = 1, . . . , n에 대해 f(yt; θt)로 정의됨을 가정한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
변화점과 관련한 연구에서 주요 관심 분야는 크게 어떻게 구분되는가? 변화점은 연속적으로 관측되는 확률과정의 분포적 성질에 급격한 변화가 발생하는 점으로 지진파를 이용한 지진의 예측, 경제 시계열에 있어서 추세 변동점 탐지, 그리고 생산 공정의 안정적인 관리 등 다양한 분야에 있어 중요한 연구 주제이다 (Kotz 등, 2006). 이러한 변화점과 관련한 연구에서 주요 관심 분야로는 크게 (1) 변화점의 실시간 탐색(on-line detection of a change), (2) 변화점 존재 여부에 대한 검정(off-line hypotheses test), 그리고 (3) 변화점의 위치와 수준에 대한 추정(off-line estimation of the change)로 구분되어진다 (Basseville와 Nikiforov, 1993). 이러한 변화점과 관련한 연구를 위하여 각 목적에 따라 다양한 방법이 제시되었고 몇 가지 대표적 방법들로는 우도비(likelihood ratio)를 이용한 방법, 정보량기준(information criteria)을 이용한 방법, 마코프-몬테칼로에 기반한 베이지안 방법(Bayesian method), 자료의 누적합(cumulative sum; CUSUM)을 이용한 방법, 웨이블렛 근사법(wavelets approximation) 등이 있다.
변화점이란? 변화점은 연속적으로 관측되는 확률과정의 분포적 성질에 급격한 변화가 발생하는 점으로 지진파를 이용한 지진의 예측, 경제 시계열에 있어서 추세 변동점 탐지, 그리고 생산 공정의 안정적인 관리 등 다양한 분야에 있어 중요한 연구 주제이다 (Kotz 등, 2006). 이러한 변화점과 관련한 연구에서 주요 관심 분야로는 크게 (1) 변화점의 실시간 탐색(on-line detection of a change), (2) 변화점 존재 여부에 대한 검정(off-line hypotheses test), 그리고 (3) 변화점의 위치와 수준에 대한 추정(off-line estimation of the change)로 구분되어진다 (Basseville와 Nikiforov, 1993).
ℓ0-벌점 최소제곱법은 복잡도-벌점의 계산이 조합적 최적화 문제를 풀어야 하는 문제점을 가지고 있는데, 이를 해결하는 방법은? 하지만 Lim 등 (2012)와 Johnson (2013)에서 연구 된 것처럼 위의 식 (1.2)의 문제는 좋은 계층적 구조를 지니고 있어 동적프로그래밍(dynamic programming)방법을 이용하여 빠른 계산이 가능함이 알려져 있다. 본 연구에서는 다중-변화점 탐색의 관점에서 FLR과 ℓ0-벌점 최소제곱법의 성능을 수치적 실험을 통하여 비교함을 목적으로 하며, 특히 변화점 탐색의 성능 측면에서 ℓ0-벌점 최소제곱법의 우월성을 이야기하고자 한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (19)

  1. Basseville, M. and Nikiforov, I. V. (1993). Detection of Abrupt Changes: Theory and Application (Vol. 104), Prentice Hall, Englewood Cliffs. 

  2. Carlstein, E., Muller, H.-G., and Siegmund, D. (1994). Change-point Problems, Institute of Mathematical Statistics, California. 

  3. Chen, J. and Gupta, A. K. (2001). On change point detection and estimation. Communications in Statistics-Simulation and Computation, 30, 665-697. 

  4. Csorgo, M. and Horvath, L. (1997). Limit Theorems in Change-Point Analysis, John Wiley & Sons, New York. 

  5. Harchaoui, Z. and Levy-Leduc, C. (2010). Multiple change-point estimation with a total variation penalty. Journal of the American Statistical Association, 105, 1480-1493. 

  6. Jang, W., Lim, J., Lazar, N. A., Loh, J. M., and Yu, D. (2015). Some properties of generalized fused lasso and its applications to high dimensional data. Journal of the Korean Statistical Society, 44, 352-365. 

  7. Johnson, N. A. (2013). A dynamic programming algorithm for the fused Lasso and $L_0$ -segmentation. Journal of Computational and Graphical Statistics, 22, 246-260. 

  8. Kotz, S., Read, C. B., Balakrishnan, N., Vidakovic, B., and Johnson, N. L. (Eds.) (2006). Encyclopedia of Statistical Sciences (2nd ed.), John Wiley & Sons, NJ. 

  9. Lim, E., Hahn, K. S., Lim, J., Kim, M., Park, J., and Yoon, J. (2012). Statistical properties of news coverage data. Communications for Statistical Applications and Methods, 19, 771-780. 

  10. Lin, K., Sharpnack, J., Rinaldo, A., and Tibshirani, R. J. (2016). Approximate recovery in changepoint Problems, from $\ell$ 2 estimation error rates, arXiv preprint, arXiv:1606.06746. 

  11. Qian, J. and Jia, J. (2016). On stepwise pattern recovery of the fused Lasso. Computational Statistics and Data Analysis, 94, 221-237. 

  12. Rinaldo, A. (2009). Properties and refinements of the fused lasso. The Annals of Statistics, 37, 2922-2952. 

  13. Rojas, C. R. and Wahlberg, B. (2015). How to monitor and mitigate stair-casing in L1 trend filtering, arXiv preprint, arXiv:1412.0607v1. 

  14. Tibshirani, R., Saunders, M., Rosset, S., Zhu, J., and Knight, K. (2005). Sparsity and smoothness via the fused lasso. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 67, 91-108. 

  15. Tibshirani, R. and Wang, P. (2008). Spatial smoothing and hot spot detection for CGH data using the fused lasso. Biostatistics, 9, 18-29. 

  16. Ye, G.-B. and Xie, X. (2011). Split Bregman method for large scale fused Lasso. Computational Statistics and Data Analysis, 55, 1552-1569. 

  17. Yu, D., Won, J., Lee, T., Lim, J., and Yoon, S. (2015a). High-dimensional fused lasso regression using majorization-minimization and parallel processing. Journal of Computational and Graphical Statistics, 24, 121-153. 

  18. Yu, D., Lee, S. J., Lee, W. J., Kim, S. C., Lim, J., and Kwon, S. W. (2015b). Classification of spectral data using fused lasso logistic regression. Chemometrics and Intelligent Laboratory Systems, 142, 70-77. 

  19. Zhao, P. and Yu, B. (2006). On model selection consistency of Lasso. Journal of Machine Learning Research, 7, 2541-2563. 

저자의 다른 논문 :

LOADING...

관련 콘텐츠

오픈액세스(OA) 유형

GOLD

오픈액세스 학술지에 출판된 논문

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로