$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

시계열자료의 효율적 군집분석을 위한 구간특징화와 계층적 베이지안 기법의 융합
A Fusion of the Period Characterized and Hierarchical Bayesian Techniques for Efficient Cluster Analysis of Time Series Data 원문보기

디지털융복합연구 = Journal of digital convergence, v.13 no.7, 2015년, pp.169 - 175  

정영애 (선문대학교 IT학부) ,  전진호 (가톨릭관동대학교 경영학과)

초록
AI-Helper 아이콘AI-Helper

주가지표처럼 동적이며 시간흐름을 따르는 시계열자료들을 이해하는 효과적인 방법은 주어진 시계열자료들에 대하여 모델을 결정함으로서 이해하는 것이 좋다. 주어진 자료들에 대한 모델 결정과정은 수집되어진 대용량 시계열자료 전체를 한 번에 다 살펴보는 것보다 자료를 특정의 중요한 몇 개의 하위그룹으로 군집화하여 각 군집별 모델결정을 통해 자료 전체를 이해하는 것이 효율적이다. 본 연구에서는 주어진 시계열자료들에 대하여 하위그룹으로의 효율적 군집화 과정 그리고 각 군집별 모델결정의 두 과정 중 첫 번째 과정인 하위집단으로 군집화 과정에 자료의 구간특징화 기법과 휴리스틱 베이지안기법의 융합을 이용하여 시간 및 계산비용을 감소시킬 수 있는 기법을 제안하였으며 실제적인 주가지표를 이용한 실험을 통해 제안하는 기법의 유효성을 확인하였다.

Abstract AI-Helper 아이콘AI-Helper

An effective way to understand the dynamic and time series that follows the passage of time, as valuation is to establish a model to analyze the phenomena of the system. Model of the decision process is efficient clustering information of the total mass of the time series data of the relevant popula...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 시계열자료의 군집과정에서 시간 및 계산비용의 절감을 위하여 구간특징화를 이용한 베이지안 군집과정을 제안하였다.
  • 본 연구에서 제안하는 구간특징화를 이용한 계층적 베이지안 군집기법이 효율적인 군집을 추정하는지 실험을 통하여 살펴본다. 실험을 위한 자료길이는 매해 1월 2일을 기준으로 20일, 40일, 60일로 2012년, 2013년, 2014년의 코스피(KOSPI) 종합주가지수와 업종별에서 전기전자, 제조업, 유통업의 총 네 가지의 주가 자료를 선정하였으며 수집되어진 자료를 통해 마아코프모델을 생성한 후 생성된 모델로부터 각 모델별로 실험데이터 자료를 5개체, 10개체, 15개체를 생성하였다.
  • 또 다른 기법으로서는 주어진 임계 기준값을 통하여 점진적 과정을 거쳐 가장 큰 임계값을 갖는 것을 유효한 군집 수로 결정하는 휴리스틱 기법이 있다. 본 연구에서는 시계열자료의 군집과정에 자료의 구간특징화와 마아코프체인 모델을 이용한 휴리스틱 기반의 베이지안 군집 과정을 제안한다.
  • 본 연구에서는 집단전체의 자료를 특정의 하위집단으로 군집화 과정에 있어서 시계열자료에 대하여 구간특징화와 계층적 베이지안 군집 방법을 이용하여 시간과 계산비용을 감소시킬 수 있는 효율적인 계층적 군집과정을 제안하는 것이 목적이며 다양한 경제지표 중 실제적인 주가지표를 통하여 실험하여 그 유효성을 확인하였다.

가설 설정

  • 베이지안 군집은 모델기반 군집문제를 베이지안 모델 선택의 문제형태로 바꾼 것이다. 모델기반 군집화에서 자료는 확률분포의 혼합(Mixture)에 의해 생성되어지는 것을 가정하며 혼합모델 M은 K개의 모델들에 의해 표현되고 독립 이산변수 C로 표현된다. C의 각 값인 i는 λi에 의해 모델 되어지는 군집의 수를 표현한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
시계열자료는 어떠한 것들의 집합인가? 이렇게 시간의 흐름에 의해 표현되는 자료를 수집하여 기록한 자료를 시계열자료라 한다. 즉, 시계열자료(Time Series Data)란 동적으로 변화되는 값들의 연속으로 구성된 데이터시퀀스(Data Sequence)들의 집합이다.
시계열자료들에 대한 군집기법 연구는 어떻게 세 영역으로 구분되어지는가? 시계열자료들에 대한 군집기법 연구는 일반적으로 세 영역으로 구분되어진다. 첫 번째 영역으로 자료들 사이에 유사도 또는 거리측정을 이용하는 방식으로 상관측정(Correlation Measure), 헤밍거리(Hemming Distance)[1], 스트링편집거리(String Edit Distance)[2] 및 동적시간정합(Dynamic Time Warping)[3] 등이 있다. 두 번째 영역으로는 자료들의 특징을 추출하여 이용하는 방식으로 퓨리에 기술자(Fourier Descriptor), 웨이블릿 분석(Wavlet Analysis)[4], MDL[5] 등이 있다. 세 번째 영역으로 주어진 자료들에 대하여 설명하는 모델결정의 방법으로 회귀모델, 신경망, 마아코프체인[6,7,8] 등이 있다. 회귀모델은 주로 단기간의 자료들의 분석에 이용되므로 시계열자료에 대한 유용한 해석이 쉽지 않으며 신경망은 모델의 구조가 알려져 있으나 해석을 지원하지 않아 군집 모델링에는 적합하지 않다[7]는 단점을 가지고 있다.
군집화기법의 목적은 무엇인가? 군집화기법은 이질적이며 이해하기 어려운 전체 자료 집합에 대하여 동일 군집내에서는 유사도가 크게 각 군집사이에서는 비유사도가 최대가 되도록 함으로서 전체 자료에 대하여 윤곽 파악을 쉽게 하는 것이 목적이다. 군집 기법들에 대한 연구는 계층적 기법들로부터 최적화기법들까지 다양한 영역에서 발전되어 왔다.
질의응답 정보가 도움이 되었나요?

참고문헌 (15)

  1. A. K. Jain and D. C. Dube, Algorithms for Clustering Data, Prentice Hall, 1988. 

  2. T. Okuda, E, Tanara and T. Kasai, "A Method for the Correction of Garbled Words based on the Levenshtein Metric", IEEE Transaction on Computers C25, 2, pp.172-177, 1976(2). 

  3. T. Oates, "Identifying Distinctive Subsequence in Multivariate Time Series by Clustering", Proceedings of the Sixteenth International Conference on Machine Learning, 1999. 

  4. Y. Huhtala, J. Karkkinen, H. Toivonen and N. R, "Mining for Similarity in aligned Time Series using Wavlets", Proceedings of SPIE on Data Mining and Knowledge Discover: Theory, Tools and Technology, 1999. 

  5. S. ManGanaris, "Learning to Classify Sensor Data", IJCAI'95 Workshop on Machine Learning in Engineering, 1995. 

  6. Y. Cho and G. Lee., "Modeling and Prediction of Time Seires Data based on Markov Model", The Korea Society of Computer and Information", Vol. 16, no. 2, pp. 225-233, 2011. 

  7. L. Rabiner., "A Tutorial on Hidden Markov Models and selected applications in speech recognition," Proc. of IEEE77, pp.257-286, 1989. 

  8. M. Siddiqi, J. Gordon and W. Moore., "Fast State Discovery for HMM Moel Selection and Learning," In Proc. Int'l Conference on Artificial Intelligence and Statistics, 2007. 

  9. J. Jeon., "A Study on Determining Prediction Models using Model-based Clustering of Time Series Data", Dankook Univ Ph. D, 2007. 

  10. J. Jeon and m. Kim.,"A Study of Economic Indicator Prediction Model using Dimensions Decrease Techniques and HMM",The Journal of Digital Policy & Management, Vol. 11, no 10, pp305-311. 2013. 

  11. Y. Cho and G. Lee., "Prediction on Clusters by using Information Crtterion and Multiple Seeds", The Institute of Webcasting, Internet and Telecommunication, Vol. 10, no. 6, pp 145-152, 2010. 

  12. Y. Byungki and F. Christos., "Fast Time Sequence Indexing for Arbitrary Lp norms", In The VLDB Journal, pp 385-394, 2000. 

  13. L. Jessica, K. Eamonn, L. Stefano and C. Bill., "A Symbolic Representation of Time Series, with Impliction for Streaming Algorithms", 8th ACM SIGMOD Workshop on Research Issues in DMKD, 2003. 

  14. J. Jeon and m. Kim.,"A Study of Criterion for Efficient Clustering Estimation of Temporal Data", The Institute of Webcasting, Internet and Telecommunication, Vol. 11, no. 5, pp 139-144, 2011. 

  15. J. Jeon and m. Kim.,"A Study on Prediction the Movement Pattern of Time Series Data using Information Criterion and Effective Data Length", The Institute of Webcasting, Internet and Telecommunication, Vol. 13, no. 1, pp 101-107, 2013. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로