$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

시계열 데이터베이스에서 단일 색인을 사용한 정규화 변환 지원 서브시퀀스 매칭
A Single Index Approach for Subsequence Matching that Supports Normalization Transform in Time-Series Databases 원문보기

정보처리학회논문지. The KIPS transactions. Part D. Part D, v.13D no.4 = no.107, 2006년, pp.513 - 524  

문양세 (강원대학교 IT특성화대학 컴퓨터학부) ,  김진호 (강원대학교 IT특성화대학 컴퓨터학부) ,  노웅기 (한국과학기술원 전자전산학과)

초록
AI-Helper 아이콘AI-Helper

정규화 변환은 시계열 시퀀스를 구성하는 엔트리들의 전체적인 패턴을 분석하는데 매우 유용하다. 본 논문에서는 단일 색인을 사용한 정규화 변환 지원 서브시퀀스 매칭 방법을 제안한다. 기존의 정규화 변환 지원 서브시퀀스 매칭 방법은 다양한 길이의 질의 시퀀스를 지원하기 위하여 여러 개의 색인을 생성해야 하고, 이에 따라 색인 저장 공간의 오버헤드와 색인 관리의 오버헤드가 발생한다. 본 논문에서는 하나의 색인을 사용하면서도 다양한 길이의 질의 시퀀스에 대한 정규화 변환을 지원하는 효율적인 서브시퀀스 매칭 방법을 제안한다. 이를 위하여, 우선 정규화 변환을 일반화한 포함-정규화 변환(inclusion-normalization transform) 개념을 제시한다. 포함 정규화 변환이란 색인에 저장할 윈도우에 대해서 해당 윈도우를 포함하는 서브시퀀스의 평균과 표준편차로 정규화하는 것으로서, 기본적인 정규화 변환을 윈도우 및 서브시퀀스 개념을 사용하여 확장한 것이다. 다음으로, 포함-정규화 변환을 기존 서브시퀀스 매칭 연구에 적용하기 위한 이론적 근거를 정리로서 제시하고 증명한다. 그리고, 이 방안을 구현하기 위한 색인 구성 알고리즘 및 서브시퀀스 매칭 알고리즘을 각각 제시한다. 실제 주식 데이터에 대한 실험 결과, 제안한 방법은 기존 방법에 비해 최대 $2.5{\sim}2.8$배까지 성능을 향상 시킨 것으로 나타났다. 본 논문에서 제안한 정규화 변환 지원 서브시퀀스 매칭은 정규화 변환 이외의 다른 변환을 지원하는 서브시퀀스 매칭으로 일반화 될 수 있다. 따라서, 제안한 방법은 정규화 변환을 포함하는 많은 다른 종류의 변환을 지원하는 서브시퀀스 매칭에 폭넓게 적용될 수 있는 좋은 연구결과라 사료된다.

Abstract AI-Helper 아이콘AI-Helper

Normalization transform is very useful for finding the overall trend of the time-series data since it enables finding sequences with similar fluctuation patterns. The previous subsequence matching method with normalization transform, however, would incur index overhead both in storage space and in u...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 즉, 데이터 시퀀스 S를 나눈 윈도우 S[a:切에 대해서, S[a:b]를 포함하는 모든 가능한 서브시퀀스 S[订]를 사용하여 정규화 변환하고 관리 하는 과정이 필요하다. 따라서, 본 논문에서는 윈도우가 주 어졌을 때, 해당 윈도우를 포함하는 서브시퀀스로 정규화하는 포함-정규화 변환을 정의하고, 이를 사용하여 정규화 변 환 서브시퀀스 매칭을 수행하는 방법을 제안한다.
  • 본 논문에서는 서브시퀀스 매칭에서 정규화 변환을 지원하는 유사 시퀀스 모델[9]을 다룬다. 즉, 질의 시퀀스 Q와 데이터 서브시퀀스 S[订]의 거리를 비교하는 것이 아니라, 이들 을 정규화 변환한 이후의 두 시퀀스 Q와 范31의 거리를 비교하여, 변환된 두 시퀀스가 b매치하는지의 여부를 판단 하는 유사 시퀀스 모델을 다룬다.
  • 서브시퀀스 매칭은 전체 매칭을 일반화한 것으로, 보다 많은 응용 분야를 가진 다[6, 8-11, 16], 그리고, 유클리디안 거리 함수가 갖는 문제점을 보완하기 위하여, 정규화(normalization)!, 15], 이동 평균(moving average)[8, 15], 쉬프팅 및 스케일링(shifting & scaling)[2, 5, 14], 타임 워핑 (time warping)[7, 13, 17] 등의 많은 변환 기법이 사용되었다. 본 논문에서는 이 중 정규 화 변환을 지원하는 유사 시퀀스 매칭 문제를 다룬다. 정규 화 변환(normalization transform)■$: 시퀀스 엔트리들의 평 균과 표준편차를 구한 후, 각 엔트리에서 평균을 빼고 표준 편차로 나누는 변환이다.
  • 본 논문에서는 하나의 색인을 사용하면서도 다양한 길이 의 질의 시퀀스에 대한 정규화 변환 서브시퀀스 매칭을 효 율적으로 수행하는 새로운 접근법을 제안한다. 이를 위해 우선, 윈도우 S[a:切에 대해서, S[a-b] 자체의 평균과 표준편 차가 아닌 £[a:b]를 포함하는 서브시퀀스 S[;:j](( < a < b < “의 평균과 표준편차로 정규화하는 포함-정규화 변환 (inclusion-normalization transform) 개념을 제시한다.
  • 본 논문에서는 하나의 색인을 사용하여 정규화 변환 서브 시퀀스 매칭을 효율적으로 수행하는 새로운 접근법을 제안 하였다. 기존의 정규화 변환 서브시퀀스 매칭은 여러 색인 의 생성에 따른 색인 공간의 오버헤드와 색인 관리의 오버 헤드가 발생하는 문제점이 있다.
  • 또한, 질의 시퀀스 길이가 윈도우 크기 보다 큰 일부 경우에 대해서는 색인을 사용하 지 못하고 순차 스캔을 해야 하는 경우도 발생한다. 이를 해결하기 위하여, 본 논문에서 우선 정규화 변환을 일반화 하여 포함-정규화 변환 개념을 제안하였다. 그리고, 포함-정 규화 변환을 사용하면, 하나의 색인을 사용해서도 다양한 길이의 질의 시퀀스에 대해 효율적인 정규화 변환 서브시퀀 스 매칭을 수행할 수 있음을 보였다.

가설 설정

  • [정리 1] 데이터 시퀀스 S의 서브시퀀스 SI上/]를 정규화 변환한 即侦]와 질의 시퀀스 Q를 정규화 변환한 Q가 e-매치한다면, 적어도 하나 이상의 0의 k 번째 디스조인트 윈도우 砂 와 : j] 에 포함된 슬라이딩 윈도우 S|, ;)1[i + (/c-l)-<o:i + Jr-ffl-l] 7} e/而-매치한다. 여기에서, isksp 이고, p = W〃(Q)/이 이다.
본문요약 정보가 도움이 되었나요?

참고문헌 (17)

  1. Agrawal, R., Faloutsos, C., and Swami, A., 'Efficient Similarity Search in Sequence Databases,' In Proc. the 4th Int'l Conf. on Foundations of Data Organization and Algorithms, Chicago, Illinois, pp.69-84, Oct., 1993 

  2. Agrawal, R., Lin, K.-I., Sawhney, H. S., and Shim, K., 'Fast Similarity Search in the Presence of Noise, Scaling, and Translation in Time-Series Databases,' In Proc. the 21st Int'l Conf. on Very Large Data Bases, Zurich, Switzerland, pp.490-501, Sept., 1995 

  3. Beckmann, N., Kriegel, H.-P., Schneider, R., and Seeger, B., 'The R*-tree: An Efficient and Robust Access Method for Points and Rectangles,' In Proc. Int'l Conf. on Management of Data, ACM SIGMOD, Atlantic City, New Jersey, pp.322-331, May, 1990 

  4. Chan, K.-P., Fu, A. W. C., and Yu, C. T., 'Haar Wavelets for Efficient Similarity Search of Time-Series: With and Without Time Warping,' IEEE Trans. on Knowledge and Data Engineering, Vol.15, No.3, pp.686-705, Jan./Feb., 2003 

  5. Chu, K. W. and Wong, M. H., 'Fast Time-Series Searching with Scaling and Shifting,' In Proc. the 15th ACM SIGACT-SIGMOD-SIGART Symposium on Principles of Database Systems, Philadelphia, Pennsylvania, pp.237-248, June, 1999 

  6. Faloutsos, C., Ranganathan, M., and Manolopoulos, Y., 'Fast Subsequence Matching in Time-Series Databases,' In Proc. Int'l Conf. on Management of Data, ACM SIGMOD, Minneapolis, Minnesota, pp.419-429, May, 1994 

  7. Kim, S.-W., Park, S, and Chu, W. W., 'Efficient Processing of Similarity Search Under Time Warping in Sequence Databases: An Index-based Approach,' Information Systems, Vol.29, No.5, pp.405-420, July 2004 

  8. Loh, W.-K., Kim, S-W., and Whang, K.-Y., 'Index Interpolation: A Subsequence Matching Algorithm Supporting Moving Average Transform of Arbitrary Order in Time-Series Databases,' IEICE Transactions on Information and Systems, Vol.E84-D, No.1, pp.76-86, 2000 

  9. Loh, W.-K., Kim, S.-W., and Whang, K.-Y., 'A Subsequence Matching Algorithm that Supports Normalization Transform in Time-Series Databases,' Data Mining and Knowledge Discovery, Vol.9, No.1, pp.5-28, July, 2004 

  10. Moon, Y.-S., Whang, K. Y., and Loh, W.-K., 'Duality-Based Subsequence Matching in Time-Series Databases,' In Proc. the 17th Int'l Conf. on Data Engineering (ICDE), IEEE, Heidelberg, Germany, pp.263-272, April, 2001 

  11. Moon, Y.-S., Whang, K. Y., and Han, W.-S., 'General Match: A Subsequence Matching Method in Time-Series Databases Based on Generalized Windows,' In Proc. Int'l Conf. on Management of Data, ACM SIGMOD, Madison, Wisconsin, pp.382-393, June, 2002 

  12. Oppenheim, A. V. and Schafer, R. W., Digital Signal Processing, Prentice-Hall, 1975 

  13. Park, S., Chu, W. W., Yoon, J., and Won, J., 'Similarity Search of Time-Warped Subsequences via a Suffix Tree,' Information Systems, Vol.28, No.7, pp.867-883, Oct., 2003 

  14. Rafiei, D., 'On Similarity-Based Queries for Time Series Data,' In Proc. the 15th Int'l Conf. on Data Engineering(ICDE), IEEE, Sydney, Australia, pp.410-417, Feb., 1999 

  15. Rafiei, D., and Mendelzon, A. O., 'Querying Time Series Data Based on Similarity,' IEEE Trans. on Knowledge and Data Engineering, Vol.12, No.5, pp.675-693, Sept./Oct., 2000 

  16. Wu, H., Salzberg, B., and Zhang, D., 'Online Event-driven Subsequence Matching Over Financial Data Streams,' In Proc. of Int'l Conf. on Management of Data, ACM SIGMOD, Paris, France, pp.23-34, June, 2004 

  17. Yi, B.-K., Jagadish, H. V., and Faloutsos, C., 'Efficient Retrieval of Similar Time Sequences Under Time Warping,' In Proc. the 14th Int'l Conf. on Data Engineering(ICDE), IEEE, Orlando, Florida, pp.201-208, Feb., 1998 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

BRONZE

출판사/학술단체 등이 한시적으로 특별한 프로모션 또는 일정기간 경과 후 접근을 허용하여, 출판사/학술단체 등의 사이트에서 이용 가능한 논문

섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로