$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

[국내논문] 이상탐지 기반의 효율적인 시계열 유사도 측정 및 순위화
Efficient Time-Series Similarity Measurement and Ranking Based on Anomaly Detection

Journal of Internet Computing and Services = 인터넷정보학회논문지, v.25 no.2, 2024년, pp.39 - 47  

최지현 (Department of Information and Communication, Hanshin University) ,  안현 (Department of Information and Communication, Hanshin University)

초록
AI-Helper 아이콘AI-Helper

시계열 분석은 시간 순서로 정렬된 데이터로부터 다양한 정보와 인사이트를 발견하기 위한 방법으로 많은 조직에서 비즈니스 문제 해결을 위해 적용하고 있다. 그중에서 시계열 유사도 측정은 패턴이 비슷한 시계열들을 식별하기 위한 단계로서 시계열 검색 및 군집화와 같은 시계열 분석 응용에서 매우 중요하다. 본 연구에서는 전체 시계열이 아닌 이상치들을 중심으로 시계열 유사도 측정을 계산 효율적으로 수행하는 방법을 제안한다. 이와 관련하여 이상탐지를 통해 추출된 서브시퀀스 집합에 대한 유사도 측정 결과와 시계열 전체에 대한 유사도 측정 결과 사이의 순위 상관관계를 측정 및 분석하여 제안 방법을 검증한다. 실험 결과로써, 주식 종목 시계열 데이터에 이상치 비율 10% 을 적용한 유사도 측정으로부터 최대 0.9 이상의 스피어만 순위 상관계수를 확인하였다. 결론적으로 제안 방법을 통해 시계열 유사도 측정에 소요되는 계산량을 유의미하게 절감하는 동시에 신뢰 가능한 시계열 검색 및 군집화 결과를 기대할 수 있다.

Abstract AI-Helper 아이콘AI-Helper

Time series analysis is widely employed by many organizations to solve business problems, as it extracts various information and insights from chronologically ordered data. Among its applications, measuring time series similarity is a step to identify time series with similar patterns, which is very...

Keyword

표/그림 (9)

AI 본문요약
AI-Helper 아이콘 AI-Helper

문제 정의

  • 본 논문에서는 이상탐지 기법에 의해 추출된 서브시퀀스 집합을 대상으로 시계열 유사도를 효율적으로 측정하는 방법을 제안한다. 이상치는 일반적인 데이터 패턴에서 벗어난 값으로서 제거의 대상으로 고려되지만, 본 연구에서는 시계열들을 구별하기 위한 효과적인 특징으로서 활용한다.

가설 설정

  • 이상치는 일반적인 데이터 패턴에서 벗어난 값으로서 제거의 대상으로 고려되지만, 본 연구에서는 시계열들을 구별하기 위한 효과적인 특징으로서 활용한다. 즉, 이상탐지에 의해 식별된 서브시퀀스 집합에 해당되는 데이터 패턴이 시계열별로 유의미한 차이를 가진다는 것이 본 연구의 주요한 가정이다. 제안 방법은 선택된 기준 시계열의 이상치들에 해당되는 서브시퀀스 집합을 추출하여, 이들을 비교 대상 시계열들과 일대다(one-to-many) 방식으로 유사도를 측정한다.
본문요약 정보가 도움이 되었나요?

참고문헌 (17)

  1. Cleveland, R. B., Cleveland, W. S., McRae, J. E., and?Terpenning, I., "STL: A seasonal-trend decomposition,"?Journal of Official Statistics, Vol. 6, No. 1, pp. 3-73,?1990.?https://www.math.unm.edu/~lil/Stat581/STL 

  2. Chen, L. and Ng, R., "On the marriage of lp-norms?and edit distance," Proceedings of the Thirtieth?International Conference on Very Large Data Bases,?Vol. 30, pp. 792-803, 2004.?https://dl.acm.org/doi/10.5555/1316689.1316758 

  3. Muller, M., Information Retrieval for Music and?Motion, pp. 69-84, Springer, 2007.?https://doi.org/10.1007/978-3-540-74048-3_4 

  4. Keogh, E., Chakrabarti, K., Pazzani, M., and Mehrotra,?S., "Dimensionality reduction for fast similarity search?in large time series databases," Knowledge and?Information Systems, Vol. 3, pp. 263-286, 2001.?https://doi.org/10.1007/PL00011669 

  5. Lin, J., Keogh, E., Lonardi, S., and Chiu, B., "A?symbolic representation of time series, with?implications for streaming algorithms," Proceedings of?the 8th ACM SIGMOD Workshop on Research Issues?in Data Mining and Knowledge Discovery, pp. 2-11,?2003. https://doi.org/10.1145/882082.882086 

  6. Hirschberg, D. S., "A linear space algorithm for?computing maximal common subsequences," Communications?of the ACM, Vol. 18, No. 6, pp. 341-343, 1975.?https://doi.org/10.1145/360825.360861 

  7. Vlachos, M., Kollios, G. and Gunopulos, D.,?"Discovering similar multidimensional trajectories,"?Proceedings 18th International Conference on Data?Engineering, pp. 673-684, 2002.?https://doi.org/10.1109/ICDE.2002.994784 

  8. Khan, R., et al., "LCSS-based algorithm for computing?multivariate data set similarity: A case study of?real-time WSN data," Sensors, Vol. 19, No. 1, p. 166,?2019.?https://doi.org/10.3390/s19010166 

  9. Latecki, L. J., et al., "Elastic partial matching of time?series," Knowledge Discovery in Databases: PKDD?2005: 9th European Conference on Principles and?Practice of Knowledge Discovery in Databases, pp.?577-584, 2005.?https://doi.org/10.1007/11564126_60 

  10. Liu, F. T., Ting, K. M., and Zhou, Z. H., "Isolation?forest," 2008 Eighth IEEE International Conference on?Data Mining, pp. 413-422, 2008.?https://doi.org/10.1109/ICDM.2008.17 

  11. Yin, C., Zhang, S., Wang, J., and Xiong, N. N.,?"Anomaly detection based on convolutional recurrent?autoencoder for IoT time series," IEEE Transactions on?Systems, Man, and Cybernetics: Systems, Vol. 52, No.?1, pp. 112-122, 2020.?https://doi.org/10.1109/TSMC.2020.2968516 

  12. Pearson, K., "LIII. On lines and planes of closest fit to?systems of points in space," The London, Edinburgh,?and Dublin Philosophical Magazine and Journal of?Science, Vol. 2, No. 11, pp. 559-572, 1901.?https://doi.org/10.1080/14786440109462720 

  13. Salvador, S. and Chan, P., "Toward accurate dynamic?time warping in linear time and space," Intelligent Data?Analysis, Vol. 11, No. 5, pp. 561-580, 2007.?https://doi.org/10.3233/IDA-2007-11508 

  14. Finance Data Reader, GitHub, Available online?(accessed on 29 January 2024).?https://github.com/FinanceData/FinanceDataReader 

  15. Wang, X., Yang, K., and Liu, T., "Stock price?prediction based on morphological similarity clustering?and hierarchical temporal memory," IEEE Access, Vol.?9, pp. 67241-67248, 2021.?https://doi.org/10.1109/ACCESS.2021.3077004 

  16. Li, Y., et al., "Human activity recognition based on?multienvironment sensor data," Information Fusion,?Vol. 91, pp. 47-63, 2023.?https://doi.org/10.1016/j.inffus.2022.10.015 

  17. Makridakis, S., Spiliotis, E., and Assimakopoulos, V.,?"The M4 Competition: 100,000 time series and 61?forecasting methods," International Journal of?Forecasting, Vol. 36, No. 1, pp. 54-74, 2020.?https://doi.org/10.1016/j.ijforecast.2019.04.014 

활용도 분석정보

상세보기
다운로드
내보내기

활용도 Top5 논문

해당 논문의 주제분야에서 활용도가 높은 상위 5개 콘텐츠를 보여줍니다.
더보기 버튼을 클릭하시면 더 많은 관련자료를 살펴볼 수 있습니다.

관련 콘텐츠

이 논문과 함께 이용한 콘텐츠

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로