$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

초록
AI-Helper 아이콘AI-Helper

최근 네트워크 기술 발전과 함께 IoT소셜 네트워크 서비스의 활성화로 인해 많은 그래프 스트림 데이터가 생성되고 있다. 이와 같은 그래프 스트림에서 객체들 사이의 관계가 동적으로 변화함에 따라 그래프의 변화를 탐지하거나 분석하기 위한 연구들이 진행되고 있다. 본 논문에서는 그래프 스트림에서 이전 슬라이딩 윈도우에서 검출한 빈발 패턴에 대한 정보를 이용해 빈발 패턴을 점진적으로 검출하는 기법을 제안한다. 제안하는 기법은 이전 슬라이딩 윈도우에서 검출된 패턴이 앞으로 몇 슬라이딩 윈도우동안 빈발할지 또는 빈발하지 않을지를 계산하여 빈발 패턴 관리 테이블에 저장한다. 그리고 이 값을 통해 다음 슬라이딩 윈도우에서는 필요한 계산만 수행함으로써 전체 연산량을 감소시킨다. 또한 패턴 간에 간선을 통해 연결되어있는 것만 하나의 패턴으로 인식함으로써 더 유의미한 패턴만을 검출한다. 본 논문에서는 제안하는 기법의 우수함을 보이기 위해 여러 성능 평가를 진행하였다. 그래프 데이터의 크기가 커지고 슬라이딩 윈도우의 크기가 커질수록 중복되는 데이터가 증가되기 때문에 기존 기법보다 빠른 처리 속도를 나타낸다.

Abstract AI-Helper 아이콘AI-Helper

Recently, with the advancement of network technologies, and the activation of IoT and social network services, many graph stream data have been generated. As the relationship between objects in the graph streams changes dynamically, studies have been conducting to detect or analyze the change of the...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 본 논문에서는 그래프 스트림에서 빈발 패턴 검출을 위한 점진적인 처리 기법을 제안하였다. 이렇게 함으로써 기존의 기법보다 빠르게 빈발 패턴 검출이 가능하기 때문에 더 많은 양의 데이터에 대해 분석이 가능하다.
  • 본 논문에서는 실시간으로 입력되는 그래프 스트림 데이터에서 점진적으로 빈발 패턴을 검출하는 기법을 제안한다. 제안하는 기법은 윈도우가 이동할 때 이전 윈도우에서 분석한 결과를 재사용하여 연산량을 감소시킨다.
  • 정확성 알고리즘은 모든 빈발 패턴을 정확하게 검출해 내는 것을 목적으로 한다. 따라서 유사 알고리즘에 비해 느리게 검출하지만 정확한 빈발 패턴만을 검출한 다.

가설 설정

  • 따라서 어느 정도 데이터가 입력되었을 때, 분석한 후 삭제하여 메모리를 확보해야 다음에 입력될 데이터에서 분석이 가능하다. 두 번째는 시간에 따라 입력되는 데이터가 다르다는 점이다. 즉, 현재의 빈발 패턴이 나중엔 빈발 패턴이 아닐 수 있고, 그 반대의 경우도 발생한다.
  • slideNum은 FiS가 threshold 보다 클 때와 작을 때의 경우로 나누어 계산한다. 먼저 클 때에는 BatchCount 에 현재 슬라이딩 윈도우에서 가장 처음 배치를 삭제했을 때 남은 수를 계산하고 그 다음 새로 입력되는 배치가 모두 0이라고 가정하여 threshold를 넘는지 확인한다. 이 과정을 반복하여 몇 회 반복했을 때 BatchCount 가 threshold보다 작아지는지 계산하여 결과를 반환한다.
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
빈발 패턴 검출의 활용의 예로는 무엇이 있는가? 빈발 패턴 검출은 그래프 스트 림에서 자주 사용되는 분석 기법 중 하나로 특정 기간 동안 자주 발생한 서브그래프를 검출하는 방법이다 [9-12]. 예를 들어, 스마트 팩토리에서는 고장 예측을 위해 전조 현상들에 대한 패턴을 감지한다. 소셜 네트 워크에서는 사용자간에 친밀 관계를 분석하기 위해서 사용자들 사이에 정보 교류 패턴을 판별한다[13].
FP-Streaming (Frequent Pattern-Streaming)기법이 제안된 이유는 무엇인가? 최근 그래프 스트림에서 빈발 패턴 검출에 대한 활용이 증감됨에 따라 다양한 연구가 활발히 진행되고 있다 [9-17]. [9]에서는 시간에 따라 입력되는 데이터의 양이 달라지는 것을 해결하기 위해 FP-Streaming (Frequent Pattern-Streaming)기법을 제안하였다. [10] 에서는 그래프 스트림을 DSTree (Data Stream Tree) 라는 구조를 제안함으로써, 빈발 패턴 검출을 할 때 효율적으로 데이터를 메모리에 저장한다.
빈발 패턴 검출이란 무엇인가? 그래프에서 객체들 사이의 관계가 동적으로 변화함에 따라 그래프의 변화를 탐지하거나 분석하기 위한 연구들이 진행되고 있다. 빈발 패턴 검출은 그래프 스트 림에서 자주 사용되는 분석 기법 중 하나로 특정 기간 동안 자주 발생한 서브그래프를 검출하는 방법이다 [9-12]. 예를 들어, 스마트 팩토리에서는 고장 예측을 위해 전조 현상들에 대한 패턴을 감지한다.
질의응답 정보가 도움이 되었나요?

참고문헌 (17)

  1. 임종태, 복경수, 유재수, "대용량 그래프 환경에서 스카이라인을 이용한 서브 그래프 유사도 측정 기법," 한국콘텐츠학회 종합학술대회, pp.47-48, 2017. 

  2. 유병국, 김순홍, "소셜네트워크 분석을 통한 마케팅 전략," 한국콘텐츠학회논문지, 제13권, 제5호, pp.396-407, 2013. 

  3. A. Cuzzocrea, F. Furfaro, G. M. Mazzeo, and D. Sacca, "A grid framework for approximate aggregate query answering on summarized sensor network readings," Proc. OTM Workshops, pp.144-153, 2004. 

  4. A. Fariha, C. F. Ahmed, C. K. Leung, S. M. Abdullah, and L. Cao, "Mining frequent patterns from human interactions in meetings using directed acyclic graphs," Proc. Pacific-Asia Conference on Knowledge Discovery and Data Mining, Springer, pp.38-49, 2013. 

  5. F. Jiang and C. K. Leung, "Mining interesting "following" patterns from social networks," Proc. International Conference on Data Warehousing and Knowledge Discovery, Springer, pp.308-319, 2014. 

  6. S. K. Tanbeer, F. Jiang, C. K. Leung, R. K. MacKinnon, and I. J. M. Medina, "Finding groups of friends who are significant across multiple domains in social networks," Proc. International Conference on Computational Aspects of Social Networks, pp.21-26, 2013. 

  7. 한진수, 조중권, 최도진, 임종태, 복경수, 유재수, "부하 분산을 위한 정점 절단 기반의 그래프 스트림 분할 기법," 한국정보과학회 학술발표논문, pp.206-208, 2017. 

  8. 강필성, "사물인터넷과 빅데이터 분석 기반의 스마트공장 구현 사례 및 시사점," 한국정보화진흥원, Near & Future, Vol.20, pp.25-35, 2016. 

  9. C. Giannella, J. Han, J. Pei, X. Yan, and P. S. Yu, "Mining frequent patterns in data streams at multiple time granularities," Next generation data mining, pp.191-212, 2003. 

  10. C. K. Leung and Q. I. Khan, "DSTree: A Tree Structure for the Mining of Frequent Sets from Data Streams," Proc. International Conference on Data Mining, pp.928-932, 2006. 

  11. P. Braun, J. J. Cameron, A. Cuzzocrea, F. Jiang, and C. K. Leung, "Effectively and Efficiently Mining Frequent Patterns from Dense Graph Streams on Disk," Proc. International Conference in Knowledge Based and Intelligent Information and Engineering Systems, pp.338-347, 2014. 

  12. A. Cuzzocrea, Z. Han, F. Jiang, C. K. Leung, and H. Zhang, "Edge-based Mining of Frequent Subgraphs from Graph Streams," International Conference in Knowledge Based and Intelligent Information and Engineering Systems, pp.573-582, 2015. 

  13. S. K. Tanbeer, C. K. Leung, and J. J. Cameron, "Interactive Mining of Strong Friends from Social Networks and its Applications in E-Commerce," Journal of Organizational Computing and Electronic Commerce, Vol.24, No.2-3, pp.157-173, 2014. 

  14. 서복일, 김재인, 황부현, "스트림 데이터 환경에서 배치 가중치를 이용하여 사용자 특성을 반영한 빈발항목 집합 탐사," 한국콘텐츠학회논문지, 제11권, 제1호, pp.56-64, 2011. 

  15. C. C. Aggarwal, Y. Li, P. S. Yu, and R. Jin, "On dense pattern mining in graph streams," Proceedings of the VLDB Endowment, Vol.3, No.1-2, pp.975-984, 2010. 

  16. A. Bifet, G. Holmes, B. Pfahringer, and R. Gavalda, "Mining frequent closed graphs on evolving data streams," Proc. ACM SIGKDD international conference on Knowledge discovery and data mining, pp.591-599, 2011. 

  17. E. Valari, M. Kontaki, and A. N. Papadopoulos, "Discovery of top-k dense subgraphs in dynamic graph collections," Proc. International Conference on Scientific and Statistical Database Management, Springer, pp.213-230, 2012. 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로