$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

데이터 마이닝을 이용한 무선 인터넷 서비스 분류기법
Wireless Internet Service Classification using Data Mining 원문보기

정보과학회논문지. Journal of KIISE. 정보통신, v.36 no.3, 2009년, pp.153 - 162  

이성진 (한양대학교 전자컴퓨터통신공학부) ,  송종우 (이화여자대학교 통계학과) ,  안수한 (서울시립대학교 통계학과) ,  원유집 (한양대학교 전자컴퓨터통신공학부) ,  장재성

초록
AI-Helper 아이콘AI-Helper

오늘 날 다양한 플랫폼을 기반으로 한 무선 네트워크 위에 실행되고 있는 수 많은 응용 프로그램은 서비스 운영자 입장에서 정확히 분류해내는 것은 중요하다. 이 연구는 WiBro 상용망에서 임의로 생성한 트래픽 데이터에서 다양한 응용프로그램들을 분류하는 것을 목적으로 한다. 분류기를 개발하는데 있어서 기존에 Flow기반으로 분류를 하는 대신 세션이라는 단위로 실험을 진행하였다. 이 단위를 사용하여 두 가지 분류 기법을 사용하였다. Classification and Regression Tree와 Support Vector Machine. 각 판별기는 생성된 변수들을 기반으로 판별을 시도하였을 때 CART의 경우 0.85%, SVM의 경우 0.94%의 오차를 보여 우수한 성능을 보였지만, 판별기의 구현과 결과 해석이 용이한 CART를 이용하여 판별시스템을 구축하는 것이 유리함을 보였다.

Abstract AI-Helper 아이콘AI-Helper

It is a challenging work for service operators to accurately classify different services, which runs on various wireless networks based upon numerous platforms. This works focuses on design and implementation of a classifier, which accurately classifies applications, which are captured horn WiBro Ne...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 이 기법은 모든 패킷들을 직접 분석하여 분류를 하는 방식이기 때문에 시스템 자원을 많이 소모하는 가장 큰 단점이 있다. 본 연구에서는 데이터 마이닝 기법을 이용하여 WiBro 무선망에서의 서비스별 트래픽 패턴의 분류를 하고자 한다. 모든 서비스들은 실시간성이나 신뢰성의 보장과 같이 다른 요구 조건들을 갖고 있다.
  • 본 연구에서는 서비스 분류를 위하여 세션 단위의 트래픽 분류를 시도하였고, CART와 SVM을 이용한 트래픽 판별 함수를 개발하여 성능 검증을 하였다. 두 종류의 다른 판별 함수의 오판별율은 CART가 0.
  • 더 나아가 서비스 및 네트워크 개발 시 필요한 네트워크 시뮬레이션과 사용자의 과금 체계를 위한 기초 자료를 제공할 수 있다. 연구에서는 세션 단위 트래픽의 서비스 별 성공적인 판별 가능성을 보여줬다. 그러나 본 연구에서 사용된 트래픽 자료는 실제 네트워크에서 고객들에 의해 생성된 트래픽이 아닌 기획된 트래픽 임을 간과해서는 안된다.
  • 2에서 정의되었다. 본 연구에서의 목적은 무선망에서 수집된 세션을 보고 이 세션이 어떠한 응용 프로그램에 해당하는지 판별할 수 있는 판별함수를 만드는 것이다. 따라서 본 연구에서는 제공받은 패킷 자료를 이용하여 세션을 구성하고 구성된 세션으로부터 여러 가지 통계량, 즉, 하나의 세션에 포함된 패킷 수, 세션 의 지속시간, 패킷들의 크기에 대한 평균, 표준편차, 변동계수 패킷간 도착 간격에 대한 평균, 표준편차, 세션을 이루는 업링크, 다운링크 패킷간의 통계량의 비율 등의 변수를 생성하였으며 이들을 판별분석에 이용하였다.
  • 데이터의 설명 변수들을 이용하여 오차가 최소가 되도록 하는데 분할 반복 횟수는 미리 정해논 최소 문턱값이 될 때까지 반복한다, 최소문턱 값까지 반복하여 더 나눌 수 없을 때 각 터미널노드에 놓안 변수들이 적합하게 분류가 되었다고 한다. 방법의 목적은 분할을 한 결과드이 서로 동차가 되도록 만드는 것이다.
본문요약 정보가 도움이 되었나요?

참고문헌 (42)

  1. D. Halma, V. Sandrinc, and R. David. "A markovian signature- based approach to IP traffic classification," in Proceedings of the 3rd annual ACM, workshop on Mining network data. San Diego, California, ACM: 2007 

  2. C. Manuel, D. :Maurizio, G. Francesco, and S. Luca, "Traffic classification through simple statistical fingerprinting," SIGCMM Comput. Commuln. Rev., Vol.37, pp. 5-16, 2007 

  3. V. Paxson, "Bro: a system for detecting network intruders in real-time," pp. 3-3, 1998 

  4. M. Roesch, "Snort: Lightweight Intrusion Detection for Networks." 

  5. L. Breiman, Classification and Regression Trees: Chapman &: Hall/CRC. 1998 

  6. T. Hastie, R Tibshirani. and J. H. Friedman, The Elements of Statistical Learning: Springer, 2001 

  7. N. Cristianini and J. Shawe-Taylor, An Introduction to Support Vector Machines: Cambridge University Press, 2000 

  8. E. Jeffrey, A. Martin, and M. Anirban, "Traffic classification using clustering algorithms," in Proceedings of the 2006 SIGCOMM workshop on Mining network data, Pisa, Italy: ACM, 2006 

  9. W. M. Andrew and Z. Denis, "Internet traffic classification using bayesian analysis techniques," in Proceedings of the 2005 ACM SIGMETRICS international conference on Measurement and modeling of computer systems Banff, Alberta, Canada: ACM. 2005 

  10. W. Nigel, Z. Sebastian, and A. Grenville, "A preliminary performance comparison of five machine learning algorithms for practical IP traffic Flow 

  11. H. Patrick, S. Subhabrata, S. Oliver, and W. Dongmei, "ACAS: automated construction of application signatures," in Proceeding of the 2005 ACH SIGCOMM workshop on Mining network data, Philadelphia, Pennsylvania, USA: ACM, 2005 

  12. X. Kuai, Z. ZhiLi. and B. Supratik "Profiling internet backbone traffic: behavior models and applications," in Proceedings of the 2005 conference on Applications. technologies, architectures. and protocols for computer communications Philadelphia, Pennsylvania, USA: ACM, 2005 

  13. M. Roughan, S. Sen, O. Spatscheck, and N. Duffield, "Class of Service Mapping for QoS: A Statistical Signature based Approach to IP Traffic classification," in IMC'04 Taormina. Sicily', Italy, 2004 

  14. K. Thomas. P. Konstantina. and F. Michalis, "BLIINC multilevel traffic classification in the dark" SIGCOMM Comput. Commun. Rev., VoI.35, pp. 229-240 ,2005 

  15. E. Jeffrey, ;\1. Anirban, and A. Martin, "Byte me: a case for byte accuracy in traffic classification," in Proceedings of the 3rd annual ACM workshop on AIilllng network data San Diego, California, USA: ACM, 2007 

  16. E. T. David, "Survey and taxonomy of packet classification techniques," ACM Comput. Surv., Vol.37, pp. 238-275, 2005 

  17. http://www.tcpdump.org/, TCPDump/LIBPCAP Public Repository 

  18. http://www.wireshark.org/, WireShark-Network Protocol Analyzer 

  19. http::h,YWw.xtoc.com, V/ebHard Service Company 

  20. http://www..netfolder.co.kr/, NetFolder 

  21. http://koongpa.nexon.com/, 3D Online Action Game 

  22. htt://www·.maplestory.com/. IHMORPG Game 

  23. http://ucc.daum.net/, Daum UCC 

  24. http//www.youtube.com. YouTube. 

  25. http//radio.shs.co.kr, SBS PM Radio 

  26. P. Gill, M. Arlitt, Z. Li, and A. Mahanti, "Youtube traffic characterization: a view from the edge," pp.15-28, 2007 

  27. M. Cha, H. Kwak, P. Rodriguez, Y. Ahn, and S. Moon, "I tube, you tube, everyhody tubes: analyzing the world's largest user generated content 

  28. http//www.skype.com. SkyPe 

  29. http//nateonweh.nate.com/en/, NateOn Messenger 

  30. D. Bonfiglio, M. Mellia, M. Meo, D. Rossi. and P. Tofanelli, "Revealing skype traffic: when randorness plays with you," pp. 37-48, 2007 

  31. http//www.naver.com. Naver 

  32. http//www.daum.net. Daum 

  33. http://www.empas.com. Empas. 

  34. D. Tang and M. Baker, "Analysis of a local-area wireless network," pp.1-10, 2000 

  35. H. Kang, M. Kim, and J. Hong, "Streaming Media and Multimedia Conferencing Traffic Analysis Using Payload Examination," ETRI Journal, Vol.26, pp. 203-217, 2004 

  36. A. Lakhina, K. Papagiannaki, M. Crovella, C. Diot. L Kolaczyk, and N. Taft, "Structural analysis of net work traffic flows," pp, 61-72, 2004, 

  37. X. Li, F. Bian, M. Crovella, C. Diot, R. Govindan, G. Iannaccone, and A. Lakhina, "Detection and identification of network anomalies using sketch subspaces," pp. 147-152, 2006 

  38. S. Zander, T. Nguyen, and G. Armitage:, "Selflearning IP Traffic Classification based on Statistical Flow Characteristics," 2005 

  39. R. Lewis, "An Introduction to Classification and Regression Tree (CART) Analysis," pp 1-14 2000 

  40. c. Burges, "A Tutorial on Support Vector Machines for Pattern Recognition," Data Mining and Knowledge Discovery, Vol 2, pp. 121-167, 1998 

  41. K Duan, S. Keerthi, and A. Poo, "Evaluation of simple perioI1'JlaJ1ce measures for tuning SVM hypeparameters," Neurocomputing, Vol.51 , pp. 41-59, 

  42. http://www.r-project.org, The R Project for Statistical Computing 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로