$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

개인정보유출 사고의 분포 추정에 관한 연구
A Study on the Distribution Estimation of Personal Data Leak Incidents 원문보기

情報保護學會論文誌 = Journal of the Korea Institute of Information Security and Cryptology, v.26 no.3, 2016년, pp.799 - 808  

황윤희 (상명대학교) ,  유진호 (상명대학교)

초록
AI-Helper 아이콘AI-Helper

본 논문은 국내 개인정보유출사고 발생의 패턴을 찾고 어떤 분포를 따르는지 확인한 연구이다. 이를 위해 2011년도부터 2014년도까지 언론에 보도된 개인정보유출사고를 사용하였다. 조사결과를 바탕으로 'K-S통계량' 방법론을 사용하여 개인정보유출사고의 통계적 분포를 추정하였고, 적합도 검정을 실시하였다. 그 결과 '유의수준 95%에서 포아송분포와 지수분포 모두 높은 적합도를 지닌다.'는 사실을 정략적으로 입증하였고, 이를 통해 1년에 평균 12번씩 대형 개인정보유출사고가 발생되어 언론에 보도되었다는 것을 확인할 수 있었다. 본 연구는 향후 기업 및 조직의 개인정보 유출사고의 발생예측 및 정보보호 투자금액선정 등 보안경제성 분석에 유용하게 활용될 것으로 전망된다.

Abstract AI-Helper 아이콘AI-Helper

To find the pattern of personal data leak incidents and confirm which distribution is suitable for, this paper searched the personal data leak incidents reported by the media from 2011 to 2014. Based on result, this research estimated the statistical distribution using the 'K-S Statistics' and teste...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

문제 정의

  • 개인정보유출의 발생빈도가 포아송분포를 따르는 것으로 검증되었기 때문에 사고발생간격은 지수분포를 따른다는 것을 실증적으로 검증하고자 한다.
  • 또한 시뮬레이션을 통한 ‘K-S 통계량’ 검증을 통해 모델의 적합성을 수치뿐만 아니라 시각적으로 확인하고자 한다.
  • 본 논문은 개인정보유출사고 발생관련 실증적 데이터에 대한 정량적 확률분포 추정을 시도하였고 개인정보유출 사고 발생을 설명해주는 가장 유사한 통계적 분포를 찾고자 하였다.
  • 본 논문은 선행연구를 더욱 발전시켜 개인정보유출사고에 적용하고자 ‘x2 적합도 검정’을 통해 최적의 분포를 정량적으로 입증하고자 한다.
  • 본 연구는 개인정보유출 사고발생의 패턴과 이에 대한 통계적 분포를 추정하려 한다. 이를 위해 관측 데이터와 기존 이론상의 7가지 누적분포를 비교한 후, 가장 작은 유사성 차이(Similarity Gap)값을 갖는 누적분포의 종류를 식별하고자 한다.
  • 본 연구에서는 개인정보유출사고 발생시기의 통계적 분포를 추정하고자 다음의 가설을 설정하였다.
  • 본 연구에서는 개인정보유출사고에 초점을 맞춰 ‘K-S 통계량’ 방법론과 ‘카이제곱 적합도 검정’을 통해 가장 적합한 누적분포함수를 찾고자 한다.
  • 일반적으로 관측 데이터는 가장 높은 확률을 나타내는 평균과 분산 등의 가치에 대한 분포를 찾아내는 것이 분포 추정의 원리이다[3]. 이 원리에 따라 관측 데이터를 정형화된 누적분포함수(Cumulative Distribution Functions, CDF)와 비교해 어떠한 분포를 따르는지 추정하고자 한다.
  • 본 연구는 관측데이터가 2011년도부터 2014년도까지의 4개년의 데이터에 한정되어 있다는 한계점을 지닌다. 이러한 데이터 부족의 한계점을 극복하기 위해 관련데이터의 양을 증가시키고 더욱 정교화 하고자 한다. 향후 본 연구는 2015년의 개인정보유출사고 데이터를 확보하여 연구모델의 예측 검증력을 평가하고자 한다.

가설 설정

  • H′0: 개인정보유출 사고발생의 시간간격은 지수분포를 따를 것이다.
  • H′1: 개인정보유출 사고발생의 시간간격은 지수분포를 따르지 않을 것이다.
  • H0: 개인정보유출 사고의 평균 발생 수는 포아송분포를 따를 것이다.
  • H1: 개인정보유출 사고의 평균 발생 수는 포아송분포를 따르지 않을 것이다.
  • 이 값은 X2분포표에 의해 유의수준 95%의 기각 값인 #보다 훨씬 작으므로 포아송분포를 따른다고 할 수 있다. 즉, 일정기간 동안의 개인정보유출 사고발생 수는 유의수준 5%에서 포아송분포를 따르므로, 귀무가설 H0를 채택한다.
본문요약 정보가 도움이 되었나요?

참고문헌 (16)

  1. Cha Jae Bok, "Gamma distribution," 2013. 10.10 http://ktword.co.kr/abbr_view.php?m_temp14413 

  2. David Vose, Quantitative Risk Analysis : A Guide to Monte Carlo Simulation Modelling, John Wiley & Sons, 605 Third Avenue, New York, NY 10158-0012, USA, pp.126-132, 1996. 

  3. David Vose, "Fitting Distributions to Dat a and why you are probably doing it wrong," 2010.02.15, http://www.vosesoftware.com/whitepapers/Fitting%20distributions%20to%20data.pdf. 

  4. Jeong-Bin Yim and Won-Jae Yang, "Estimating Cumulative Distribution Funtions with Maximum Likelihood to Sample Data Sets of a Sea Floater Model," Journal of Navigation and Port Research, 37(5), pp.453-461, Oct. 2013. 

  5. Jun Chang Hyun and Yoo Chul Sang, "Application of the Beta Distribution for the Temporal Quantification of Storm Events," Journal of Korean Water Resources Association, 45(6), pp.531-544. Mar. 2015. 

  6. Kim Jin Ho, Kim Hyeong Seok and Cho Sung Ho(2013), "A Ranging Algorithm for IR-UWB in Multi-Path Environment Using Gamma Distribution," The Journal of Korea Information and Communications Society, 38B(2), pp. 146-153, Feb. 2013. 

  7. Kim Phillip, Ahn Soyeon, Jeon Hyesung, Lee Jae Kwan, Park Sunghyun, Chang Seoil, Park Ilgun, Jung Changu and Kwon Segon, "Classification Accuracy Test of Hearing Laboratory Test Models for Railway Noise at Station Platform," Trans. Korean Soc. Noise Vib. Eng., 25(4), pp.299-305, Mar. 2015. 

  8. KISA, Information Security Survey, "Insurance and Reporting against Security Incidents", pp.26, Dec, 2010. 

  9. Korea Insurance Development Institute, CEO Report, "Activation Methods of Private Information Liability Insurance", CR 2012-04, pp.11, Dec. 2012. 

  10. Lee Jung Hoon, "Goodness of Fit for Probability Model," Master's Degree Thesis, Semyung University, Aug. 2004. 

  11. MATLAB(2008a), Programming, MATLAB Version 7.6 (R2008a). 

  12. Ministry of Science, ICT, and Future Planning, The Study of Broadcasting and Communications Policy, "A Study on Estimating Economic Damages from Internet Incidents for Cybersecurity Insurance", 13-Jinheong-098, pp.66, Nov. 2013. 

  13. Riddhi D., "Beta Function and its Applications," Department of Physics and Astron omy, The University of Tennessee, 2008.1 0.27, http://sces.phys.utk.edu/-moreo/mm08/Riddi.pdf. 

  14. Song Mi Kyung and Jung In Kyung, "Comparison of Goodness-of-Fit Tests using Grouping Strategies for Multinational Logit Regression Model," The Korean Journal of Applied Statistics, 26(6), pp.889-902, Oct. 2013. 

  15. Wikipedia, Tutorial for Poisson distribution, 2016.04.24, https://en.wikipedia.org/wiki/Poisson_distribution. 

  16. Wikipedia(2015), Tutorial for Exponential distribution, 2016.03.17, https://en.wikipedia.org/wiki/Exponential_distribution. 

저자의 다른 논문 :

관련 콘텐츠

오픈액세스(OA) 유형

FREE

Free Access. 출판사/학술단체 등이 허락한 무료 공개 사이트를 통해 자유로운 이용이 가능한 논문

저작권 관리 안내
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로