화재를 예방하기 위해서는 그에 필요한 정책과 평가가 필요하며, 화재 발생에 대한 적절한 모니터링 기법이 있어야 한다. 이를 위해 품질관리의 기법중의 하나인 관리도를 화재 모니터링에 적용하는 연구가 진행된 바 있다. 그 결과, 통계적으로 겨울에는 많은 화재가 발생한다는 것이 증명되었고, 매년마다 어떤 주기를 띠고 변화한다는 것이 발견되었다. 그럼에도 불구하고, 여름철과 겨울철에 동일한 기준(관리한계선)을 적용할 경우 상대적으로 발생건수가 과다한 겨울에는 과도한 예방활동이 진행되고, 여름에는 잠재이상이 있는 경우에도 발생건수 감소에 따른 착시현상으로 인해 활동이 부족해질 가능성이 있다. 이때, 각 계절별로 다른 관리 한계선을 적용시킨다면 합리적인 예측과 보다 효과적인 이상 패턴의 모니터링이 가능해질 수 있다. 따라서 본 연구에서는 발생건수를 대상으로 시간에 따라 변하는 시계열 모델을 사용하여 화재발생 빈도 예측 모델계수의 체계적인 설정과정을 ARIMA 모델을 기반으로 제안하였다. 이를 바탕으로 화재발생 패턴의 개선된 분석과 이에 기반한 보다 체계적인 예방활동을 진행할 수 있을 것으로 기대한다.
화재를 예방하기 위해서는 그에 필요한 정책과 평가가 필요하며, 화재 발생에 대한 적절한 모니터링 기법이 있어야 한다. 이를 위해 품질관리의 기법중의 하나인 관리도를 화재 모니터링에 적용하는 연구가 진행된 바 있다. 그 결과, 통계적으로 겨울에는 많은 화재가 발생한다는 것이 증명되었고, 매년마다 어떤 주기를 띠고 변화한다는 것이 발견되었다. 그럼에도 불구하고, 여름철과 겨울철에 동일한 기준(관리한계선)을 적용할 경우 상대적으로 발생건수가 과다한 겨울에는 과도한 예방활동이 진행되고, 여름에는 잠재이상이 있는 경우에도 발생건수 감소에 따른 착시현상으로 인해 활동이 부족해질 가능성이 있다. 이때, 각 계절별로 다른 관리 한계선을 적용시킨다면 합리적인 예측과 보다 효과적인 이상 패턴의 모니터링이 가능해질 수 있다. 따라서 본 연구에서는 발생건수를 대상으로 시간에 따라 변하는 시계열 모델을 사용하여 화재발생 빈도 예측 모델계수의 체계적인 설정과정을 ARIMA 모델을 기반으로 제안하였다. 이를 바탕으로 화재발생 패턴의 개선된 분석과 이에 기반한 보다 체계적인 예방활동을 진행할 수 있을 것으로 기대한다.
A suitable monitoring method is necessary for successful policy implementation and its evaluation, required for effective prevention of abnormal fire occurrences. To do this, there were studies for applying control charts of quality management to fire occurrence monitoring. As a result, it was prove...
A suitable monitoring method is necessary for successful policy implementation and its evaluation, required for effective prevention of abnormal fire occurrences. To do this, there were studies for applying control charts of quality management to fire occurrence monitoring. As a result, it was proved that more fire occurs in winter and its trend moves yearly-basis with some patterns. Although it has trend, if we apply the same criteria for each time, inefficient overreacting fire prevention policy will be accomplished in winter, and deficient policy will be accomplished in summer. Thus, applying different control limits adaptively for each time would enable better forecasting and monitoring of fire occurrences. In this study, we treat fire occurrences as time series model and propose a method for configuring its coefficients with ARIMA model. Based on this, we expect to carry out advanced analysis of fire occurrences and reasonable implementation of prevention activities.
A suitable monitoring method is necessary for successful policy implementation and its evaluation, required for effective prevention of abnormal fire occurrences. To do this, there were studies for applying control charts of quality management to fire occurrence monitoring. As a result, it was proved that more fire occurs in winter and its trend moves yearly-basis with some patterns. Although it has trend, if we apply the same criteria for each time, inefficient overreacting fire prevention policy will be accomplished in winter, and deficient policy will be accomplished in summer. Thus, applying different control limits adaptively for each time would enable better forecasting and monitoring of fire occurrences. In this study, we treat fire occurrences as time series model and propose a method for configuring its coefficients with ARIMA model. Based on this, we expect to carry out advanced analysis of fire occurrences and reasonable implementation of prevention activities.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
따라서 본 연구에서는 현실적으로 화재 발생빈도를 모니터링하기 위해 화재 예측시간에 따른 변화를 반영하는 시계열 모델을 적용하는 방법을 제안하였다.
본 연구에서는 ARIMA 모델에 기반한 화재 발생 빈도 예측모델을 제안하고, 2007년~2011년의 화재 데이터로부터 2012년 화재 발생건수를 예측하는 모델의 검증과정을 통해 제안방법의 타당성을 입증하였다. 그 결과, 모델의 적절한 차수를 결정하는 것이 타당한 모델을 만드는 데 중요하며, 차수의 선정기준 중에서 결과론적인 정확도, AICc값, Ljung-Box test의 p value 및 잔차의 ACF값의 자기상관성에 대하여 전반적으로 합리적인 선택이 있어야 함을 알 수 있었다.
7에서와 같이 6월에는 관리상한선을 초과하였고, 9월에는 관리하한선을 초과하여 여름의 화재발생이 예상에서 벗어났다고 판단할 수 있었다. 추가로, 위에서 제안된 모델보다 타당한 모델이 있는지 검토하였다. 모델의 타당성을 비교하는 방법으로는, 2012년의 데이터를 검증(test) set으로 사용하여 ARIMA(p,d,q)(P,D,Q)12모델의 차수를 조정하는 방법도 있고, 더욱 낮은 AICc(Akaike information criterion with a correction for finite sample sizes)값을 가지는 모델을 채택하는 방법도 있다[11]
가설 설정
3은 화재발생 예측모델을 결정하기 위하여 2007년~2011년의 5년간 각 월의 화재 발생빈도를 나타낸 것이다. 본 연구에서는 2012년의 월별 화재발생 건수를 예측하고자 하기 때문에 월의 시간단위는 12개월을 기준으로 추세를 가지고 순환하는 시계열이므로, 12개월의 Seasonal ARIMA model, ARIMA (p,d,q)(P,D,Q)12로 가정하고, 각 상수들을 결정하였다. 이때, 이들 상수들은 시계열의 자기상관함수의 그래프를 해석하여 결정하였다.
제안 방법
기존 계수인 p, d 및 q와 계절에 따른 지연계수 P, D 및 Q를 결정하면 각 계수(∅, Φ, θ, Θ)들에 대해 시행오차를 통해 각 모델에 의한 값과 실제 값의 편차의 제곱합을 최소화 시키는 방법으로 진행한다.
또한 기존 Shewhart chart는 95% 신뢰구간을 벗어났을 때 알람을 발생시켰었는데, 제품의 규격과 다르게 화재라는 사안의 특성을 감안할 때 너무 비현실적인 값이라 생각하여 50%로 알림 경계선을 결정하였다. 그 이유는 이 시스템은 천재지변에 준하는 이상 화재발생 현상에 대해서만 사용하는 것이 아닌, 보다 넓은 범위의 화재발생 현상에 적용시키기 위한 시스템이기 때문이다.
모델의 타당성은 Fig. 5(c)와 같이 모델에 의한 예측값과 실제값과의 편차의 자기상관을 해석하기 위한 Ljung-Box test를 수행하여 어떤 달의 화재 발생건수가 다른 달과의 상관에서 얼마나 벗어났는지 판단하였다. 이때, p값이 클수록 많이 벗어남을 의미 한다.
본 연구에서는 뉴질랜드 오클랜드 대학에서 시작된 프로젝트로 개발되어 주로 경제학 방면에서 많이 사용되는 오픈소스 통계 프로그램인 R의 forecast package를 사용하여 데이터를 분석하였다[8,9]
대상 데이터
2007년 1월부터 2011년 12월까지의 전국 화재건수는 소방방재청의 NFDS에서 받은 데이터를 사용하였으며, 전국에서 발생한 2007년 1월부터 2011년 12월까지의 5년간의 월별 화재발생량의 데이터로 예측모델을 설계하여 2012년 1월부터 2012년 12월까지의 1년간의 데이터로 예측의 타당성을 평가하는데 사용하였다. 그 이유는 training set과 test set 이 서로 다른 데이터를 사용해야 하기 때문이다[10].
이론/모형
시계열을 예측하는 데에는 본 연구에 사용한 ARIMA (Autoregressive Integrated Moving Average)모델 외에도 최소자승법, 지수평활법, 회귀분석법 등이 있다[2]. 그러나 화재 발생빈도는 선형적으로 변화하는 변량이기보다는 평균이 이동하는 변화 경향을 보이는 비정상적인(nonstationary) 시계열이므로, 본 연구에서는 이러한 경우에 보다 적합하다고 판단되는 ARIMA모델을 사용하였다. ARIMA모델은 아래에 서술된 여러 가지 모델의 결합형태로 이루어졌으며, 주기성을 가진 시계열이나, 평균이 이동하는 시계열에 대해서도 적합한 모델이며, 경제지표의 분석이나 각종 제어분야에도 널리 활용되고 있다.
성능/효과
Fig. 8 및 Fig. 9는 모델의 계수를 변경하여 ARIMA(0,1,1)(0,2,1)12모델로 시도한 결과와 이것의 잔차의 자기상관함수를 도시한 것인데, 계산한 결과 AICc값은 기존 ARIMA(0,0,1)(0,1,1)12의 751.37보다 낮은 598.32를 얻을 수 있어서 더욱 좋은 모델이라고 판단하기 쉬우나, Fig. 9에서와 같이 잔류편차가 유의미한 자기상관을 가져서 좋은 모델로 보기 힘들다고 판단하였다. 이를 요약하여 정리하면 Table 2와 같다.
본 연구에서는 ARIMA 모델에 기반한 화재 발생 빈도 예측모델을 제안하고, 2007년~2011년의 화재 데이터로부터 2012년 화재 발생건수를 예측하는 모델의 검증과정을 통해 제안방법의 타당성을 입증하였다. 그 결과, 모델의 적절한 차수를 결정하는 것이 타당한 모델을 만드는 데 중요하며, 차수의 선정기준 중에서 결과론적인 정확도, AICc값, Ljung-Box test의 p value 및 잔차의 ACF값의 자기상관성에 대하여 전반적으로 합리적인 선택이 있어야 함을 알 수 있었다. 또한 ARIMA(0,1,1)(0,2,1)12모델은 ARIMA(0,0,1)(0,1,1)12모델에 비해 AICc값이 더 낮았으나, ACF의 잔차값이 자기상관성을 가져서 합리적인 모델이라고 판단할 수 없었으나, ARIMA(0,0,1)(0,1,1)12은 보다 더 합리적인 모델이라고 판단되었다.
그 결과, 모델의 적절한 차수를 결정하는 것이 타당한 모델을 만드는 데 중요하며, 차수의 선정기준 중에서 결과론적인 정확도, AICc값, Ljung-Box test의 p value 및 잔차의 ACF값의 자기상관성에 대하여 전반적으로 합리적인 선택이 있어야 함을 알 수 있었다. 또한 ARIMA(0,1,1)(0,2,1)12모델은 ARIMA(0,0,1)(0,1,1)12모델에 비해 AICc값이 더 낮았으나, ACF의 잔차값이 자기상관성을 가져서 합리적인 모델이라고 판단할 수 없었으나, ARIMA(0,0,1)(0,1,1)12은 보다 더 합리적인 모델이라고 판단되었다.
후속연구
따라서 본 논문에서 제안한 ARIMA 모델의 설계 방법에 따라 결정된 차수를 활용하여 화재 데이터를 생성된 모델에 대입하여 존재하는 시점 이후의 시간에 대하여 발생할 화재 발생 건수를 예측하고, 실제로 시간이 경과하였을 때 실제 화재 발생건수와 예측으로부터 벗어난 정도를 판단하여 보다 합당한 화재 예방활동을 수행할 정책을 수립하는데 활용될 수 있을 것으로 판단한다.
질의응답
핵심어
질문
논문에서 추출한 답변
미국과 우리나라에서 화재 발생과 피해를 감소시키기 위해 어떤 통계적 정책을 시행하고 있는가?
화재 발생과 피해를 감소시키기 위해서는 주로 통계적인 자료를 바탕으로 정책을 수립하거나 규제를 시행하는 방안이 있는데, 이를 위해 세계 각 국가에서는 발생한 각 화재의 기록들을 축적하여 이를 통계분석하고 있다. 특히, 미국에서는 1972년부터 National Fire Incident Reporting System[1]을 만들어 매년 약 백만 건에 대한 화재 통계보고서를 발표하고 있으며, 우리나라도 연간 약 4만 건의 화재사고를 국가화재정보시스템(NFDS)에 등록하고 있다.
시계열이란?
시계열은 시간에 따라 기록되는 통계변량으로, 시간별 도로의 통행량이나, 연간 무역액수 등 경제적 또는 공학적인 분야에서 흔히 사용되는 개념이다. 다른 통계변량과 다르게 시계열이 가지는 가장 큰 특징은 다른 시점에서 변량과 상관관계를 가지는 자기상관성(autocorrelation)이다.
기존 control chart는 어떤 문제점이 있는가?
즉, 화재 발생이 상대적으로 적은 여름철에는 이상을 감지하기 힘들고(false negative), 발생건수가 많은 겨울철에는 잘못된 이상을 감지하는 오류 (false positive)를 갖고 있다. 즉, Shewhart chart를 비롯한 기존 control chart들은 과거의 변량과 상관 성(자기상관성)을 가지는 변수를 모니터링 하는 경우 공정의 정상성(stationarity) 여부와 표준편차와 같은 통계적 변량의 비합리성과 같은 몇 가지 문제점이 있다. 이것은 화재 발생빈도가 항상 일정한 값을 유지해야 하는 데이터가 아니며, 자기상관성을 가지는 시계열 데이터이기 때문이다.
참고문헌 (11)
National Fire Incident Reporting System, Retrieved from http://www.dfs.dps.mo.gov/documents/nfirs-reference-guide.pdf
Justin, J. P., Spatial and Temporal Patterns of Forest Fire Activity in Canada, M.S. Thesis, University of Toronto, (2001)
Joo, K. D., A Study on a Real-time Detection and Monitoring System for Abnormal Fire Occurrences Based on Big Data Mining, M.S. Thesis, Myongji University, (2012)
Apley, D. W. and Lee, H. C., "Robustness Comparison of Exponentially Weighted Moving-Average Charts on Autocorrelated Data and on Residuals," Journal of Quality Technology, 40(4), 428-447, (2008)
Song, D. W., Predicting the Risk of Fire Occurrence according to the Weather Information using Statistics and Data Mining Techniques, Ph.D Thesis, Seoul National University of Science and Technology, (2014)
Himmelblau, D. M., Fault Detection and Diagnosis in Chemical and Petrochemical Processes, Elsevier, pp.127-116, (1978)
Box, George E. P., Time Series Analysis, Wiley, (2008)
Hyndman, R. J., Forecasting Functions for Time Series and Linear Models, Retrieved from http://cran.r-project.org/web/packages/forecast/index.html, (2015)
Hyndman, R. J. and Khandakar, Y., "Automatic Time Series Forecasting: The forecast package for R", Journal of Statistical Software, 27(3), 1-22, (2008)
Witten, I. A. Data mining, Elsevier, pp.148, (2011)
Lim, W. C., "Reliability-Based Design Optimization Using Akaike Information Criterion for Discrete Information", Transactions of the Korean Society of Mechanical Engineers A, 36(8), 921-927, (2012)
※ AI-Helper는 부적절한 답변을 할 수 있습니다.