도시가스 배관은 지중에 매설되어 있기 때문에 세부 관리가 어렵고 다양한 위험에 노출되어 있다. 본 연구에서는 도시가스 배관압력 실시간 데이터를 분석해 배관압력 이상을 예측하고 전문가의 의사결정을 돕는 모델을 제안한다. 국내 도시가스 공급업체들 중 하나인 중부도시가스사의 정압기에서 수집하는 실시간 배관압력 데이터와 시간변수, 외부환경변수를 통합해 분석 데이터로 사용한다. 아산시와 천안시에 위치하는 11개 정압기를 분석 대상으로 하며 분 단위 배관압력 예측모델을 구현한다. Random forest, support vector regression(SVR), long-short term memory(LSTM)알고리즘을 사용해 회귀모델을 구현한 결과 LSTM 모델에서 우수한 성능을 보인다. 아산시 배관압력 예측모델의 경우 LSTM 모델에서 RMSE가 0.011, MAPE가 0.494이며, 천안시 배관압력 예측모델의 경우 LSTM 모델에서 평균제곱근오차(root mean square error, RMSE)가 0.015, 절대평균백분율오차(mean absolute percentage error, MAPE)가 0.668로 가장 낮은 오류율을 보인다.
도시가스 배관은 지중에 매설되어 있기 때문에 세부 관리가 어렵고 다양한 위험에 노출되어 있다. 본 연구에서는 도시가스 배관압력 실시간 데이터를 분석해 배관압력 이상을 예측하고 전문가의 의사결정을 돕는 모델을 제안한다. 국내 도시가스 공급업체들 중 하나인 중부도시가스사의 정압기에서 수집하는 실시간 배관압력 데이터와 시간변수, 외부환경변수를 통합해 분석 데이터로 사용한다. 아산시와 천안시에 위치하는 11개 정압기를 분석 대상으로 하며 분 단위 배관압력 예측모델을 구현한다. Random forest, support vector regression(SVR), long-short term memory(LSTM) 알고리즘을 사용해 회귀모델을 구현한 결과 LSTM 모델에서 우수한 성능을 보인다. 아산시 배관압력 예측모델의 경우 LSTM 모델에서 RMSE가 0.011, MAPE가 0.494이며, 천안시 배관압력 예측모델의 경우 LSTM 모델에서 평균제곱근오차(root mean square error, RMSE)가 0.015, 절대평균백분율오차(mean absolute percentage error, MAPE)가 0.668로 가장 낮은 오류율을 보인다.
City gas pipelines are buried underground. Because of this, pipeline is hard to manage, and can be easily damaged. This research proposes a real time prediction system that helps experts can make decision about pressure anomalies. The gas pipline pressure data of Jungbu City Gas Company, which is on...
City gas pipelines are buried underground. Because of this, pipeline is hard to manage, and can be easily damaged. This research proposes a real time prediction system that helps experts can make decision about pressure anomalies. The gas pipline pressure data of Jungbu City Gas Company, which is one of the domestic city gas suppliers, time variables and environment variables are analysed. In this research, regression models that predicts pipeline pressure in minutes are proposed. Random forest, support vector regression (SVR), long-short term memory (LSTM) algorithms are used to build pressure prediction models. A comparison of pressure prediction models' preformances shows that the LSTM model was the best. LSTM model for Asan-si have root mean square error (RMSE) 0.011, mean absolute percentage error (MAPE) 0.494. LSTM model for Cheonan-si have RMSE 0.015, MAPE 0.668.
City gas pipelines are buried underground. Because of this, pipeline is hard to manage, and can be easily damaged. This research proposes a real time prediction system that helps experts can make decision about pressure anomalies. The gas pipline pressure data of Jungbu City Gas Company, which is one of the domestic city gas suppliers, time variables and environment variables are analysed. In this research, regression models that predicts pipeline pressure in minutes are proposed. Random forest, support vector regression (SVR), long-short term memory (LSTM) algorithms are used to build pressure prediction models. A comparison of pressure prediction models' preformances shows that the LSTM model was the best. LSTM model for Asan-si have root mean square error (RMSE) 0.011, mean absolute percentage error (MAPE) 0.494. LSTM model for Cheonan-si have RMSE 0.015, MAPE 0.668.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
본 연구에서는 배관상태에 영향을 미치는 배관압력 예측모델을 통해 전문가의 배관관리를 돕는 모델을 제안한다. Zhang et al.
본 연구에서는 중부도시가스사의 공급권역 중 아산시와 천안시에 위치하는 정압기를 대상으로 배관압력 예측모델을 제안한다.
본 연구에서는 현재 운영하는 전기방식 시스템의 단점을 극복하기 위해 도시가스사에서 실시간으로 수집, 관리하는 배관압력 데이터를 사용해 분 단위로 배관압력을 예측하는 모델을 제안한다. Min et al.
제안 방법
LSTM은 recurrent neural networks(RNN)의 한 종류로 시계열 데이터 분석에 적합한 인공신경망이다. RNN에서 발생하는 그래디언트소실 문제(vanishing gradient problem)를 극복하기 위해 구조를 변형한 알고리즘으로 세 개의 게이트를 통해 상태정보를 제어한다. 본 연구에서는 3개의 층으로 이루어진 LSTM과 마지막에 fully connected network를 추가한 모델을 구현해 사용한다.
통합 데이터 셋에 대한 정규화 작업을 진행한다. 각 변수가 분포하고 있는 값의 범위가 모 다르기 때문에 배관압력 수치에 주는 영향을 일정하게 조정하기 위해 정규화를 진행한다. 배관압력 수치를 제외한 독립변수들에는 최대-최소 정규화(minmax scaling)를 적용한다.
최대-최소 정규화 방법을 사용하며 배관압력의 최대값과 최소값을 범위로 한다. 그리고 PCA 방법을 사용해 배관압력에 큰 영향을 미치는 주성분들을 추출해 최종 분석 데이터셋으로 도출한다.
현재 중부도시가스사에서 정압기를 통해 실시간으로 측정, 수집하고 있는 배관의 1차 압력과 2차 압력 데이터와 배관압력 데이터의 주기성을 사용하기 위해 파생한 시간변수를 사용한다. 노승철의 연구에서 제시한 도시가스 사용량에 영향을 미치는 외부환경변수를 통합 분석해 예측모델을 구현한다[18]. 본 논문에서 제안하는 모델을 통해 전문가는 배관압력을 효율적으로 관리하고 압력이상에 대비할 수 있다.
다음으로 배관압력에 큰 영향을 미치는 주요 속성을 추출하기 위해 주성분 분석(PCA)을 적용한다. PCA는 데이터 분포의 분산이 큰 축을 찾는 데이터 차원축소 방법들 중 하나이다.
배관압력 예측모델을 구현하기 위해 세 알고리즘인 random forest, SVR, LSTM을 사용하고 모델의 성능은 RMSE와 MAPE를 척도로 사용해 측정, 비교한다. 정압기 11개의 1차 압력,2차 압력에 대한 각 예측모델을 구현하고 성능을 평가한다.
통합 데이터를 분석에 사용하기 전 전처리과정을 거친다. 배관압력의 결측값과 이상값을 제거하고, 각 독립변수가 배관압력에 미치는 영향을 동일하게 조정하기 위해 정규화를 진행한다. 최대-최소 정규화 방법을 사용하며 배관압력의 최대값과 최소값을 범위로 한다.
배관운영 수치는 도시가스 수요량의 영향을 받으며 수요량에 영향을 미치는 다양한 요인들이 있다. 본 논문에서는 기상정보와 유가, 출생률을 기타요인으로 선정해 분석에 사용한다.
RNN에서 발생하는 그래디언트소실 문제(vanishing gradient problem)를 극복하기 위해 구조를 변형한 알고리즘으로 세 개의 게이트를 통해 상태정보를 제어한다. 본 연구에서는 3개의 층으로 이루어진 LSTM과 마지막에 fully connected network를 추가한 모델을 구현해 사용한다. 구조는 [Figure 2]와 같다.
배관운영 데이터는 일정 시간을 간격으로 측정된 데이터로 [Figure 3]과 같은 주기성을 가지고 있다. 본 연구에서는 데이터의 주기성을 분석에 사용하기 위해 시계열 속성을 추가해 사용한다. 사용한 시계열 속성은 이동평균(moving average, MA)과 일정 기간 전의 수치, 최대 수치, 최소 수치이다.
배관압력 예측모델을 구현하기 위해 세 알고리즘인 random forest, SVR, LSTM을 사용하고 모델의 성능은 RMSE와 MAPE를 척도로 사용해 측정, 비교한다. 정압기 11개의 1차 압력,2차 압력에 대한 각 예측모델을 구현하고 성능을 평가한다. 아산시의 6개 정압기 배관압력 예측모델은 LSTM 모델의 RMSE가 0.
이를 통해 찾은 주성분들은 데이터 분포의 특징을 가장 잘 설명할 수 있는 벡터들로, 데이터셋에서 가장 강한 특징이다. 통합 데이터 셋의 변수들 중 30개의 주성분을 추출해 배관압력 예측모델에 적용한다.
대상 데이터
외부환경변수는 도시가스 사용량에 영향을 미치는 요소들로 기상요인, 유가, 출생건수, 시간정보로 이루어져있다. 기상요인은 평균기온, 최고기온, 최저기온, 평균풍속, 강수량으로 구성되고, 시간정보는 계절, 주말, 공휴일 정보로 구성된다.
본 연구에서는 중부도시가스사의 9개 공급권역 중 천안시와 아산시에 위치하는 지역 정압기를 분석 대상으로 한다. 천안시의 5개 정압기와 아산시의 6개 정압기의 1차 압력과 2차 압력 수치로 이루어져 있으며 5초 간격으로 측정, 수집된다.
분석 데이터 셋은 아산시 6개 정압기와 천안시 5개 정압기에서 5초 단위로 측정한 1차 압력과 2차 압력 데이터와 시간변수, 외부환경변수를 통합해 구성한다. 시간변수는 배관압력의 주기성을 분석에 사용하기 위해 파생한 변수로 이동평균과 동일시점의 수치, 최대값, 최소값으로 이루어진다.
분석 데이터는 배관압력과 시간변수, 외부환경변수로 이루어진다. 배관압력 데이터는 정압기에서 수집하는 1차 압력과 2차 압력으로 4~6초 간격으로 실시간 수집된다.
배관압력 데이터는 정압기에서 수집하는 1차 압력과 2차 압력으로 4~6초 간격으로 실시간 수집된다. 중부도시가스의 공급권역 중 아산시와 천안시의 11개 정압기데이터를 사용한다. 시간변수는 배관압력의 주기성을 분석에 사용하기 위해 파생한 변수로 이동평균과 동일시점수치로 이루어져 있다.
본 연구에서는 중부도시가스사의 9개 공급권역 중 천안시와 아산시에 위치하는 지역 정압기를 분석 대상으로 한다. 천안시의 5개 정압기와 아산시의 6개 정압기의 1차 압력과 2차 압력 수치로 이루어져 있으며 5초 간격으로 측정, 수집된다.
데이터처리
그리고 회귀모델을 구현하기 위해 세 알고리즘 random forest, SVR, LSTM을 사용한다. 마지막으로 구현한 실시간 분단위 배관압력 예측모델을 통해 예측압력을 도출하고 이를 사용해 각 모델의 성능을 RMSE, MAPE 수치로 평가한다.
이론/모형
RMSE는 실제값과 예측값의 오차를 표현하는 척도로 계산방법은 식 (1)과 같다. RMSE는 데이터 수치의 크기에 영향을 받아 객관적인 평가와 현장에서 도시가스 전문가의 이해를 돕기 어렵기 때문에 본 연구에서는 MAPE를 추가로 사용한다. MAPE는 모델의 성능을 백분율로 도출해 성능을 객관적으로 평가할 수 있다.
다음으로 통합 데이터셋은 전처리 작업을 통해 예측모델 구현에 적합한 데이터 셋을 준비한다. 그리고 회귀모델을 구현하기 위해 세 알고리즘 random forest, SVR, LSTM을 사용한다. 마지막으로 구현한 실시간 분단위 배관압력 예측모델을 통해 예측압력을 도출하고 이를 사용해 각 모델의 성능을 RMSE, MAPE 수치로 평가한다.
배관압력 예측모델을 위해 random forest, support vector regression(SVR), long-short term memory(LSTM) 알고리즘을 사용한다. 모델의 성능은 평균제곱근오차(root mean square error, RMSE), 절대평균백분율오차(mean absolute percentage error, MAPE)를 척도로 사용해 평가한다[3, 20].
배관압력 예측모델을 구현하기 위해 회귀분석에 적합한 세 가지 알고리즘 random forest, SVR, LSTM을 사용한다.
배관압력 예측모델을 위해 random forest, support vector regression(SVR), long-short term memory(LSTM) 알고리즘을 사용한다. 모델의 성능은 평균제곱근오차(root mean square error, RMSE), 절대평균백분율오차(mean absolute percentage error, MAPE)를 척도로 사용해 평가한다[3, 20].
성능평가 척도는 RMSE와 MAPE를 사용한다. RMSE는 실제값과 예측값의 오차를 표현하는 척도로 계산방법은 식 (1)과 같다.
본 논문에서 제안하는 모델을 통해 전문가는 배관압력을 효율적으로 관리하고 압력이상에 대비할 수 있다. 실시간 배관압력 예측모델 구현을 위해 random forest, support vector regression(SVR), long-short term memory(LSTM) 알고리즘을 사용한다.
이 장에서는 앞 장에서 구성한 데이터 셋을 사용해 배관압력 예측모델을 구현한다. 회귀모델을 구현하기 위해 회귀분석 알고리즘 random forest와 SVR, LSTM을 사용한다. 아산시의 6개 정압기와 천안시의 5개 정압기에 대해 모델을 구현하고 성능을 측정한 결과는 [Table 4]와 같다.
성능/효과
노승철의 연구에서 제시한 도시가스 사용량에 영향을 미치는 외부환경변수를 통합 분석해 예측모델을 구현한다[18]. 본 논문에서 제안하는 모델을 통해 전문가는 배관압력을 효율적으로 관리하고 압력이상에 대비할 수 있다. 실시간 배관압력 예측모델 구현을 위해 random forest, support vector regression(SVR), long-short term memory(LSTM) 알고리즘을 사용한다.
분석결과 아산시와 천안시의 분 단위 배관압력 예측모델 모두 LSTM을 사용한 모델에서 가장 우수한 성능을 보인다. 아산시 배관압력예측모델의 경우 LSTM 모델에서 RMSE가 0.
본 연구에서는 데이터의 주기성을 분석에 사용하기 위해 시계열 속성을 추가해 사용한다. 사용한 시계열 속성은 이동평균(moving average, MA)과 일정 기간 전의 수치, 최대 수치, 최소 수치이다. 이동평균 계산방법은 식 (3)과 같다.
549로 가장 높은 오류율을 보인다. 실험결과 LSTM을 사용해 구현한 예측모델의 성능이 우수함을 확인할 수 있다.
아산시에 위치하는 6개 정압기를 대상으로 1차 압력, 2차 압력 예측모델을 구현한 결과 정압기 A의 2차 압력, 정압기 C의 2차 압력을 제외하고 모두 LSTM을 사용해 구현한 모델에서 가장 낮은 RMSE와 MAPE를 보인다. 세 알고리즘 성능의 평균을 비교한 결과 [Figure 4]와 같이 LSTM의 RMSE는 0.
462로 가장 높은 오류율을 보인다. 천안시의 5개 정압기 배관압력 예측모델 또한 LSTM 모델의 RMSE가 0.015, MAPE가 0.668로 가장 낮아 우수한 성능을 보인다. Random forest 모델은 RMSE가 0.
후속연구
본 연구에서 제안하는 배관압력 예측모델을 통해 배관에 대한 실시간 예측압력 정보를 제공할 경우 전문가의 배관이상관리 의사결정에 도움을 줄 것으로 기대한다. 전문가는 배관압력 예측수치를 통해 배관압력의 이상을 예상하고 대비할 수 있으며, 이를 통해 배관안전 관리에 기여할 수 있다.
향후에는 정압기를 통해 측정한 배관압력과 테스트박스를 통해 측정한 배관피복의 전위를 통합 분석해 부식위치를 파악함으로써 도시가스 배관의 이상탐지에 기여할 수 있을 것으로 기대한다.
질의응답
핵심어
질문
논문에서 추출한 답변
분석 데이터 중 배관압력 데이터는 어떻게 수집되는가?
분석 데이터는 배관압력과 시간변수, 외부환경변수로 이루어진다. 배관압력 데이터는 정압기에서 수집하는 1차 압력과 2차 압력으로 4~6초 간격으로 실시간 수집된다. 중부도시가스의 공급권역 중 아산시와 천안시의 11개 정압기데이터를 사용한다.
Random forest의 장점은 무엇인가?
Random forest는 여러 개의 의사결정 트리를 사용하는 앙상블 알고리즘으로, 회귀모델의 경우 각 의사결정 트리에서 도출한 예측 수치들의 평균을 최종 결과로 결정한다. 앙상블 방법을 사용하기 때문에 일반화가 우수하며 노이즈에 강하다는 장점이 있다.
도시가스 배관이 위험에 노출되어 있는 이유는 무엇인가?
도시가스 배관은 지중에 매설되어 있기 때문에 세부 관리가 어렵고 다양한 위험에 노출되어 있다. 본 연구에서는 도시가스 배관압력 실시간 데이터를 분석해 배관압력 이상을 예측하고 전문가의 의사결정을 돕는 모델을 제안한다.
참고문헌 (21)
Akram, N. A., Isa, D., Rajkumar, R., and Lee, L. H., "Active incremental Support Vector Machine for oil and gas pipeline defects prediction system using long range ultrasonic transducers," Ultrasonics, Vol. 54, No. 6, pp. 1534-1544, 2014.
El-Abbasy, M. S., Senouci, A., Zayed, T., Mirahadi, F., and Parvizsedghy, L., "Artificial neural network models for predicting condition of offshore oil and gas pipelines," Automation in Construction, Vol. 45, pp. 50-65, 2014.
Hwang, K., Mandayam, S., Udpa, S. S., Udpa, L., Lord, W., and Atzal, M., "Characterization of gas pipeline inspection signals using wavelet basis function neural networks," NDT & E International., Vol. 33, pp. 531-545, 2000.
Korean Oil Corporation's Petronet: http://www.petronet.co.kr/v3/index.jsp.
Layouni, M., Hamdi, M. S., and Tahar, S., "Detection and sizing of metal-loss defects in oil and gas pipelines using pattern-adapted wavelets and machine learning" Applied Soft Computing, Vol. 52, pp. 247-261, 2017.
Lee, J. Y., Afzal, M., Udpa, S., Udpa, L., and Massopust, P., "Hierarchical rule based classification of MFL signals obtained from natural gas pipeline inspection," Neural Networks. IJCNN 2000, Proceedings of the IEEE-INNS-ENNS International Joint Conference on IEEE., Vol. 5, pp. 71-76, 2000.
Lee, L. H., Rajkumar, R., Lo, L. H., Wan, C. H., and Isa, D., "Oil and gas pipeline failure prediction system using long range ultrasonic transducers and Euclidean-Support Vector Machines classification approach," Expert Systems with Applications, Vol. 40 No. 6, pp. 1925-1934, 2013.
Li, J., Fan, X., Chen, G., Gao, Z., Chen, M., and Li, L., "A DNN for small leakage detection of positive pressure gas pipelines in the semiconductor manufacturing," In Online Analysis and Computing Science (ICOACS), IEEE International Conference, IEEE, pp. 384-388, 2016.
Liu, H., Liu, D., Zheng, G., Liang, Y., and Ni, Y., "Research on natural gas load forecasting based on support vector regression," In Intelligent Control and Automation, WCICA 2004, Fifth World Congress on IEEE, Vol. 4, pp. 3591A-3595, 2004.
Mandal, S. K., Chan, F. T., and Tiwari, M. K., "Leak detection of pipeline: An integrated approach of rough set theory and artificial bee colony trained SVM," Expert Systems with Applications, Vol. 39, No. 3, pp. 3071-3080, 2012.
Min, G. Y. and Jeong, D. H., "Research on assessment of impact of big data attributes to disaster response decision-making process," Journal of Society for e-Business Studies, Vol. 18, No. 3, pp. 17-43, 2013.
Mohamed, A., Hamdi, M. S., and Tahar, S., "A Hybrid Intelligent Approach for Metal-Loss Defect Depth Prediction in Oil and Gas Pipelines," In Intelligent Systems and Applications. Springer International Publishing, pp. 1-18, 2016.
Mohamed, A., Hamdi, M. S., and Tahar, S., "A machine learning approach for big data in oil and gas pipelines," In Future Internet of Things and Cloud (FiCloud), 2015 3rd International Conference on IEEE, pp. 585-590, 2015.
National Statistics Portal: http://kosis.kr/index/index.jsp.
National Weather Service Station: https://data.kma.go.kr/cmmn/main.do.
Nejatian, I., Kanani, M., Arabloo, M., Bahadori, A., and Zendehboudi, S., "Prediction of natural gas flow through chokes using support vector machine algorithm," Journal of Natural Gas Science and Engineering, Vol. 18, pp. 155-163, 2014.
Noh, S. C., "Analysis of factors affecting energy consumption and $CO_2$ emissions structure in household sector," Doctoral dissertation, Seoul National University, 2013.
T developers: https://developers.sktelecom.com/.
Witten, I. H. and Frank, E., "Data Mining: Practical machine learning tools and techniques," Morgan Kaufmann, 2005.
Zhang, S. and Zhou, W., "System reliability of corroding pipelines considering stochastic process-based models for defect growth and internal pressure," International Journal of Pressure Vessels and Piping, Vol. 111, pp. 120-130, 2013.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.