양방향 LSTM과 데이터 조합탐색 및 딥러닝 관련 기법을 활용한 철근 가격 단기예측에 관한 실험적 연구 Experimental Study on the Short-Term Prediction of Rebar Price using Bidirectional LSTM with Data Combination and Deep Learning Related Techniques원문보기
본 연구는 양방향 LSTM, Random Search, 데이터 조합, Dropout을 이용한 철근 가격 단기예측 딥러닝 모델을 개발하는 체계적인 절차를 제시한다. 일반적으로 사용자가 직관적으로 이러한 값을 결정하여 예측성능이 우수한 결과를 탐색하는데 시간이 많이 걸리고 반복적인 시도를 하게 되는데, 이러한 시도로 찾아낸 결과가 우수하다고 보장할 수 없다. 본 연구에서 제시하는 제안된 접근방식으로 단기 가격예측의 평균 정확도는 약 98.32%이다. 그리고 이 방식은 철근 이외의 건축재료를 비롯하여 통계기반의 시계열 데이터로 가격을 예측하는 연구에서 본 연구에서 제시한 내용이 우수한 예측결과를 도출하기 위한 기초적 자료로 활용될 수 있을 것이다.
본 연구는 양방향 LSTM, Random Search, 데이터 조합, Dropout을 이용한 철근 가격 단기예측 딥러닝 모델을 개발하는 체계적인 절차를 제시한다. 일반적으로 사용자가 직관적으로 이러한 값을 결정하여 예측성능이 우수한 결과를 탐색하는데 시간이 많이 걸리고 반복적인 시도를 하게 되는데, 이러한 시도로 찾아낸 결과가 우수하다고 보장할 수 없다. 본 연구에서 제시하는 제안된 접근방식으로 단기 가격예측의 평균 정확도는 약 98.32%이다. 그리고 이 방식은 철근 이외의 건축재료를 비롯하여 통계기반의 시계열 데이터로 가격을 예측하는 연구에서 본 연구에서 제시한 내용이 우수한 예측결과를 도출하기 위한 기초적 자료로 활용될 수 있을 것이다.
This study presents a systematic procedure for developing a short-term prediction deep learning model of rebar price using bidirectional LSTM, Random Search, data combination, Dropout. In general, users intuitively determine these values, making it time-consuming and repetitive attempts to explore r...
This study presents a systematic procedure for developing a short-term prediction deep learning model of rebar price using bidirectional LSTM, Random Search, data combination, Dropout. In general, users intuitively determine these values, making it time-consuming and repetitive attempts to explore results with good predictive performance, and the results found by these attempts cannot be guaranteed to be excellent. With the proposed approach presented in this study, the average accuracy of short-term price forecasts is approximately 98.32%. In addition, this approach could be used as basic data to produce good predictive results in a study that predicts prices with time series data based on statistics, including building materials other than rebars.
This study presents a systematic procedure for developing a short-term prediction deep learning model of rebar price using bidirectional LSTM, Random Search, data combination, Dropout. In general, users intuitively determine these values, making it time-consuming and repetitive attempts to explore results with good predictive performance, and the results found by these attempts cannot be guaranteed to be excellent. With the proposed approach presented in this study, the average accuracy of short-term price forecasts is approximately 98.32%. In addition, this approach could be used as basic data to produce good predictive results in a study that predicts prices with time series data based on statistics, including building materials other than rebars.
* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.
문제 정의
지도학습(Supervised Learning)은 명시적인 정답이 주어진 상태에서 컴퓨터를 학습시키는 방법으로, 데이터의 특성을 토대로 값을 예측한다(Olson, 2008). 본 연구에서는 기존의 가격예측 연구에서 많이 사용된 Supervised Learning의 한 종류인 RNN, LSTM, BRNN 대한 이론적 고찰을 실시하였다.
본 연구에서는 딥러닝 모델인 Bi-LSTM과 예측성능을 높이기 위한 데이터 조합, Dropout, Random Search, 학습성능과 테스트성능의 접점 값 탐색방법을 이용하여 철근 가격 단기예측방법을 제안하기 위해 실험을 진행하였다.
이에 본 연구에서는 딥러닝을 활용하여 철근 가격을 단기 예측하는 방법을 제안하고자 한다.
제안 방법
이후 본 연구에서 사용할 딥러닝에 관련된 기법들에 대한 이론적 고찰을 실시한다. 그리고 이를 토대로 딥러닝 모델을 구현하고, 철근 가격을 예측하기 위한 데이터를 선정하여 모델에 적용 후, Test 예측결과와 데이터의 범위를 벗어난 값을 예측하여 실제값과 비교하여 예측성능을 평가한다.
이는 최적화된 모델의 실제 예측성능을 확인하기 수행된다. 그리고 철근 시세가 실제 2020년 1월부터 4월까지 610,000원으로 가격의 변화가 없는 상태이기 때문에 가장 마지막 데이터의 철근 가격이 오르는 추세인 2003년 1월부터 2019년 11월까지, 하락하는 추세인 2003년 1월부터 2017년 7월까지 2가지를 범위로 한 데이터셋을 기존의 데이터셋에서 추가 생성해 앞 전의 과정과 같은 방식으로 예측결과를 출력 및 평가하여 입력된 데이터에 대한 등락을 올바르게 예측하는지 확인한다. Random Search의 하이퍼 파라미터 탐색 범위는 학습률 0.
Dropout 레이어는 Cell의 다음에 위치시켜 Cell의 출력부에만 적용되게 설정하였다. 그리고 하이퍼 파라미터 입력값과 데이터를 전달받을 수 있도록 모델을 함수로 정의하고, 데이터를 조합한 집합에서 무작위로 데이터셋을 선택하여 선택된 데이터셋이 전체기간의 70%를 학습에 나머지 30%를 테스트에 사용하도록 자동분할 되게 설정하였다. 마지막으로 정의된 모델의 하이퍼 파라미터를 탐색할 수 있도록 ‘Random Search’와 연결하였다.
560), 철근 수입물가지수, 철근 생산량, 고철 수입량, 국제유가 3종($/Ton), 생산자물가지수(일반 철근), 고철 단가($/Ton), 건축 착공현황과 같은 철근 생산과 수요에 직·간접적 연관성이 있는 한국의 시계열 통계자료를 기반으로 데이터셋을 구성한다. 그리고 환율은 단위가 $/Ton로 표시되는 데이터에 곱하여 원화 단위를 적용하였다.
이후 이를 통해 선별된 결과는 Test RMSE가 낮은 순으로 단계적으로 선별하여 최종선택한다. 마지막으로 최종선택된 결과에 기록된 데이터의 범위를 벗어난 이후의 1달 가격을 실제값과 비교하여 모델의 예측성능을 평가한다.
본 연구에서는 LSTM과 BRNN을 결합한 양방향 LSTM (Bi-LSTM)을 적용한다. 앞에서 설명한 것처럼 LSTM과 BRNN은 개선된 RNN으로 LSTM은 기울기 소실 문제를 극복하며, BRNN은 순방향과, 역방향의 은닉층 연산을 반영하여 예측성능을 향상시킨다.
연구의 방법으로는 기존의 연구에서 딥러닝을 적용하는 방법과 사용한 모델, 예측성능을 높이기 위한 딥러닝 관련 기법에 대한 문헌 고찰을 실시한다. 이후 본 연구에서 사용할 딥러닝에 관련된 기법들에 대한 이론적 고찰을 실시한다.
[Table 1]은 데이터의 ID와 출처를 보여준다. 이 데이터 집합은 2003년 1월부터 2020년 3월까지 한 달 간격으로 CSV (Comma-Separated Value) 파일로 정리하였다. 전체 데이터는 MinMaxScaler를 사용하여 정규화하였다.
연구의 방법으로는 기존의 연구에서 딥러닝을 적용하는 방법과 사용한 모델, 예측성능을 높이기 위한 딥러닝 관련 기법에 대한 문헌 고찰을 실시한다. 이후 본 연구에서 사용할 딥러닝에 관련된 기법들에 대한 이론적 고찰을 실시한다. 그리고 이를 토대로 딥러닝 모델을 구현하고, 철근 가격을 예측하기 위한 데이터를 선정하여 모델에 적용 후, Test 예측결과와 데이터의 범위를 벗어난 값을 예측하여 실제값과 비교하여 예측성능을 평가한다.
이 데이터 집합은 2003년 1월부터 2020년 3월까지 한 달 간격으로 CSV (Comma-Separated Value) 파일로 정리하였다. 전체 데이터는 MinMaxScaler를 사용하여 정규화하였다.
철근 가격을 예측하기 위해 본 연구에서는 선정한 10개의 데이터를 조합하여 Random Search를 이용해 각각의 데이터 조합에서 무작위로 선택된 데이터와 하이퍼 파라미터 최적화를 동시에 진행한다. 데이터 조합에서 종속변수인 ‘J’는 예측대상 데이터로 모든 데이터셋에 포함되기 때문에 데이터 조합 시 이는 제외하였다.
대상 데이터
본 연구에서는 딥러닝 모델인 Bi-LSTM과 예측성능을 높이기 위한 데이터 조합, Dropout, Random Search, 학습성능과 테스트성능의 접점 값 탐색방법을 이용하여 철근 가격 단기예측방법을 제안하기 위해 실험을 진행하였다. 그리고 데이터의 마지막 철근 가격이 오르는 추세인 2003년 1월부터 2017년 7월까지, 하락하는 추세인 2019년 11월까지, 가격변화가 없는 최근의 철근 가격인 2020년 3월까지를 3가지 데이터셋으로 구성해 데이터셋의 범위를 벗어난 이후의 1달 가격인 2017년 8월, 2019년 12월, 2020년 4월을 예측하였다. 예측결과는 실제값의 약 99.
본 연구에서는 한국의 철근 가격예측을 위해 철근 가격(보통철근 일반 SD300, D10㎜, 0.560), 철근 수입물가지수, 철근 생산량, 고철 수입량, 국제유가 3종($/Ton), 생산자물가지수(일반 철근), 고철 단가($/Ton), 건축 착공현황과 같은 철근 생산과 수요에 직·간접적 연관성이 있는 한국의 시계열 통계자료를 기반으로 데이터셋을 구성한다.
데이터처리
딥러닝 모델의 예측성능을 측정하기 위해 평균 제곱근 오차인 Root Mean Square Error (RMSE)를 이용하였다. RMSE는 모델의 예측값과 실제값의 차이를 다룰 때 사용하는 측도로 식(2)과 같다.
는 예측값을 나타낸다. 이 두 값의 차가 음수일 경우를 고려하여 제곱하고, 예측된 결과 n만큼 나누어 평균 계산 후, 루트를 사용하여 RMSE를 산출한다. RMSE는 값이 낮을수록 모델의 예측성능이 높다는 것을 의미한다.
성능/효과
또한 본 연구에서 진행한 데이터 조합과 하이퍼 파라미터 탐색을 동시에 탐색하는 방식은 한가지 데이터셋의 하이퍼 파라미터를 집중탐색하는 방식인 9C9 Test RMSE보다 개선된 결과를 나타낸 2017년 7월의 결과와 2020. 3월의 결과를 통해 이 방식이 Test RMSE의 개선에 효과가 있음을 확인할 수 있었다. 그리고 본 연구에서 제안한 P값은 Dropout을 적용하였을 때 모든 결과에서 학습성능과 테스트성능의 차이가 작은 과대적합이 발생하지 않은 결과의 선별이 가능하였다.
2]와 같다. 그리고 데이터셋의 범위를 벗어난 이후의 1달 가격인 2017년 8월의 예측값은 668,400원으로 실제값 675,000원과 약 6,600원의 차이로 9C4의 Test RMSE를 표준화한 범위 내에 값을 예측하였으며, 이는 실제값의 약 99.02%의 정확도로 예측하였다. 데이터의 가장 마지막 철근 가격이 하락하는 추세인 2003년 1월부터 2019년 11월까지의 데이터셋을 사용해 진행한 실험 결과에서 가장 우수한 예측성능을 나타낸 모든 데이터 집합인 9C9에 2014년 11월 ~ 2019년 11월까지의 Test RMSE는 0.
3]과 같다. 그리고 데이터셋의 범위를 벗어난 이후의 1달 가격인 2019년 12월의 예측값은 649,000원으로 실제값 630,000원과 약 19,000원의 차이로 9C5의 Test RMSE를 표준화한 범위 내에 값을 예측하였으며, 이는 실제값의 약 97.07%의 정확도로 예측하였다. 가장 최근 가격인 2003년 1월부터 2020년 3월까지 실험 결과에서 가장 우수한 예측성능을 나타낸 9C5의 데이터 A, C, E, G, H에 2014년 11월 ~ 2019년 11월까지의 Test RMSE는 0.
4]와 같다. 그리고 데이터셋의 범위를 벗어난 이후의 1달 가격인 2020년 4월의 예측값은 603,200원으로 실제값 610,000원과 약 6,800원의 차이로 9C5의 평균 제곱근 편차 범위 내에 값을 예측하였으며, 이는 실제값의 약 98.89%의 정확도로 예측하였다. 또한 본 연구에서 진행한 데이터 조합과 하이퍼 파라미터 탐색을 동시에 탐색하는 방식은 한가지 데이터셋의 하이퍼 파라미터를 집중탐색하는 방식인 9C9 Test RMSE보다 개선된 결과를 나타낸 2017년 7월의 결과와 2020.
3월의 결과를 통해 이 방식이 Test RMSE의 개선에 효과가 있음을 확인할 수 있었다. 그리고 본 연구에서 제안한 P값은 Dropout을 적용하였을 때 모든 결과에서 학습성능과 테스트성능의 차이가 작은 과대적합이 발생하지 않은 결과의 선별이 가능하였다. 또한 이후 Test RMSE가 낮은 결과를 추가 선별하여 확인한 실제값과 예측값의 잔차는 평균 약 10,900원의 차이를 나타냈다.
02%의 정확도로 예측하였다. 데이터의 가장 마지막 철근 가격이 하락하는 추세인 2003년 1월부터 2019년 11월까지의 데이터셋을 사용해 진행한 실험 결과에서 가장 우수한 예측성능을 나타낸 모든 데이터 집합인 9C9에 2014년 11월 ~ 2019년 11월까지의 Test RMSE는 0.02527로 이를 표준화하면 약 26,300원의 평균편차를 나타내며, 이를 시각화한 결과는 [Fig. 3]과 같다. 그리고 데이터셋의 범위를 벗어난 이후의 1달 가격인 2019년 12월의 예측값은 649,000원으로 실제값 630,000원과 약 19,000원의 차이로 9C5의 Test RMSE를 표준화한 범위 내에 값을 예측하였으며, 이는 실제값의 약 97.
그리고 본 연구에서 제안한 P값은 Dropout을 적용하였을 때 모든 결과에서 학습성능과 테스트성능의 차이가 작은 과대적합이 발생하지 않은 결과의 선별이 가능하였다. 또한 이후 Test RMSE가 낮은 결과를 추가 선별하여 확인한 실제값과 예측값의 잔차는 평균 약 10,900원의 차이를 나타냈다.
그리고 데이터의 마지막 철근 가격이 오르는 추세인 2003년 1월부터 2017년 7월까지, 하락하는 추세인 2019년 11월까지, 가격변화가 없는 최근의 철근 가격인 2020년 3월까지를 3가지 데이터셋으로 구성해 데이터셋의 범위를 벗어난 이후의 1달 가격인 2017년 8월, 2019년 12월, 2020년 4월을 예측하였다. 예측결과는 실제값의 약 99.02%, 97.07%, 98.89%의 정확도를 나타냈다. 하지만 이 정확도는 비결정적이며 Random Search는 좋은 결과를 지나칠 수 있는 불확실성이 내재 되어있기 때문에 탐색 수를 증가시키면 추가 개선될 가능성이 충분히 있다.
후속연구
따라서 기존의 연구에서 제시하는 데이터셋을 선별하는 방법과 Grid Search, Dropout을 순환신경망 계열의 딥러닝 모델에 적용하여 알고리즘을 구현하면 철근 가격의 단기예측이 가능할 것으로 사료된다. 하지만 이 방법들을 기존의 연구에서 제시한 그대로 반영하여 사용하는 것은 예측대상과 이 대상을 예측하기 위해 사용되는 데이터, 딥러닝 모델, 하이퍼 파라미터, Dropout 적용방법 등이 모두 다르기 때문에 우수한 예측결과를 얻을 수 있다고 확신하긴 어렵다.
하지만 이 방법들을 기존의 연구에서 제시한 그대로 반영하여 사용하는 것은 예측대상과 이 대상을 예측하기 위해 사용되는 데이터, 딥러닝 모델, 하이퍼 파라미터, Dropout 적용방법 등이 모두 다르기 때문에 우수한 예측결과를 얻을 수 있다고 확신하긴 어렵다. 또한 이 방법들을 포괄적으로 조합하여 모든 경우를 고려하는 것이 우수한 예측결과를 탐색하기 위한 가장 좋은 방법일 수 있으나, 위에 언급된 방법들을 모두 반영하여 진행하면 고려대상 수의 곱만큼 Grid Search의 탐색 범위와 결과를 탐색하기 위한 시간이 급격히 늘어나기 때문에 이를 효율적으로 줄 일 방법이 필요하다.
, 2019), 철근 가격예측을 위한 방법으로써 활용 가능할 것으로 판단된다. 또한 이 방식의 활용은 철근 가격으로 인해 달라질 수 있는 기존의 매월 수행된 작업에 대한 예산을 추정하는 방식보다 정확한 추정이 가능할 것으로 사료되며, 기존의 경험과 직관을 기반으로 한 전통적인 방법의 예측 체계성을 보안할 새로운 대안이 될 수 있다.
본 연구에서 제시하는 양방향 LSTM과 데이터 조합탐색 및 딥러닝 관련 기법을 활용한 철근 가격 단기예측에 관한 실험적 연구는 다른 건축재료 보다 상대적 가격변동 폭이 큰 철근의 1달 이후 가격을 예측함으로써 자재의 가격변동으로 달라질 수 있는 실투입비에 대한 대비 및 매월 수행된 작업에 대한 예산산정의 유연한 관리가 가능할 것이다. 또한 철근 이외의 건축재료를 비롯하여 통계기반의 시계열 데이터로 가격을 예측하는 연구에서 본 연구에서 제시한 내용이 우수한 예측결과를 도출하기 위한 기초적 자료로 활용될 수 있을 것이다.
본 연구에서 제시하는 양방향 LSTM과 데이터 조합탐색 및 딥러닝 관련 기법을 활용한 철근 가격 단기예측에 관한 실험적 연구는 다른 건축재료 보다 상대적 가격변동 폭이 큰 철근의 1달 이후 가격을 예측함으로써 자재의 가격변동으로 달라질 수 있는 실투입비에 대한 대비 및 매월 수행된 작업에 대한 예산산정의 유연한 관리가 가능할 것이다. 또한 철근 이외의 건축재료를 비롯하여 통계기반의 시계열 데이터로 가격을 예측하는 연구에서 본 연구에서 제시한 내용이 우수한 예측결과를 도출하기 위한 기초적 자료로 활용될 수 있을 것이다.
그리고 최근 일정한 시간 간격을 기준으로 관측치를 기록한 데이터를 딥러닝을 이용해 컴퓨터에 학습시켜 입력된 데이터의 다음을 예측하는 연구가 활발히 진행되고 있다. 특히 이 방식을 통해 국제유가, 주택가격, 주식 등과 같이 변동성이 큰 가격을 단기예측하여 결과로 제시하는 기존의 연구가 있어(Lahari et al., 2018; Chen et al., 2017; Pawar et al., 2019), 철근 가격예측을 위한 방법으로써 활용 가능할 것으로 판단된다. 또한 이 방식의 활용은 철근 가격으로 인해 달라질 수 있는 기존의 매월 수행된 작업에 대한 예산을 추정하는 방식보다 정확한 추정이 가능할 것으로 사료되며, 기존의 경험과 직관을 기반으로 한 전통적인 방법의 예측 체계성을 보안할 새로운 대안이 될 수 있다.
향후 건축자재의 가격변동으로 달라질 수 있는 미래의 여러 시점에 대한 실투입비 검토 및 관리가 가능하도록 딥러닝 예측범위를 보다 확대하기 위한 추가적 연구가 필요하다.
참고문헌 (23)
Bergstra, J., and Bengio, Y. (2012). "Random search for hyper-parameter optimization." The Journal of Machine Learning Research, 13(1), pp. 281-305.
Cen, Z., and Wang, J. (2019). "Crude oil price prediction model with long short term memory deep learning based on prior knowledge data transfer." Energy, 169, pp. 160-171.
Chen, X., Wei, L., and Xu, J. (2017). "House price prediction using LSTM." arXiv preprint arXiv:1709.08432.
Choi, M., and Kwon, O. (2008). "Construction material cost increase and countermeasures." Construction trend briefing by Korea Institute of Construction Industry, Vol. 2008 No.6, pp. 2-34.
Choi, Y., Yim, H., and Park, B. (2009). "Analysis on the Lotting Price Fluctuation of the Multi-Family Attached House According to the Construction Material Cost Variation." Journal of The Korean Society of Civil Engineers, 29(6D), pp. 753-760.
Claesen, M., and De Moor, B. (2015). "Hyperparameter search in machine learning." arXiv preprint arXiv:1502.02127.
Gao, X., Shi, M., Song, X., Zhang, C., and Zhang, H. (2019). "Recurrent neural networks for real-time prediction of TBM operating parameters." Automation in Construction, 98, pp. 225-235.
Jang, Y., Jeong, I., and Cho, Y. (2020). "Business Failure Prediction of Construction Contractors Using a LSTM RNN with Accounting, Construction Market, and Macroeconomic Variables." Journal of Management in Engineering, 36(2), 04019039.
Jeong, D. (2017). "Trend on Artificial Intelligence Technology and Its Related Industry." Korea Institute of Information Technology Magazine, 15(2), pp. 21-28.
Joo, I., and Choi, S. (2018). "Stock prediction model based on bidirectional LSTM recurrent neural network." The Journal of Korea Institute of Information, Electronics, and Communication Technology, 11(2), pp. 204-208.
Lahari, M. C., Ravi, D. H., and Bharathi, R. (2018). "Fuel Price Prediction Using RNN." 2018 International Conference on Advances in Computing, Communications and Informatics (ICACCI), pp. 1510-1514. IEEE.
Larochelle, H., Erhan, D., Courville, A., Bergstra, J., and Bengio, Y. (2007). "An empirical evaluation of deep architectures on problems with many factors of variation." Proceedings of the 24th international conference on Machine learning, pp. 473-480.
Lee, J. (2019). "A Comparative Study on Stock Price Forecasting Models Using LSTM and Bidirectional Neural Networks." MS thesis, Seoul National University of Science and Technology Graduate School.
Liao, T. W. (2005). "Clustering of time series data-a survey." Pattern recognition, 38(11), pp. 1857-1874.
Mou, L., Zhao, P., and Chen, Y. (2019). "Short-Term Traffic Flow Prediction: A Long Short-Term Memory Model Enhanced by Temporal Information." CICTP 2019, pp. 2411-2422.
Olson, D. L., and Delen, D. (2008). Advanced data mining techniques, Springer-Verlag, Berlin Heidelberg.
Pawar, K., Jalem, R. S., and Tiwari, V. (2019). "Stock market price prediction using LSTM RNN." Emerging Trends in Expert Applications and Security , pp. 493-503. Springer, Singapore.
Schuster, M., and Paliwal, K. K. (1997). "Bidirectional recurrent neural networks." IEEE transactions on Signal Processing, 45(11), pp. 2673-2681.
Srivastava, N., Hinton, G., Krizhevsky, A., Sutskever, I., and Salakhutdinov, R. (2014). "Dropout: a simple way to prevent neural networks from overfitting." The journal of machine learning research, 15(1), pp. 1929-1958.
Trinh, T. H., Dai, A. M., Luong, M. T., and Le, Q. V. (2018). "Learning longer-term dependencies in rnns with auxiliary losses." arXiv preprint arXiv:1803.00144.
Yoon, J. (2019). "Effectiveness analysis of credit card default risk prediction using deep learning neural networks." Financial Research, 33 (1), pp. 151-183.
Zhang, Z., Wang, Y., Chen, P., and Yu, G. (2018). "Application of long short-term memory neural network for multistep travel time forecasting on urban expressways." CICTP 2017: Transportation Reform and Change-Equity, Inclusiveness, Sharing, and Innovation, ASCE, pp. 444-454.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.