$\require{mediawiki-texvc}$

연합인증

연합인증 가입 기관의 연구자들은 소속기관의 인증정보(ID와 암호)를 이용해 다른 대학, 연구기관, 서비스 공급자의 다양한 온라인 자원과 연구 데이터를 이용할 수 있습니다.

이는 여행자가 자국에서 발행 받은 여권으로 세계 각국을 자유롭게 여행할 수 있는 것과 같습니다.

연합인증으로 이용이 가능한 서비스는 NTIS, DataON, Edison, Kafe, Webinar 등이 있습니다.

한번의 인증절차만으로 연합인증 가입 서비스에 추가 로그인 없이 이용이 가능합니다.

다만, 연합인증을 위해서는 최초 1회만 인증 절차가 필요합니다. (회원이 아닐 경우 회원 가입이 필요합니다.)

연합인증 절차는 다음과 같습니다.

최초이용시에는
ScienceON에 로그인 → 연합인증 서비스 접속 → 로그인 (본인 확인 또는 회원가입) → 서비스 이용

그 이후에는
ScienceON 로그인 → 연합인증 서비스 접속 → 서비스 이용

연합인증을 활용하시면 KISTI가 제공하는 다양한 서비스를 편리하게 이용하실 수 있습니다.

LSTM 순환 신경망을 이용한 재료의 단축하중 하에서의 응력-변형률 곡선 예측 연구
Prediction of the Stress-Strain Curve of Materials under Uniaxial Compression by Using LSTM Recurrent Neural Network 원문보기

터널과 지하공간: 한국암반공학회지 = Tunnel and underground space, v.28 no.3, 2018년, pp.277 - 291  

변훈 (서울대학교 공과대학 에너지시스템공학부) ,  송재준 (서울대학교 공과대학 에너지시스템공학부)

초록
AI-Helper 아이콘AI-Helper

이 논문에서는 재료의 단축하중 하에서의 응력-변형률 곡선을 예측하기 위하여 순환 신경망의 일종인 LSTM(Long Short-Term Memory) 알고리즘을 사용하였다. 석고와 규사를 혼합해 만든 재료에 일축압축시험을 수행하여 얻은 응력-변형률 데이터를 이용하였으며, 낮은 응력 구간의 초반 데이터를 활용해서 파괴 전까지의 거동을 예측하였다. 앞부분의 데이터를 활용하여 단계적으로 뒤쪽 구간의 값을 예측하는 LSTM 순환 신경망의 구조상 큰 응력에 대응하는 변형률을 예측할 경우에는 앞쪽 구간의 오차가 누적되어 실측값과 차이가 늘어났으나 전반적으로 높은 정확도로 응력-변형률 곡선을 예측하였다. 예측에 사용한 초기 데이터의 길이가 늘어나는 경우 정확도는 조금 증가했다. 그러나 접선을 이용한 단순 예측과의 성능 차이는 초기 데이터의 길이가 작은 경우에 두드러졌으며, 적은양의 데이터로도 응력-변형률 곡선 전체 구간의 예측을 가능하게 한다는 점으로부터 신경망 모델의 필요성을 확인하였다.

Abstract AI-Helper 아이콘AI-Helper

LSTM (Long Short-Term Memory) algorithm which is a kind of recurrent neural network was used to establish a model to predict the stress-strain curve of an material under uniaxial compression. The model was established from the stress-strain data from uniaxial compression tests of silica-gypsum speci...

주제어

AI 본문요약
AI-Helper 아이콘 AI-Helper

* AI 자동 식별 결과로 적합하지 않은 문장이 있을 수 있으니, 이용에 유의하시기 바랍니다.

제안 방법

  • 우선 점탄성 모형을 사용하여 응력-변형률 곡선을 예측해 보았다. 53개의 데이터셋 중 하나의 시료에 대해 Burger 모형을 사용한 최적화를 두 가지 경우에 대해 테스트하였다. 두 경우는 각각 전구간 응력-변형률 데이터를 사용한 최적화와, LSTM 순환 신경망을 사용한 시험과 같이 초기 2.
  • LSTM 순환 신경망을 이용해 재료에 특정 응력이 가해졌을 때의 변형률을 예측하였다. 신경망에 입력된 입력 자료는 출력 시점 직전의 일련의 변형률 값들이다.
  • 본 연구에서는 점탄성 모델이 일축압축시험 초반부 응력-변형률 데이터만을 사용하여 후반부의 응력-변형률 곡선을 예측하는 것에 한계가 있다는 것을 확인한 후, 신경망 모델을 도입하여 이와는 차별화된 결과를 얻었다. 결과적으로 이론적인 모델 도입 없이 오직 응력-변형률 데이터만을 사용하여 학습 과정을 거친 후 적은 양의 초기 단계의 응력-변형률 데이터로부터 향후의 거동을 예측하였다. 사용한 알고리즘은 순환 신경망(Recurrent Neural Network, RNN)의 한 종류인 LSTM(Long Short-Term Memory)이며, 입력 구간 이상의 영역에서 임의의 응력 수준에서의 변형률 값이 계산되도록 하였다.
  • 2초 간격을 갖는 연속된 두 개의 수치를 평균하여 사용하였다. 그 후, 응력을 0 MPa부터 파괴시점의 응력까지의 범위에 대하여 0.08 MPa 단위로 나누고 각 응력수준에 따른 변형률 값을 추출해냈다. 한 구간의 길이인 0.
  • 결과적으로 신경망 모델을 사용하면 초기 단계의 응력-변형률 곡선만으로 이후 곡선 예측이 가능하게 되어, 가압에 따른 시료 손상을 최소화하면서 파괴 전까지의 응력-변형률 곡선을 얻을 수 있다는 점에서 의의가 있다. 모델 학습에 사용한 데이터는 석고와 규사를 혼합하여 제작한 재료에 일축압축시험을 수행하여 얻어진 응력-변형률 값들이며, 초기의 응력-변형률 값을 활용하여 재료의 파괴 전까지의 거동을 예측해내었다.
  • 주어진 실험 데이터를 사용해 식 (1)의 각 계수들을 예측하는 과정을 수행하였다. 변수 계산 과정은 Python과 Tensorflow 패키지를 활용하였으며, 초기값을 무작위로 설정한 뒤, 식 (2)에 표시한 오차 함수를 활용하여, 경사하강법을 통해 Burger 모델의 변수 최적화를 진행하였다.
  • 는 Burger 모형에의 매개변수들이다. 본 연구에서는 일정한 속도(0.4 mm/min)로 변형률을 증가시키며 실험하였다. 따라서 \(\dot{\epsilon}\)는 상수이며, \(\ddot{\epsilon} = 0\)이 된다.
  • 석고와 규사를 혼합한 재료로부터 얻은 일축압축시험 데이터를 통해 응력-변형률 곡선을 예측하는 모델을 수립하였다. 기존에는 재료의 비선형 거동을 해석하기 위해 주로 유변학적 모델을 사용하였으나, 본 연구를 통해 신경망 구조상 시계열 데이터를 다루는데 유리한 순환 신경망을 사용한다면 특정한 모델을 도입할 필요 없이 오직 경험적인 방법만으로 재료의 거동을 묘사할 수 있는 것을 확인하였다.
  • 우선 점탄성 모형을 사용하여 응력-변형률 곡선을 예측해 보았다. 53개의 데이터셋 중 하나의 시료에 대해 Burger 모형을 사용한 최적화를 두 가지 경우에 대해 테스트하였다.
  • 이 초기 데이터를 신경망에 입력 자료로 사용하기 위한 전처리 단계는 다음과 같다. 우선 측정기기의 응력과 변형률 측정 시 발생하는 기계의 오차를 줄이기 위해 0.2초 간격을 갖는 연속된 두 개의 수치를 평균하여 사용하였다. 그 후, 응력을 0 MPa부터 파괴시점의 응력까지의 범위에 대하여 0.
  • i, f, o, g는 각각 입력 게이트(input gate), 망각 게이트(forget gate), 출력 게이트(output gate), 입력 변조 게이트(input modulation gate)를 나타낸다. 이 연구에서는 Fig. 1에 보이는 한 시간 단계에서의 LSTM 노드가 좌우로 연속적으로 연결되어 있으며, 각 시간 단계에서는 전 시간 단계에서의 은닉상태와 셀 상태를 전달받고, 현 시간 단계에서의 입력값을 받아 게이트들을 통한 연산을 거쳐 은닉상태와 셀 상태를 업데이트 하여 다음 시간 단계로 전송하는 모델을 사용하였다. 가중치(weight)와 편향(bias) 텐서를 각각 W와 b 로 나타내었다.
  • 08 MPa로 나눈 값인 300∼500 정도이다. 이 연구에서는 응력들 간의 등간격을 time step으로 설정하고 앞 구간의 변형률을 입력 자료로 하여 뒤쪽 구간의 변형률을 예측하였다. 입력의 크기(길이)인 sequence length는 모델 성능의 비교를 위해 30, 60, 90의 세 종류를 사용하였다.
  • 모델을 통해 예측한 곡선은 빨간색으로 표시되어있으며, 일축압축시험을 통해 얻은 실제 곡선은 파란색으로 나타나있다. 직관적인 예측 방법인 앞쪽 구간의 곡선에 접선을 그리는 방법을 통해 얻어진 응력-변형률 곡선도 이 모델의 실효성을 확인하기 위해 검은색의 파선으로 함께 나타내었다.
  • 약2/3인 나머지 36개의 데이터는 학습에 사용하였다. 최적화 함수로는 Adam Optimizer를 사용하였으며, 드롭아웃(dropout) 비율은 0.01로 설정한 후, 0.0001의 학습률로 300번 이상의 반복 학습을 하였다.

대상 데이터

  • 4를 사용했으며, hidden unit의 개수는 효율성을 고려해 20으로 하였다. 53개의 실험 데이터는 15종류의 석고+규사 조합의 재료 3개씩(한 종류는 4개)과 순수 석고 시료 7개로 구성되어있다. 따라서 테스트 셋의 대표성을 위해 16종류의 재료를 모두 포함하는 전체 데이터의 약1/3인 17개의 테스트 셋을 구성하였다.
  • LSTM 순환 신경망은 기존의 순환 신경망에서 은닉 상태를 계산하기 전에 LSTM 알고리즘을 거치는 순환 신경망이다. LSTM의 구조로는 여러 모델이 제안되었고, 이 연구에 사용한 모델이 Fig. 1에 나타나있다. 그림에서 xt, ht는 각각 시간 t에서의 입력과 은닉상태를 나타낸다.
  • 32 MPa까지의 변형률은 일축압축시험을 통해 얻은 실측값을 사용했으며 이후의 변형률을 입력 자료로 사용할 때에는 전 단계에서 예측된 값을 사용하였다. 같은 방법으로 sequence length가 60, 90인 경우도 실제 일축압축시험을 통해 얻은 변형률을 입력 자료로 사용한 구간은 각각 0 MPa부터 4.72 MPa까지와 0 MPa부터 7.12 MPa까지이며 이후의 변형률은 전 단계에서 예측된 값을 사용하였다.
  • 신경망에 입력된 입력 자료는 출력 시점 직전의 일련의 변형률 값들이다. 공업용 반수석고와 물을 섞어 만들어진 석고에 규사를 혼합해서 만든 인공 재료 53개에 대해 0.4mm/min의 조건으로 하중을 가한 일축압축시험의 데이터(Byun, et al., 2018)를 신경망 모델 구성에 활용했다. 이 시료들은 석고에세 가지 입도범위(Coarse: 0.
  • 53개의 실험 데이터는 15종류의 석고+규사 조합의 재료 3개씩(한 종류는 4개)과 순수 석고 시료 7개로 구성되어있다. 따라서 테스트 셋의 대표성을 위해 16종류의 재료를 모두 포함하는 전체 데이터의 약1/3인 17개의 테스트 셋을 구성하였다. 약2/3인 나머지 36개의 데이터는 학습에 사용하였다.
  • 따라서 테스트 셋의 대표성을 위해 16종류의 재료를 모두 포함하는 전체 데이터의 약1/3인 17개의 테스트 셋을 구성하였다. 약2/3인 나머지 36개의 데이터는 학습에 사용하였다. 최적화 함수로는 Adam Optimizer를 사용하였으며, 드롭아웃(dropout) 비율은 0.
  • 이 시료들은 석고에세 가지 입도범위(Coarse: 0.76-1.08 mm; Medium: 0.49-0.76 mm; Fine: 0.20-0.49 mm)의 규사 알갱이들을 10%∼50% 의 비율 범위에서 10%단위로 혼합해 만든 재료들이다.
  • 이 연구에 사용하기 위해 일축압축시험을 통해 얻은 초기 데이터(raw data)는 0.2초 단위로 응력과 변형률을 측정한 데이터이다. 이 초기 데이터를 신경망에 입력 자료로 사용하기 위한 전처리 단계는 다음과 같다.
  • 이 연구에서는 응력들 간의 등간격을 time step으로 설정하고 앞 구간의 변형률을 입력 자료로 하여 뒤쪽 구간의 변형률을 예측하였다. 입력의 크기(길이)인 sequence length는 모델 성능의 비교를 위해 30, 60, 90의 세 종류를 사용하였다. sequence length는 다음 단계의 변형률을 예측하기 위해 사용하는 직전 단계 변형률의 개수를 의미한다.

데이터처리

  • 모델의 성능을 정량적으로 판단하기 위해 테스트 셋에 대한 예측의 정확도를 평균제곱근오차(Root Mean Square Error,RMSE)와 결정계수(coefficient of determination)로 나타내었다. 결정계수는 변형률의 예측값과 실측값을 각각 좌표평면에 x, y 값으로 놓고 직선 y = x와의 일치도로 계산하였다(Fig.

이론/모형

  • 모델 구축과 실험 수행은 Python과 Tensorflow 패키지를 사용하였다. 하이퍼파라미터는 학습 시간과 정확도를 고려하여 시행착오를 거쳐 설정하였다.
  • 결과적으로 이론적인 모델 도입 없이 오직 응력-변형률 데이터만을 사용하여 학습 과정을 거친 후 적은 양의 초기 단계의 응력-변형률 데이터로부터 향후의 거동을 예측하였다. 사용한 알고리즘은 순환 신경망(Recurrent Neural Network, RNN)의 한 종류인 LSTM(Long Short-Term Memory)이며, 입력 구간 이상의 영역에서 임의의 응력 수준에서의 변형률 값이 계산되도록 하였다. 이 모델은 오직 응력-변형률 데이터만으로만들어진 모델이므로, 점탄성 모형과 달리 응력-변형률 곡선이 특정 지배방정식을 만족토록 제한하지 않아 더욱 다양한 형태의 곡선 이해과 도출이 가능하다.
  • 08 MPa의 정수배가 아니기 때문에 특정 응력에 대응하는 변형률 값의 실험 데이터가 없는 경우가 있다. 이 경우에는 Cubic Spline 보간법을 사용하여 데이터를 생성해냈다. 마지막으로 입력 자료로 사용할 변형률 값에 100을 곱하여 변형률이 0에서 1사이의 분포를 갖게 만들어 학습의 효율을 높였다.
  • 이 연구에는 인공신경망의 일종인 순환 신경망을 사용하였다. 기존의 인공신경망은 입력계층, 은닉계층, 출력계층의 세단계로 구성되며 뉴런들이 단순히 층층이 조합된 구조이다.
  • 점탄성 모델 중 Maxwell 모형과 Kelvin-Voigt 모형은 단순하여 변곡점이 존재하는 곡선을 표현하는 것에 한계가 있기 때문에 Burger 모형을 실험에 사용하였다. 식 (1)은 Burger 모형의 방정식이다(Skrzypek and Ganczarski, 2015).
본문요약 정보가 도움이 되었나요?

질의응답

핵심어 질문 논문에서 추출한 답변
LSTM 순환 신경망은 어떤 신경망인가? LSTM 순환 신경망은 기존의 순환 신경망에서 은닉 상태를 계산하기 전에 LSTM 알고리즘을 거치는 순환 신경망이다. LSTM의 구조로는 여러 모델이 제안되었고, 이 연구에 사용한 모델이 Fig.
LSTM 순환 신경망 알고리즘이 도입되게 된 배경으로 기본적인 순환신경망의 특징은 무엇인가? 반면에 순환 신경망은 노드에 과거 정보가 저장되어 다음 시간 단계로 전달되며, 이를 통해 과거 데이터가 현재 값 예측 과정에 사용될 수 있어 시계열 데이터의 분석에 잘 활용된다. 그러나 기본적인 순환신경망은 현재 값 예측에 사용하는 과거 데이터의 길이가 긴 경우 과거의 정보 중 일부가 전달 과정 중에 소실되며, 기울기 소실 문제로 학습이 원활하게 이루어지지 않는다(Gers et al., 2002).
점탄성 모델의 단점은 무엇인가? 본 연구에서는 점탄성 모델이 일축압축시험 초반부 응력-변형률 데이터만을 사용하여 후반부의 응력-변형률 곡선을 예측하는 것에 한계가 있다는 것을 확인한 후, 신경망 모델을 도입하여 이와는 차별화된 결과를 얻었다. 결과적으로 이론적인 모델 도입 없이 오직 응력-변형률 데이터만을 사용하여 학습 과정을 거친 후 적은 양의 초기 단계의 응력-변형률 데이터로부터 향후의 거동을 예측하였다.
질의응답 정보가 도움이 되었나요?

참고문헌 (12)

  1. Arindam, D. and Prabir, B., 2012, Estimation of Burger model parameters using inverse formulation, International Journal of Geotechnical Engineering, Vol. 6, No. 3, pp. 261-274. 

  2. Byun, H., Fereshtenejad, S. and Song, J., 2018, A study on the effect of grain content and size on mechanical properties of artificial sedimentary rocks, Tunnel and Underground Space, Vol. 28, No. 2, pp. 156-169. 

  3. Gers, F., Schraudolph, N. and Schmidhuber, J., 2002, Learning precise timing with LSTM recurrent networks, Journal of Machine Learning Research, Vol. 3, pp. 115-143. 

  4. Guan, Z., Jiang, Y., Tanabashi, Y. and Huang, H., 2008, A new rheological model and its application in mountain tunnelling, Tunnelling and Underground Space Technology, Vol. 23, No. 3, pp. 292-299. 

  5. Hardy, H.R., 1967, Analysis of the inelastic deformation of geologic materials in terms of mechanical models, Spring Meeting, Society for Experimental Stress Analysis, Ottawa, Canada. 

  6. Hudson, J.A. and Harrison, J.P., 1997, Engineering Rock Mechanics: an introduction to the principle, Pergamon, Elsevier Science, Oxford 215p. 

  7. Karami, M. and Fahimifar, A., 2013, A new time-dependent constitutive model and its application in underground construction, ISRM International Symposium on Rock Mechanic for Resources, Energy and Environment, Wroclaw, Poland, pp. 21-26. 

  8. Li, Y., Zhu, W., Fu, J., Guo, Y. and Qi, Y., 2014, A damage rheology model applied to analysis of splitting failure in underground caverns of Jinping I hydropower station, International Journal of Rock Mechanics and Mining Sciences, Vol. 71, pp. 224-234. 

  9. Perez-Ortiz, J., Gers, F., Eck, D. and Schmidhuber. J., 2003, Kalman filters improve LSTM network performance in problems unsolvable by traditional recurrent nets, Neural Networks, Vol. 16, No. 2, pp. 241-250. 

  10. Skrzypek, J.J., Ganczarski, A.W., 2015, Constitutive Equations for Isotropic and Anisotropic Linear Viscoelastic Materials, Mechanics of Anisotropic Materials, Engineering Materials. Springer, Cham, pp 57-85. 

  11. Zaremba, W., Sutskever, I. and Vinyals, O., 2014, Recurrent neural network regularization, arXiv preprint arXiv:1409.2329v5. 

  12. Zhao, D., Jia, L., Wang, M. and Wang, F., 2016, Displacement prediction of tunnels based on a generalised Kelvin constitutive model and its application in a subsea tunnel, Tunnelling and Underground Space Technology, Vol. 54, pp. 29-36. 

저자의 다른 논문 :

LOADING...
섹션별 컨텐츠 바로가기

AI-Helper ※ AI-Helper는 오픈소스 모델을 사용합니다.

AI-Helper 아이콘
AI-Helper
안녕하세요, AI-Helper입니다. 좌측 "선택된 텍스트"에서 텍스트를 선택하여 요약, 번역, 용어설명을 실행하세요.
※ AI-Helper는 부적절한 답변을 할 수 있습니다.

선택된 텍스트

맨위로