Mobile QR Code QR CODE : Journal of the Korean Society of Civil Engineers

  1. 명지대학교 대학원 토목환경공학과 석사과정 (Myongji Univ. ․ jombrother@gmail.com)
  2. 종신회원 ․ 교신저자 ․ 명지대학교 토목환경공학과 교수 (Corresponding Author ․ Myongji Univ. ․ cmw321@mju.ac.kr)
  3. 정회원 ․ 명지대학교 하이브리드구조실험센터 연구교수 (Myongji Univ. Hystec ․ omidyazdanpanah@mju.ac.kr)



양뱡향 LSTM, 매개변수, 처짐, 변형률, 하중 재하시험
Bidirectional LSTM, Paramater, Vertical deflection, Strain sensor, Steady load test

1. 서 론

국내 시설물의 노후화가 본격적으로 진행됨에 따라 유지관리 비용이 점진적으로 증가하고 있는 추세이다. 최근 발생하고 있는 다양한 안전 점검 및 보수보강 실패로 발생한 사고들은 유지관리의 중요성을 상기시키는 계기가 되었으며 교량의 처짐은 상태를 나타내는 대표적인 지표로, 공용 중 교량의 경우 일반적으로 하중재하시험을 통해 이루어지고 있다(MOLIT, 2021). 전통적으로 처짐을 직관적으로 계측하기 위해 LVDT와 같은 변위계가 활용되고 있으나, 변위계의 특성상 지속적인 초기화가 필요하여 상시 운용이 어렵고, 형하 공간이 수면인 경우 사용이 제한되는 등의 단점이 있다. 이러한 단점을 극복하고 상시 계측에 기반한 모니터링 시스템 구축을 위해, 계측 정보를 가공하여 처짐을 추정하는 간접 기법에 관한 연구가 다수 수행되었다(Malekloo et al., 2022). Won et al.(2021)은 다중 채널 센서 보드와 가속도계를 사용하여, 무선 센서 플랫폼(Xnode)을 구성하고 이를 통해 교량 변위를 추정하는 방법을 제시하였다. Nie et al.(2019)은 전기저항식 변형률계 센서에 고효율 저비용의 액정 고분자기판 메시 필름을 부착하여 구조물의 소규모 변위에 의한 변형을 보다 유연하게 감지하는 방법을 제시하였다. Sah et al.(2022)는 전원 공급 및 센서 설치가 용이한 광섬유 변형률계 기반 센서(Fiber Bragg-grating strain sensor)의 활용하는 방법을 제시하였다.

최근에는 안전 진단 기술 고도화를 위해 인공지능 기법을 활용하여 상태 모니터링을 수행하는 기법들이 다수 개발되고 있다. Yeon et al.(2019)는 실시간 주요 시설물의 거동을 측정하고, 상시 확인이 어려운 부분은 영상 정보를 기반으로 미세 변위를 추정하는 방법을 제시하였다. Choi et al.(2021)은 드론에 특수 카메라와 짐벌을 탑재하여 실시간 균열을 탐지하는 방법을 제시하였다. 인공지능 기법은 이력 응답 추정에도 도입되고 있다. Park et al.(2023)은 차량 군집 주행에 따른 시간이력해석과 동해석을 수행하여 교량의 안전성 검토를 다양한 모델 기법을 활용하여 동적 거동에 대한 응답의 증폭도를 분석하였다. Lai et al.(2023)은 철근 콘크리트 보에 하중재하시 발생하는 최대 변위 추정을 인공신경망 모델 기법 알고리즘에 학습시켜 성능을 비교하였으며 다양한 모델을 결합한 스택킹 모델이 높은 정합성을 가지는 연구 결과를 보여주었다. Yessoufou and Zhu(2023)은 진동 데이터를 사용한 교량 손상 식별을 위한 분류 회귀기반 CNN-LSTM 구성을 제안하였으며, 평균제곱오차(Mean Square Error), 평균절대오차(Mean Absolute Error), 평균제곱근오차(Root Mean Square Error), 결정계수(R2) 등 여러 평가 지표를 사용하여 성능을 평가하고 기존 CNN 모델 및 ML 알고리즘보다 성능이 우수함을 보여주었다. Yazdanpanah et al.(2022)은 양방향 LSTM 모델과 어텐션 레이어로 철근 콘크리트 교량의 변위 시간 이력을 예측하는 딥러닝 알고리즘을 개발하고 이력 예측의 정합성을 검증하였다.

이와 같은 다양한 연구들이 이루어지면서 인공지능 기법의 효용성이 점점 더 강조되고 있다. 특히, 학습 알고리즘의 성능을 높이기 위해 여러 하이퍼파라미터를 조정하는 것이 중요하다. Bengio (2012)은 학습률과 기울기, 가중치, 정규화 등 다양한 하이퍼파라미터를 조정해가며 실용적인 학습 알고리즘을 소개하였다. Lederer (2021)는 활성화 함수가 입력 신호에 비선형성을 추가하여 신경망의 복잡한 패턴을 학습하는 주요 지표이며 Tanh, ELU, ReLU, LeakyReLU 등 함수의 수학적 정의와 신경망에서의 역할을 설명하고, 그 특성이 신경망의 학습 성능과 일반화 능력에 미치는 영향을 분석했다. Wang et al.(2020)은 손실함수가 모델이 예측한 결과와 실제 값 간의 차이를 정량화하고 최적화된 모델의 성능을 평가하는 함수이며 다양한 손실함수의 수학적 공식을 분석하여 장단점을 비교하고 알고리즘에 적절한 손실함수를 활용하도록 나타냈다. Sarwar and Park(2020)은 기존 교량 변위 측정 방법이 고정 기준점에 의존하고 실시간 적용에 한계가 있음을 지적하며 이를 해결하기 위해 변형률 데이터를 기반으로 변위를 추정하고, 적응형 칼만 필터(AKF)를 사용해 가속도 데이터를 융합하여 실시간으로 업데이트하는 방식을 도입하였으며 수치적 및 실험적 검증을 통해 교량 구조물의 변위 추정에서 높은 정확도와 안정성을 입증하였다.

이 연구에서는 인공지능 기법에 기반하여 거더의 정적 시험에서 취득한 변형률 데이터를 학습하고, 변위를 추정하는 기법을 제시하고자 한다. 양방향 LSTM 기반 인공지능 모델의 구축을 위해 11개 실물 거더의 하중 재하시험으로부터 거더 상하부 변형률과 변위 응답, 재하 하중을 비롯하여 거더의 물성치 정보를 바탕으로 입력 변수로 구성하였다. 재하 하중으로부터 각 거더의 응답 데이터 길이는 보간법을 활용하고 학습 알고리즘의 성능을 개선하기 위해 하이퍼파라미터를 조정하여 최적의 모델을 구축하고 테스트 데이터는 별도로 분류하여 정합성 평가에 활용하였다. 학습 수준에 따른 오차를 분석하여, 처짐 추정 정확성 확보를 위한 실험데이터의 정량적 지표를 제안하였다.

2. 변형률을 활용한 변위 추정 인공지능 알고리즘

순환신경망(Recurrent Neural Network, RNN)은 이력 데이터의 학습에 적합한 신경망으로, 노드들이 시간에 따라 연결된 네트워크 구조를 가지고 있어 시퀀스 데이터 분석이 가능하며 이전 시간 단계의 상태를 기반하여 미래 상태를 결정한다(Medsker and Jain, 2001). 하지만 데이터 정보가 많아질수록 이전 시간 단계의 기울기 소실로 인한 학습능력의 저하 문제점이 발생하며 이를 보완하기 위해 셀 구조에 Fig. 1과 같이 게이트 기능을 추가하여 장기 의존성 문제를 보완한 LSTM 모델이 이력 데이터의 학습 및 추정에 널리 활용되고 있다(Yu et al., 2019). LSTM 모델에서 $X_{t}$, $h_{t}$는 각각 입력상태, 다음 레이어로의 은닉상태를 나타낸다. LSTM의 구조는 크게 세 단계로 나뉘어, $f_{t}$는 망각게이트로 이전 셀 상태 정보를 얼마나 유지할지 결정하며, $i_{t}$는 입력게이트로 새로운 정보를 셀 상태에 얼마나 반영할지 결정하고, $o_{t}$는 출력 게이트로 현재 셀 상태를 기반으로 은닉 상태를 결정하는 역할을 담당한다. 각각의 레이어에 적용된 수식은 다음 Eq. (1)~(6)과 같다.

Fig. 1. LSTM Networks Architecture
../../Resources/KSCE/Ksce.2024.44.6.0743/fig1.png
(1)
$f_{t}=\sigma(W_{f}\bullet[h_{t-1},\: X_{t}]+b_{f})$
(2)
$i_{t}=\sigma(W_{i}\bullet[h_{t-1},\: X_{t}]+b_{i})$
(3)
$o_{t}=\sigma(W_{o}\bullet[h_{t-1},\: X_{t}]+b_{o})$
(4)
$\hat{c}_{t}=\tan h(W_{c}\bullet[h_{t-1},\: X_{t}]+b_{c})$
(5)
$c_{t}=i_{t}\bullet\hat{c}_{t}+f_{t}\bullet c_{t-1}$
(6)
$h_{t}=o_{t}\bullet\tan h(c_{t})$

여기서, $c_{t}$는 활성화 벡터로 셀 상태를 업데이트한다. $\sigma$와 tanh$(x)$는 각각 로지스틱 시그모이드 함수와 하이퍼볼릭 탄젠트 함수 연산자를 의미하며, [$W_{f},\: W_{i},\: W_{o},\: W_{c}$]는 각각의 레이어에 활용된 가중치 행렬, [$b_{f},\: b_{i},\: b_{o},\: b_{c}$]는 편향 벡터이다.

기존 LSTM은 단일 방향으로 정보를 추출하는 것으로 과거의 정보로 현재 상태를 예측하고 이전 단계에서 현재 단계의 정보로 은닉 상태를 유지한다. 이 연구에서는 구조물의 비선형성을 가지는 복잡한 패턴을 학습하고 더 많은 데이터를 확보하면서 과거 정보의 소실을 줄이기 위해 Fig. 2와 같이 역방향 레이어를 추가하여 이전과 미래 시점에 대한 시간 단계 정보를 모두 활용하였다. 이는 시계열 데이터 학습 및 검증 성능에 큰 영향을 미치고, 단방향 LSTM에 비해 강력한 장기 의존성을 가진다(Siami-Namini et al., 2019). 이를 토대로 순방향과 역방향 은닉 상태를 모두 활용하여 현재 상태를 출력할 수 있도록 구성한 양방향 LSTM 모델을 기반한 변위 예측 방법을 제안하고자 한다.

Fig. 2. Architecture of Bi-LSTM
../../Resources/KSCE/Ksce.2024.44.6.0743/fig2.png

2.1 변형률계 데이터를 활용한 매개변수 구성

명지대학교 하이브리드 구조실험센터에서 수행한 거더의 정적 성능 시험 데이터를 활용하여 인공지능 모델을 구성하고 처짐 예측 성능을 평가하였다. Table 1은 11개 거더의 형식에 따른 종류(G)와 압축강도, 강성 등 실험체 제원을 나타낸다. 실험은 프리스트레스 콘크리트 9개, 강합성 소재 2개로 총 11개의 거더에 유압 가력 재하장비로 거더 중앙에 정적하중 재하를 통해 이루어졌다(Fig. 3). 구조 거동 특성 파악을 위해 전기저항식 변형률계, 변위계, 경사계 등 다수의 측정 센서와 구조물의 최대전단력을 계산하기 위한 로젯 변형률계가 활용되었다. Fig. 4는 J-거더의 정적하중(F) 증가 및 거더의 상하부 변형률(T1, T2, C1, C2)과 변위(D)의 변화를 도식하였다. 이를 통해 하중-변위 관계는 쌍선형에 가까우며, 변형률-변위는 선형에 가까우나 비선형성이 포함되어 있음을 확인할 수 있다. 입력변수와 변위와의 상관도를 그림에 도식하여 변형률(T1, T2, C1, C2)은 변위와 연관성이 가장 높은 것으로 나타났으며, 변형률과 하중의 상관관계는 상대적으로 낮게 나타났다. 이는 하중 증가에 따른 비선형적인 거동의 원인인 것으로 판단되며 인공지능 모델의 성능은 응답의 비선형성을 포착하여 이를 예측 결과에 반영함에 있다.

Table 1. Specifications of the Girder Test Specimen

Girder Name

Specifications of the 11 Girder Test Specimens

Type

Measured Strain

Strength

(MPa)

Elastic Modulus

(GPa)

Stiffness

(MN/m)

Load

(kN)

Deflection

(mm)

A

PSC Box

Rebar

45.00

31.50

80.00

4003.38

50.03

B

Steel Composite Plate

Plate

490.00

200.00

9,44

905.99

95.88

C

PSC Girder

Rebar

45.00

31.50

6.46

2356.86

366.60

D

PSC Girder

Rebar

45.00

31.50

37.25

3359.15

90.20

E

PSC Girder

Rebar

45.00

31.50

36.87

2566.22

69.64

F

Steel Composite Plate

Plate

490.00

200.00

1.00

168.00

168.00

G

PSC Girder

Rebar

27.00

20.00

1.03

383.48

373.66

H

PSC Girder

Rebar

40.00

29.70

0.67

165.98

246.82

I

PSC Girder

Rebar

50.00

33.20

0.64

163.26

253.29

J

PSC Girder

Rebar

50.00

33.20

0.92

199.23

216.99

K

PSC Girder

Rebar

40.00

29.70

0.61

208.60

343.36

Fig. 3. Static Load Test (J-Girder)
../../Resources/KSCE/Ksce.2024.44.6.0743/fig3.png
Fig. 4. Displacement History Data Versus Force and Strain(J Girder)
../../Resources/KSCE/Ksce.2024.44.6.0743/fig4.png

이 연구에서는 응력 변화량에 높은 신뢰성을 가진 데이터만을 활용하여 인공지능 모델 구축하는 것을 목표로 하였으며, 이를 위해 모든 거더 성능평가에 공통으로 포함되어 있는 전기저항식 변형률계 데이터를 입력 정보로 구성하였다. 거더의 물성치 입력 변수로는 거더의 종류, 재하 하중이 포함되었으며, 거더 중앙의 처짐 이력을 출력변수로 구성하였다. 실험별로 상이한 입출력 이력을 동일하게 하기 위해 선형 보간법을 사용하여 데이터의 길이를 통일하였다.

테스트용으로 활용한 거더 1개소의 응답을 제외하고, 나머지 거더의 응답을 인공지능 모델에 학습시키기 위해 80(A-H 거더):20(I, J 거더)의 비율로 훈련 및 검증 데이터로 무작위 분류하였다. 이후 상관계수를 알아보고 인공지능 모델에 학습을 진행하여 하이퍼파라미터를 구성한 후 결정계수와 평균 제곱근 오차 값을 비교하여 정합성을 평가하였고, 최상위 모델을 선정하였다.

2.2 양방향 LSTM (Bi-derectional Long-Short Term Memory) 네트워크

본 연구에서 제안한 양방향 LSTM 기반 변위 추정 알고리즘은 Fig. 7과 같이 구성하였다. LSTM 모델의 입력은 샘플 수, 시간 단계, 그리고 각 시간 단계에서 관측된 재하 시간 이력의 단일 변수를 포함하는 3차원 배열로 구성하여, 시간적 패턴을 효과적으로 학습할 수 있도록 하였다. 이후, 데이터의 일관성을 유지하고 모델 훈련의 효율성을 높이기 위해 데이터 길이를 정규화하고 스케일링하는 전처리 과정을 수행하였다. 시퀀스 데이터의 패턴을 학습하도록 윈도우 사이즈와 배치 사이즈를 설정하고, 케라스 함수형 API를 활용하여 최적의 레이어를 정의하고 입력 시퀀스 레이어를 연결하였다. 양방향 LSTM의 학습 속도 개선을 위해, GPU를 활용한 연산 최적화가 필요하다. 이를 위해 NVIDIA에서 제공하는 CuDNN 라이브러리에 기반한 알고리즘을 구성하였다(Chetlur et al., 2014) 손실 함수와 활성화 함수를 정의하고, 전체 데이터 중 무작위로 선정한 20 %의 검증 데이터의 예측 손실값을 Epoch 증가에 따라 비교하여 성능을 검토하였다. 최종적으로 테스트 데이터에 대한 예측 성능 평가를 수행함으로써 제안한 기법을 적용성을 평가하였다.

Fig. 5. Correlation between Input Variables and Displacement
../../Resources/KSCE/Ksce.2024.44.6.0743/fig5.png
Fig. 6. Cross Section of the Experimental Girders and the Location of the Strain Gauges
../../Resources/KSCE/Ksce.2024.44.6.0743/fig6.png
Fig. 7. Flowchart of the Proposed Algorithm
../../Resources/KSCE/Ksce.2024.44.6.0743/fig7.png

3. 변위 예측 결과

인공지능 모델은 Anaconda 오픈소스를 기반으로 가상환경을 생성하여 Python v3.9.17(Van and Drake, 1995), CUDA 11.2, CuDNN 8.1 환경 하에서 인공지능 모델을 구축하였다. 예측변위의 정합성 개선을 위해 tensorflow-gpu, keras, sklearn 라이브러리 등에서 활용한 주요 함수의 하이퍼파라미터 최적화를 수행하였다.

3.1 하이퍼파라미터 최적화

딥러닝 네트워크의 하이퍼파라미터는 모델의 성능과 학습 효율성에 중대한 영향을 미치는 요소이며 윈도우 사이즈, 배치 사이즈, 필터 수, 커널 크기, LSTM 유닛 수, 드롭아웃 비율, 학습률, 감쇠율 등 모델이 학습 데이터를 처리하는 과정에서 최적화된 성능이 되도록 평가한다. 활용되는 주요 변수 가운데, 모델의 성능에 영향을 미치는 인자를 분류하였고, 활성화 함수와 손실 함수의 중요성이 반복학습을 통해 부각되었다. 이 연구에서 하이퍼파라미터 선정을 위해 활용한 활성화 함수는 ELU, GELU, LeakyReLU로, 각각 입력값의 비선형성을 효과적으로 처리하여 모델의 학습 성능을 향상시키기 위한 방법이며, 아래의 수식으로 이루어져 있다. ELU 함수는 식 (7)과 같이 입력 값 $x$가 양수일 때 그대로 반환하고, 음수일 때 $\alpha$는 음수 입력에 적용되는 정도를 조절하여 지수 함수를 사용한다. GELU는 식 (8)과 같이 입력 값 𝑥를 표준 정규 분포의 누적 분포 함수 $\Phi(x)$와 곱하여 반환한다. 실제 계산에서 $\Phi(x)$는 복잡하기 때문에, 이를 tanh 함수 등을 이용한 근사식으로 활용한다. LeakyReLU는 기존 ReLU가 음수인 경우 0으로 고려하여 죽은 뉴런(Dying ReLU)이 발생하는 단점을 식 (9)와 같이 작은 기울기 $\alpha$를 곱하면서 이를 보완한 함수이다. 손실 함수는 평균절대오차(MAE), 평균제곱오차(MSE), 평균제곱근오차(RMSE), 그리고 평균절대오차와 평균제곱오차의 가중치를 고려하여 식 (13)와 같이 결합한 혼합손실함수(Hybrid Loss)를 사용하였으며, 아래의 수식으로 이루어져 있다.

(7)
ELU($x$) $=\begin{cases} x&{if}{x}> 0\\ \alpha(\exp({x})-1)&{if}{x}\le 0 \end{cases}$
(8)

GELU($x$) $= x\bullet\Phi(x)$

$\approx x\bullet 0.5\bullet(1+\tan h(\sqrt{\dfrac{2}{\pi}}(x+0.044715x^{3}))$

(9)
LeakyReLU($x$) $=\begin{cases} x&{if}{x}>0\\ {ax}&{if}{x}\le 0 \end{cases}$
(10)
MAE $=\dfrac{1}{n}\sum_{i=1}^{n}vert y_{i}-\hat{y}_{i}vert$
(11)
MSE $=\dfrac{1}{n}\sum_{i=1}^{n}(y_{i}-\hat{y}_{i})^{2}$
(12)
RMSE $=\sqrt{\dfrac{1}{n}\sum_{i=1}^{n}(y_{i}-\hat{y}_{i})^{2}}$
(13)
Hybrid Loss $=\alpha\bullet MAE +\beta\bullet MSE$

여기서 평균절대오차는 예측 값($\hat{y}_{i}$)과 실제 값($y_{i}$) 사이의 오차에 대한 절대 평균으로 모든 오차를 동일시하여 이상치에 덜 민감하다. 평균제곱오차는 예측 값($\hat{y}_{i}$)과 실제 값($y_{i}$) 사이의 오차의 제곱 평균으로 큰 오차에 더 큰 패널티가 부여되기 때문에 이상치에 민감하다. 평균제곱근오차는 평균제곱오차에 제곱근을 취한 값으로 해석을 쉽게 하여 직관적인 해석이 가능하다. 혼합손실함수는 평균절대오차와 평균제곱오차에 대한 $\alpha$와 $\beta$는 가중치 기반 혼합 손실함수이며, 원하는 손실 함수의 특성을 조정하여 각 단일 함수의 단점을 보완하고 특정 문제에 대한 적절한 구성을 통해 성능 개선이 가능하다.

이외의 변수, 윈도우 사이즈 “14”, 배치 사이즈 “64”, 합성곱 레이어 필터 “200”, 커널의 크기 “2”, 양방향 LSTM 유닛 수 “100”, 드롭아웃 “0.2”, 초기학습률 “0.0001”, 감쇠율 “0.0005”로 고정하여 성능 분석을 수행하였다. 11개소 거더 데이터 중 1개소 테스트 데이터를 제외하고, 20 %를 검증 데이터로 활용하여 Fig. 8과 같이 전체 알고리즘을 에포크 5000번까지 학습한 결과, loss 값은 0~0.02로 수렴하는 양상을 보여 과적합 문제가 점진적으로 완화되는 것으로 확인할 수 있다. 활성화 함수는 Fig. 9(a)와 같이 ELU 함수에서 높은 정합성을 보여주었으며 손실함수는 Fig. 9(b)와 같이 평균절대오차 함수에서 우수한 성능으로 나타났다. 이를 기반으로 최적화된 하이퍼파라미터를 활용한 검증 데이터에 대한 성능을 평가하였다.

Fig. 8. Hybrid Loss Variation for Epoch 5000 of Training and Validation Data
../../Resources/KSCE/Ksce.2024.44.6.0743/fig8.png
Fig. 9. Effect of Activation Functions and Loss Functions for the Prediction of Test Data. (a) Activation Functions, (b) Loss Functions
../../Resources/KSCE/Ksce.2024.44.6.0743/fig9.png

3.2 모델 알고리즘 성능 평가

본 연구에서는 최적화된 하이퍼파라미터를 기반으로 입출력값 사이의 비선형 관계로부터 거더 중앙의 처짐을 추정하고, 정합성을 평가하였다. 제안한 기법의 성능 비교를 위해 이전 연구에서 활용되었던 Catboost, XGBoost, LightGBM에 기반한 처짐 추정 결과를 활용하였다. 이 기법들은 모두 그라디언트 부스팅을 기반으로 CatBoost는 범주형 데이터를 처리하는 데 특화되어 있으며, XGBoost는 병렬화 및 나무 가지치기를 통해 데이터를 효율적으로 성능 최적화한다. LightGBM은 GOSS 기법을 사용하여 불필요한 데이터 샘플을 필터링함으로써 메모리 사용을 줄이고 학습 속도를 향상시키는 기법이다(Shyam et al., 2020). 검증데이터를 활용한 각 기법의 알고리즘에 대한 정합성을 평가 결과는 검증데이터에 대한 각 기법의 정합성 평가 결과 분석을 위해, 하중-변위 곡선을 활용하였다. Fig. 10(a)과 같이 검증으로 활용한 I거더 처짐 추정 결과, 모든 인공지능 모델 결정계수는 0.9 이상, 평균제곱근오차는 10 mm 미만으로 나타났으며(Table 2), Fig. 10(b)의 J거더 처짐의 경우에도 모든 인공지능 모델들의 결정계수는 0.9 이상, 평균제곱근오차는 5 mm 미만으로 나타났다(Table 3). 두 결과는 모델이 실제 변위 응답과 유사한 결과를 가지는 것으로 나타나지만, 검증 데이터는 전체 훈련 데이터에서 무작위 추출된 일부에 불과하므로, 과적합 및 모델의 일반화 능력을 평가하는 데는 한계가 있다. 이에 따라 학습에 관여하지 않은 테스트 데이터의 성능 평가 결과, Fig. 11과 같이 양방향 LSTM 모델만이 결정계수는 0.9 이상, 평균제곱근오차는 9.55 mm로 활용된 기법 중 가장 우수한 성능을 보였다. 이는 시계열 데이터의 양방향 정보를 모두 활용함으로써 과거와 미래의 정보를 동시에 학습하여 복잡한 시계열 패턴을 더 정확하게 예측할 수 있는 것으로 판단되며 과적합 문제가 완화된 것으로 보여진다. 반면, 단방향 LSTM 모델과 다른 그라디언트 부스팅 기반 모델들은 결정계수 0.9 이하, 평균제곱근오차 27~45 mm의 범위에 분포하며 상대적으로 성능이 저하되었다(Table 4). 이는 단방향 LSTM이 오직 순방향 시계열 정보만을 사용하여 누적된 변위 이력의 학습이 저하되기 때문으로 판단된다. XGBoost, LightGBM, CatBoost와 같은 모델들은 각 변수 간의 관계를 학습하는 데 중점을 두고 시간에 따른 데이터의 흐름과 연속성을 충분히 반영하지 못해 새로운 테스트 데이터에서 성능이 다소 낮아진 것으로 판단된다.

Fig. 10. Force-Displacement Curves from Experiment and Prediction. (a) I Girder Validation Data, (b) J Girder Validation Data
../../Resources/KSCE/Ksce.2024.44.6.0743/fig10.png
Table 2. Prediction Accuracy Metrics on the Validation Data for the I-Girder Using Various Methods

R2-Score

RMSE

Bi-LSTM

0.99

2.72

LSTM

0.98

2.95

LightGBM

0.98

9.55

XGBoost

0.93

8.32

CatBoost

0.98

9.32

Table 3. Prediction Accuracy Metrics on the Validation Data for the J-Girder Using Various Methods

R2-Score

RMSE

Bi-LSTM

0.99

1.33

LSTM

0.99

1.36

LightGBM

0.99

1.45

XGBoost

0.98

1.35

CatBoost

0.99

4.33

Fig. 11. Comparison of Displacement Prediciton for Various Methods
../../Resources/KSCE/Ksce.2024.44.6.0743/fig11.png
Table 4. Prediction Accuracy Metrics for Various Methods

R2-Score

RMSE

Bi-LSTM

0.99

9.55

LSTM

0.73

45.10

LightGBM

0.85

33.99

XGBoost

0.89

27.39

CatBoost

0.78

39.88

이 연구에서 제안한 LSTM 모델이 가장 좋은 결과를 보여주었으며 이에 대한 학습 수준에 따른 성능 분석을 위해 훈련 데이터의 양에 따른 예측 정확도와 소요 시간을 분석하였다. 훈련 데이터의 양에 따른 예측 정확도와 소요 시간을 분석하였다. Fig. 12에 나타난 바와 같이 전체 이력에 대한 예측값은 실험군이 8개 미만에서 점진적으로 감소한다. 무작위로 추출한 훈련 데이터 수가 7개인 경우, 결정계수 0.8, 평균제곱근오차 38 mm로 나타났고, 5개인 경우 결정계수는 0.3 이하, 평균제곱근오차는 70 mm 이상 오차가 발생한 것으로 나타났다. ‘time 라이브러리’를 활용하여 인공지능 모델의 학습에 소요되는 시간은 분석한 결과, 훈련 데이터가 8개일 때 결정계수가 0.99, 평균제곱근오차는 9.55 mm로 매우 높은 정확도를 보였지만, 데이터 수가 감소할수록 성능이 급격히 저하되며 5000 에포크까지 누적된 학습 시간은 학습데이터 수에 선형 비례하는 것으로 나타났다(Table 5). 이를 통해, 95 % 이상의 정합성을 가지는 변위 이력 예측을 위해 최소 거더 실험 데이터는 8개임을 확인할 수 있으며, 추가 데이터를 통한 학습은 정합성 개선 효과는 낮고 비용의 증가를 야기할 것으로 평가할 수 있다.

Fig. 12. Effect of the Number of Training Datasets for Displacement Prediction Using Bi-LSTM
../../Resources/KSCE/Ksce.2024.44.6.0743/fig12.png
Table 5. Prediction Accuracy Comparison Using Bi-LSTM Depending on the Number of Training Datasets

R2-Score

RMSE

Time(min)

8

0.99

9.55

34.07

7

0.80

38.76

32.69

6

0.79

39.03

29.59

5

0.30

72.99

23.59

4. 결 론

이 연구에서는 11개 거더에 대한 정적하중 재하실험으로부터 변형률계 데이터와 거더 중앙에서의 변위 응답을 취득하고, 인공지능 기법을 활용하여 처짐을 추정하는 방법을 제시하였다. 입력 변수는 재하하중과 상하부 변형률 시계열 응답을 비롯하여, 거더 종류와 길이가 포함되었다. 데이터의 훈련 및 검증을 위해 각각 80 %, 20 %로 무작위로 분류하였다. 인공지능 모델의 최적화를 위해 활성화 함수, 손실 함수에 대한 영향을 분석하고 변위 예측을 위한 최적 조합을 찾아냈다. 검증 데이터와 테스트 데이터에 대한 처짐 예측 정합성을 평가한 결과 다음과 같은 결론이 도출되었다.

(1) 하이퍼파라미터 최적화를 위한 활성화 함수에 따른 성능을 비교한 결과, ELU 함수에서 가장 높은 정합성을 보여주었다. 이는 ReLU나 LeakyReLU와 달리 ELU 함수가 입력이 음수인 경우에도 뉴런이 활성화되어 기울기 소실 및 과적합 문제를 완화했기 때문인 것으로 판단된다. 한편, 손실함수에서는 평균절대오차 함수에서 가장 높은 정합성을 가지는 것으로 확인되었다. 평균절대오차 함수는 제곱이 아닌 오차의 크기만을 반영하여 예외적 수치에 덜 민감하고 예측값과 실제값 사이의 차이를 단순하고 직관적으로 나타내므로, 안정적인 학습을 제공한 것으로 판단된다.

(2) 제시한 양방향 LSTM과 더불어 단방향 LSTM, LightGBM, XGBoost, Catboost 기법을 활용하여 변위 예측의 정합성 평가를 수행하였으며, 검증으로 활용된 I 거더에서 모든 인공지능 모델 결정계수는 0.9 이상, 평균제곱근오차는 10 mm 미만, J 거더의 경우 인공지능 모델들의 결정계수는 0.9 이상, 평균제곱근오차는 4 mm 미만으로 나타나, 활용한 모든 기법에서 93~99 %의 정합성을 가지는 것으로 나타났다.

(3) 테스트 데이터의 정합성 평가 결과, 이 연구에서 제시한 양방향 LSTM 모델에서만 결정계수가 0.9 이상, 평균제곱근오차는 9.55 mm로 나타나 다른 모델보다 우수한 예측 성능을 보였고, 이를 통해 제시한 양방향 LSTM 기법이 학습이 이루어지지 않은 비선형성에 대한 포착이 용이하게 이루어지는 것을 확인하였다. 이를 기반으로 훈련 데이터 양에 따른 학습 소요 시간과 예측 정합성 분석을 수행하였다. 소요 시간은 학습 데이터 수에 선형 비례적으로 나타난 반면, 훈련 수준에 따른 예측 정확도는 로그 함수의 형태로 수렴하는 결과가 나타났으며, 95 % 이상의 신뢰성 확보를 위한 학습 데이터셋은 최소 8개임을 확인하였다.

이 연구에서 제시한 기법을 통해 변형률 정보와 주요 물성치 정보를 통해 거더의 처짐을 추정하는 것이 가능함을 보였다. 인공지능 모델은 하중-변위 및 변형률-변위간 비선형성을 효과적으로 포착하는 것으로 확인되었으며, 이를 통해 향후 상시 거동 데이터 기반 응답 예측이 가능할 것으로 판단된다. 기존 안전진단의 내하력 평가를 효과적으로 대체하여, 스마트 모니터링을 통한 유지관리에 기여할 수 있을 것으로 기대된다.

Acknowledgements

This work was supported by the National Research Foundation of Korea (NRF) grant funded by the Korean government (Ministry of Science and ICT) (No. 2022R1G1A10061941213582110600102).

References

1 
"Bengio, Y. (2012). “Practical recommendations for gradient-based training of deep architectures.” In Neural Networks: Tricks of the Trade: Second Edition, Springer Berlin Heidelberg, Berlin, Heidelberg, pp. 437-478."DOI
2 
"Chetlur, S., Woolley, C., Vandermersch, P., Cohen, J., Tran, J., Catanzaro, B. and Shelhamer, E. (2014). “cuDNN: Efficient primitives for deep learning.” arXiv preprint, arXiv:1410.0759."DOI
3 
"Choi, D. Y., Paik, S. H., Kim, Y. K., Jung, S. W. and Kim, D. N. (2021). “Deep-learning crack analysis for visual-safety inspection of bridge by drones.” Journal of the Korea Information Technology Society, Vol. 19, No. 12, pp. 115-121 (in Korean)."URL
4 
"Lai, D., Demartino, C. and Xiao, Y. (2023). “Interpretable machine-learning models for maximum displacements of RC beams under impact loading predictions.” Engineering Structures, Vol. 281, 115723."DOI
5 
"Lederer, J. (2021). “Activation functions in artificial neural networks: A systematic overview.” arXiv preprint, arXiv, https://arxiv.org/abs/2101.09957."URL
6 
"Malekloo, A., Ozer, E., AlHamaydeh, M. and Girolami, M. (2022). “Machine learning and structural health monitoring overview with emerging technology and high-dimensional data source highlights.” Structural Health Monitoring, Vol. 21, No. 4, pp. 1906-1955."DOI
7 
"Medsker, L. R. and Jain, L. (2001). “Recurrent neural networks.” Design and Applications, Vol. 5, pp. 64-67."URL
8 
"Ministry of Land, Infrastructure and Transport (MOLIT) (2021). Detailed Guidelines for the Safety and Maintenance of Facilities (Part of Safety Inspection and Precise Safety Diagnosis). Jinju: Korea Authority of Land & Infrastructure Safety (in Korean)."URL
9 
"Nie, M., Xia, Y. H. and Yang, H. S. (2019). “A flexible and highly sensitive graphene-based strain sensor for structural health monitoring.” Cluster Computing, Vol. 22, pp. 8217-8224."DOI
10 
"Park, S. W., Chang, M. W., Yun, D. G. and No, M. H. (2023). “A study on the analysis of bridge safety by truck platooning.” Journal of the Korea Information Technology Society, Vol. 27, pp. 50-58 (in Korean)."URL
11 
"Sah, R. K., Kumar, A., Gautam, A. and Rajak, V. K. (2022). “Temperature independent FBG based displacement sensor for crack detection in civil structures.” Optical Fiber Technology, Vol. 74, 103137."DOI
12 
"Sarwar, M. Z. and Park, J. W. (2020). “Bridge displacement estimation using a co-located acceleration and strain.” Sensors, Vol. 20, No. 4, 1109."DOI
13 
"Shyam, R., Ayachit, S. S., Patil, V. and Singh, A. (2020, December). “Competitive analysis of the top gradient boosting machine learning algorithms.” In 2020 2nd International Conference on Advances in Computing, Communication Control and Networking (ICACCCN) (pp. 191-196). IEEE."DOI
14 
"Siami-Namini, S., Tavakoli, N. and Namin, A. S. (2019). “The performance of LSTM and BiLSTM in forecasting time series.” In 2019 IEEE International Conference on Big Data (Big Data) (pp. 3285-3292). IEEE."DOI
15 
"Van Rossum, G. and Drake Jr, F. L. (1995). Python tutorial (Vol. 620). Amsterdam, The Netherlands: Centrum voor Wiskunde en Informatica."URL
16 
"Wang, Q., Ma, Y., Zhao, K. and Tian, Y. (2020). “A comprehensive survey of loss functions in machine learning.” Annals of Data Science, Vol. 1, pp. 1-26."DOI
17 
"Won, J. B., Park, J. W., Park, J. Y., Shin, J. S. and Park, M. Y. (2021). “Development of a reference-free indirect bridge displacement sensing system.” Sensors, Vol. 21, No. 16, 5647."DOI
18 
"Yazdanpanah, O., Chang, M. W., Park, M. S. and Kim, C. Y. (2022). “Seismic response prediction of RC bridge piers through stacked long short-term memory network.” Structures, Vol. 45, pp. 1990-2006."DOI
19 
"Yeon, S. H., Kim, J. S. and Yeon, C. H. (2019). “A study on smart sensor-based bridge infrastructure safety monitoring techniques.” Korean Journal of Geographic Information Studies, Vol. 22, No. 2, pp. 97-106."URL
20 
"Yessoufou, F. and Zhu, J. (2023). “Classification and regression-based convolutional neural network and long short-term memory configuration for bridge damage identification using long-term monitoring vibration data.” Structural Health Monitoring, Vol. 22, No. 6, pp. 4027-4054."DOI
21 
"Yu, Y., Si, X., Hu, C. and Zhang, J. (2019). “A review of recurrent neural networks: LSTM cells and network architectures.” Neural Computation, Vol. 31, No. 7, pp. 1235-1270."DOI