이동민
(Dongmin Lee)
1iD
오랑치맥 솜야
(Sumiya Uranchimeg)
2
권현한
(Hyun-Han Kwon)
3†iD
-
정회원 · 세종대학교 건설환경공학과 석사과정
(Sejong University · dongmin.lee@sju.ac.kr)
-
베이지안웍스 부장
(Bayesianworks Research Institute · sumya963@bayesianworks.com)
-
종신회원 · 교신저자 · 세종대학교 건설환경공학과 교수
(Corresponding Author · Sejong University · hkwon@sejong.ac.kr)
Copyright © 2021 by the Korean Society of Civil Engineers
키워드
댐 유입량 예측, 기계학습, 상태-공간 모형, LSTM, SVM
Key words
Dam inflow forecasting, Machine learning, State-space model, LSTM, SVM
1. 서 론
21세기 들어 전 지구적인 기후변화는 강수 패턴의 비정상성과 극한 강수 이벤트의 빈도와 강도 증가를 초래하고 있으며, 이로 인한 수재해 리스크 또한
점차 고조되고 있다. 특히 한국과 같은 계절성 강우 특성이 뚜렷한 지역에서는 여름철 집중호우로 인한 홍수 피해가 반복적으로 발생하고 있으며, 이에
따른 댐 운영의 불확실성은 수자원 정책 및 재난 대응 시스템 전반에 큰 도전과제를 제기하고 있다. 이러한 환경에서 댐 유입량의 정확한 예측은 선제적
홍수 대응과 실시간 댐 운영 전략 수립에 핵심적인 역할을 하며, 궁극적으로 수해 피해 최소화와 사회적 안전 확보에 기여할 수 있다.
기존의 댐 유입량 예측은 대부분 물리 기반의 강우-유출 모형을 활용해왔다. 이들 모형은 강우, 증발산, 유출 등의 물리적 과정을 엄밀히 모사함으로써,
모형 해석 가능성과 현장 적용성을 보장하는 장점이 있다(Devia et al., 2015). 그러나 강우-유출 모형은 일반적으로 다수의 매개변수 보정 과정을 요구하며, 이는 입력 자료의 품질, 수문 경계조건, 초기조건에 민감하게 작용하여
모형 불확실성과 예측 성능 저하를 초래할 수 있다. 또한 한정된 유역 특성과 과거 시계열 자료에 맞춰 구축된 물리 모형은 기후변화로 인한 미래의 비정상적
조건을 충분히 반영하지 못하는 구조적 한계를 지닌다.
이러한 제약을 극복하기 위한 대안으로 최근에는 기계학습(machine learning) 기반의 자료 중심 예측 접근이 주목받고 있다. 기계학습 모형은
대규모 시계열 자료를 기반으로, 변수 간의 비선형 관계 및 시간 지연 효과를 스스로 학습할 수 있는 구조를 지닌다. 특히 LSTM(Long Short-Term
Memory), SVM(Support Vector Machine) 등 시계열 예측에 특화된 모형은 수문학적 시계열의 비선형성(non-linearity),
비정상성(non-stationary)을 효과적으로 고려할 수 있어, 최근 다수의 연구에서 홍수량 및 유입량 예측에 성공적으로 활용되고 있다(Gao et al., 2020; Hu et al., 2018). 예컨대, Jeong et al.(2003)은 인공신경망 기반 앙상블 모형을 통해 대청댐 유역의 유입량을 안정적으로 예측하였으며, Mok et al.(2020)은 LSTM을 활용한 용담댐 유입량 예측 연구에서 계절 단위 운영에 유의미한 정확도를 확보하였다.
그러나 기존 연구의 다수는 특정 시공간 조건 또는 유역 특성에 최적화된 모형 개발에 집중되었으며, 다양한 유입 특성과 기상 조건이 복합 작용하는 실제
운영 환경을 일반화하여 반영하는 데에는 제약이 있었다. 특히 LSTM과 같은 심층학습 기반 모형은 입력 자료의 구성 및 전처리 방식에 따라 예측 성능이
크게 좌우되며, 과적합(overfitting)이나 자기예측(shifting) 문제가 발생할 수 있다(Gao et al., 2020; Hu et al., 2018). 이는 시계열 자료가 자기상관성이 높고 극값(outlier)의 영향이 큰 수문 기상자료의 특성과 맞물려 더욱 두드러진다. 이러한 문제를 해결하기
위해서는 단순한 연속 시계열이 아닌, 시계열의 비선형 동역학적 구조를 반영하는 상태-공간(state-space) 기반 입력 재구성 기법이 요구된다.
상태-공간 기반 시계열 분석은 Takens(1981)의 이론에 기초하여, 단변량 시계열을 지체 시간(delay time)과 임베딩 차원(embedding dimension)의 조합을 통해 다차원 상태공간으로
재구성하는 방식이다. 이를 통해 기존 시계열이 내포한 동역학적 정보를 복원하고, 시계열의 패턴을 최근접 이웃 방식으로 추론할 수 있다(Kwon and Moon, 2005). 특히 Mutual Information(Fraser and Swinney, 1986)을 활용한 지체 시간 산정과 FNN(False Nearest Neighbor)에 기반한 임베딩 차원 결정은 고차원 시계열 구조에서도 신뢰도 높은 입력
자료 구축을 가능하게 한다.
이에 본 연구는 낙동강 유역 내 합천댐과 남강댐을 대상으로, 상태-공간 기반 기법을 활용해 예측에 최적화된 입력 자료를 구축하고, 이를 바탕으로 LSTM과
SVM 기계학습 모형을 적용한 유입량 예측 모형을 개발하였다. 대상 댐은 유역면적과 저수용량이 서로 상이하여 모형 적용에 따른 예측 성능 차이를 비교
분석하기에 적합하며, 이를 통해 댐 규모 및 유입 특성에 따른 기계학습 모형의 적용성 차이를 실증적으로 평가하고자 하였다.
또한 본 연구에서는 예측 선행 시간(1-6시간)별로 유입량 예측 성능을 정량 평가하였으며, 상관계수(Correlation Coefficient, CC),
Nash-Sutcliffe Efficiency(NSE), 평균제곱근오차(Root Mean Square Error, RMSE)를 활용해 각 모형의 예측
능력과 한계를 분석하였다. 더불어 댐별 강우사상 수의 차이, 수문학적 반응 민감도, 유입량 첨두의 범위 등을 비교 분석함으로써, 모형 선택 및 구조
설계 시 고려해야 할 실질적 기준을 도출하고자 하였다.
본 논문은 다음과 같은 세 가지 사항에 대해 중점적으로 검토하였다. 첫째, 상태-공간 기반의 입력 재구성 기법을 도입하여 기계학습 기반 유입량 예측
모형의 입력 자료 신뢰도를 개선하였다. 둘째, LSTM과 SVM의 구조적 특성과 예측 성능을 비교함으로써 댐 규모 및 유역 특성에 따른 모형 선택
기준을 제시하였다. 셋째, 수문 예측 분야에서 일반적인 한계로 논의되었던 과적합 및 자기예측 문제를 극복하기 위한 실질적 입력 자료 구성 절차를 제시하고,
기계학습 접근의 현장 적용 가능성을 평가하였다.
본 논문의 구성은 다음과 같다. 제 2장에서는 분석 지역 및 자료 구축 절차, 상태-공간 모형과 기계학습 기법을 설명한다. 제 3장에서는 각 예측
모형 적용 결과와 성능 평가지표를 바탕으로 분석 결과를 논의하고. 제 4장에서는 결론과 향후 연구 방향을 제시한다.
2. 자료 및 연구방법
2.1 상태-공간 모형을 이용한 입력 자료 구축
수문 시계열 자료는 관측의 제약성과 자연현상의 복잡성으로 인해, 타 분야에 비해 고품질의 연속 자료를 확보하기 어렵다. 이러한 한계로 인해 수문 시계열은
일반적으로 단변량(univariate)의 형태를 가지며, 예측 과정에서 자료의 불완전성과 정보 부족 문제가 빈번히 발생한다. 특히 시계열 내에 존재하는
비선형적, 비정상적 특성을 효과적으로 반영하기 위해서는 단변량 시계열을 다차원 상태-공간으로 재구성하는 임베딩(Embedding) 접근법이 필요하다(Kwon and Moon, 2006).
이 방법은 Takens(1981)의 재구성 정리에 기반하여, 단일 시계열로부터 지체 시간과 임베딩 차원을 활용해 다차원 상에서의 궤적을 복원하는 방식이다. 이렇게 구성된 상태-공간상의
점들은 시계열의 동역학적 상태를 반영하며, 현재 시점과 유사한 궤적을 가진 과거 시점의 점 집합(group)을 탐색함으로써 향후 시계열의 거동을 예측하는
데 활용된다(Kwon and Moon, 2005; Sauer et al., 1991; Hilborn, 1994). 이러한 방식은 최근접 이웃 기반의 예측(nearest neighbor forecasting)이나 비모수적 회귀기법과 결합되어, 자료 기반 시계열
예측의 유효한 수단으로 활용되고 있다.
본 연구에서는 이와 같은 상태-공간 기반 시계열 재구성 기법을 도입하여, 수문 시계열의 내재된 비선형성과 시간 지연 구조를 반영하고, 재구성된 상태-공간
상에서 예측 모형을 구축함으로써 예측 성능을 향상하고자 하였다.
상태-공간을 구성하기 위해 지체 시간과 임베딩 차원을 고려하였으며, Eq. (1)과 같다.
지체 시간($\tau$)은 시계열을 상태-공간으로 재구성할 때 사용하는 시간 간격의 단위를 의미하며, 임베딩 차원($d$)은 미래 값을 예측할 때
필요한 과거 시점의 관측치 개수를 나타낸다. 상태-공간은 이 두 요소를 기반으로 구성되며, $\tau$ 간격으로 $d$개의 시점을 배열하여 하나의
시계열 벡터로 재구성한다. 예를 들어, $\tau =4$이고 $d=6$인 경우, 4시간 간격으로 총 6개의 값을 입력 변수로 활용하게 되며, 이는
곧 24시간의 과거 정보를 기반으로 예측을 수행하는 구조이다.
이와 같이 연속적인 원자료를 그대로 활용하지 않고, 상태-공간으로 재구성된 시계열을 입력 자료로 사용하는 이유는 수문·기상 시계열 자료에서 자주 발생하는
과적합과 자기예측현상을 방지하기 위함이다. 과적합은 제한된 학습자료에 특화된 모형이 새로운 자료에 대해 낮은 예측 정확도를 보이는 현상을 의미하며,
자기예측 현상은 시계열의 자기상관성이 높은 특성으로 인해 모형이 자신의 이전 값을 그대로 따라가는 문제를 뜻한다. 이러한 현상은 RMSE 등 일부
성능지표 상에서는 좋은 결과를 보일 수 있으나, 실제 시계열 그래프에서는 실질적인 예측력을 보장하지 못하는 허상으로 작용할 수 있다(Gao et al., 2020; Hu et al., 2018). 따라서 본 연구는 상태-공간 기반의 재구성을 통해 비선형 시계열의 내재 구조를 반영한 입력 변수를 도출하고, 이를 통해 예측 모형의 일반화 성능을
제고하고자 하였다.
상태-공간 구성에서 지체 시간은 크기에 따라 자료가 왜곡될 수 있기에 추정 시 주의가 필요하다(Takens, 1981). 선형 모형에서 주로 사용하는 자기상관함수(autocorrelation function, ACF)와 비선형 상관성까지 평가할 수 있는 상호정보(mutual
information, MI)를 이용한다(Kwon and Moon, 2005). 본 연구에서는 ACF를 이용하여 상태-공간에서의 지체 시간을 추정하기 위해 평균상호함수(average mutual informantion, AMI)로
알려진 비선형 상관함수를 이용하였다. 관측치의 집합 $A=\left\{a_{i}\right\}$으로부터 온 측정치 $a_{i}$와 다른 관측치의 집합
$B=\left\{b_{j}\right\}$로부터 온 측정치 $b_{j}$와의 MI는 결합확률밀도 형태의 Eq. (2)로 정의할 수 있다(Fraser and Swinney, 1986).
여기서 $P_{AB}(a_{i},\: b_{j})$는 $(a_{i},\: b_{j})$에서 계산된 $a$와 $b$의 결합확률밀도이고, $P_{A}(a_{i})$와
$P_{B}(b_{j})$는 각각의 $a_{i}$와 $b_{j}$에서 계속된 주변확률밀도이다. 그리고 평균상호정보 $I(\tau)$은 Eq. (3)와 같이 정의할 수 있다.
Eq. (3)은 변량 추출(sampling)에서 구성요소를 결정하는데 유용하며 특히 경험적 시계열로부터 상태-공간을 구성할 때, 적절한 지체 시간 선택에 사용된다(Moon and Lall, 1996; Kwon and Moon, 2005). AMI가 최소가 되는 시간을 추정하여 $v(t)$의 상태-공간에서 $v(t+\tau)$ 관측치의 새로운 많은 정보를 제공하는 지체 시간을 결정하였다.
한편 임베딩 차원은 예측의 목적뿐만 아니라 단변량 시계열의 동역학적(dynamic) 특성을 분석하는 요소 중 하나이다(Kwon and Moon, 2005). FNN을 이용하여 차원을 결정하였다. FNN은 주어진 임베딩 차원에서 모든 점의 최근접 이웃(nearest neighbor)을 찾은 후 이 점들이
더 높은 차원에서 여전히 더 가까운 최근접 이웃을 찾을 수 있는지 검토하는 방법이다. 시계열의 벡터 $X = x_{1},\: x_{2},\: ...
,\: x_{n}$는 벡터의 최근접 이웃 $Y = y_{1},\: y_{2},\: ... ,\: y_{n}$을 $n$차원의 공간에서 추정하며
각 점에 대해 Eq. (4)를 반복적으로 계산한다.
거리 $R$은 $X$와 $Y$ 사이의 거리를 의미하며 $x_{n+1}$의 예측을 위한 기준으로써 $y_{n+1}$을 고려할 수 있으며, 여기서 $R$은
예측오차를 의미하게 된다. 따라서 $n$차원에 적절한 상태-공간이 구성될 수 있다면 벡터 $X$와 $Y$의 $n+1$번째 구성요소 간의 거리 $R$은
작아진다. 그러므로 적절한 임베딩 차원에 도달하면 FNN의 비율은 감소한다.
2.2 기계학습 모형
본 연구에서는 시계열 기반의 댐 유입량 예측을 위해 Support Vector Machine(SVM)과 Long Short-Term Memory(LSTM)
모형을 적용하였다. 두 모형은 각각 고차원 회귀 문제의 일반화 성능과 장기 시계열 의존성 학습 능력에 강점을 가지며, 서로 상이한 학습 메커니즘을
통해 다양한 수문 시계열 특성을 포착할 수 있다.
SVM은 분류 문제를 위해 개발된 지도학습 기법으로, 서로 다른 집단(class)에 속하는 자료를 가장 넓은 마진(margin)으로 구분하는 최적의
초평면(hyperplane)을 학습한다. 이는 모형이 새로운 자료에 대해서도 높은 일반화 성능을 갖도록 하기 위함이다(Kwon and Moon, 2006). Fig. 1(a)는 두 집단 간 SVM의 마진 최적화 개념을 시각화한 것으로, 초평면의 방향은 벡터 𝑤, 위치는 절편 𝑏로 정의되며, 마진을 이루는 서포트 벡터(support
vector)는 각 집단의 경계를 형성한다.
SVM 회귀(Support Vector Regression, SVR)의 경우, 입력 변수와 출력 변수 간의 비선형 함수 관계를 고차원 특징 공간에서
선형 결정 경계로 변환하여 예측을 수행한다. 이때 커널 함수(kernel function)를 통해 입력 자료를 고차원으로 사상(mapping)함으로써,
비선형 구조를 선형적으로 다룰 수 있도록 한다. 본 연구에서는 SVM 회귀 확장을 적용하여, 입력 시계열과 유입량 간의 복잡한 비선형 관계를 학습하고자
하였다.
LSTM은 전통적인 순환신경망(Recurrent Neural Network, RNN)이 가지는 장기 의존성 문제(long-term dependency)를
극복하기 위해 개발된 심층학습 구조이다. Fig. 1(b)는 LSTM의 기본 구조를 나타내며, Cell State와 세 가지 게이트(forget, input, output)를 중심으로 구성된다. Cell
State는 일종의 내부 메모리 역할을 하며, 시간적으로 멀리 떨어진 입력 간의 관계를 장기적으로 보존할 수 있도록 설계되어 있다(Hu et al., 2018).
각 게이트는 Sigmoid 활성 함수를 기반으로 작동하며, 정보의 유지·제거·추가를 선택적으로 조절한다. 특히 Tanh 함수는 입력의 스케일을 -1에서
1 사이로 조정하여 비선형성을 강화하고, Cell State나 최종 출력에 유연하게 반영되도록 한다. 이러한 구조 덕분에 LSTM은 시계열 내 복잡한
시간 지연 구조, 계절성, 급변 반응 등을 효과적으로 학습할 수 있으며, 최근 수문학 및 기상학 분야에서 높은 성능을 보이고 있다(Gao et al., 2020).
본 연구에서는 각각의 모형 구조와 장점을 활용하여, 재구성된 상태-공간 기반 입력 자료를 바탕으로 단기(1~6시간) 유입량 예측 모형을 구축하였다.
SVM은 제한된 학습자료에서도 안정적인 일반화 성능을 기대할 수 있으며, LSTM은 시계열 자료의 장기 의존성과 비선형성을 효과적으로 반영할 수 있다.
두 모형의 비교를 통해 댐 특성, 예측 시간 간격, 입력 자료 구성 방식에 따른 모형 적합성과 성능 차이를 분석하고자 하였다.
Fig. 1. Conceptual Diagrams of the Machine Learning Models Used in This Study. (a)
Support Vector Machine(SVM) Model Structure for Dam Inflow Prediction, (b) Long Short-Term
Memory(LSTM) Model Architecture Representing the Sequential Learning Process for Time-Series
Inflow Data
Fig. 2. Study Area and Water Level Monitoring Stations in Hapcheon and Namgang Dam
Basins
2.3 대상 유역 및 입력 자료 구축
본 연구에서는 유역 규모와 수문 특성에 따른 예측 성능의 차이를 비교·분석하기 위해 낙동강 유역 내 대표적인 다목적 댐인 합천댐과 남강댐을 대상지로
선정하였다. 합천댐은 유역면적 925 km², 저수면적 25.0 km², 총 저수용량 790백만m³이며, 남강댐은 유역면적 2,285 km², 저수면적
28.2 km², 총 저수용량은 309.2백만m³로, 두 댐은 유역 및 저장 특성이 상이하여 예측 모형 비교 분석에 적합하다.
모형 학습 및 예측에 사용된 입력 자료는 댐 유입량, 유역 평균 강우량, 상류 수위로 구성되었다. 이 중 강우량은 홍수 발생의 주요 원인인 수문 기상
인자이며, 유역 내 유출 과정을 통해 하천 유입량을 결정하므로 가장 핵심적인 입력 요소이다. 강우 자료는 댐 유역 인근에 위치한 다수의 강우 관측소로부터
수집하였으며, 각 지점의 영향 면적을 고려하여 티센다각형법(thiessen polygon method)을 적용한 유역 평균 면적 강우량으로 산정하였다.
강우에 의한 유출은 하천 수위를 상승시키고, 결과적으로 댐 유입량 변화로 이어진다. 이에 따라, 유입량 예측의 보조 인자로서 댐 상류 하천 수위 자료를
활용하였다. Fig. 2에는 합천댐 및 남강댐의 상류 수위 관측소 지점이 도시되어 있으며, 이 중 최소 20년 관측 기간을 보유한 지점만을 선별하여
입력 자료로 포함하였다. 수위 자료는 댐으로 유입되기 전 유역 내 유출 반응을 간접적으로 반영할 수 있다는 점에서, 시계열 기반 기계학습 모형의 입력
변수로서 높은 활용도를 가진다.
모형 성능과 일반화 능력은 입력 자료의 신뢰도와 품질에 크게 영향을 받기 때문에, 분석에 앞서 다음과 같은 자료 전처리 과정을 수행하였다. 먼저,
유입량 자료는 관측 과정에서 바람 등 외부 요인에 의해 순간적인 이상값(outlier) 또는 음수값이 포함될 수 있으므로, 이러한 비정상 변동성을
기준으로 이상 구간을 판단하고, 이동평균(moving average) 기법을 이용하여 평활화(smoothing)를 적용하였다. 단, 극단값(extreme
value) 제거로 인한 정보 손실을 방지하기 위해, 변동성이 과도하게 큰 구간에만 국한하여 평활화를 수행하였다.
수위 자료의 경우, 비정상적으로 급등하거나 급락한 구간을 이상값으로 판단하여 결측값으로 처리하였으며, 이후 선형보간(linear interpolation)
기법을 통해 연속성을 확보하였다. 이와 같은 전처리 과정은 학습 모형의 과적합을 방지하고, 예측 결과의 해석 가능성과 안정성을 제고하는 데 기여한다.
Table 1. Locations of Selected Water Level Monitoring Stations Used in the Models
for (a) Hapcheon Dam and (b) Namgang Dam
(a) Hapcheon Dam
|
Code
|
Name
|
Longitude
|
Latitude
|
2015620
|
Geochanggun(Uidonggyo)
|
127.92
|
35.71
|
2015635
|
Geochanggun(Geoyeolgyo)
|
127.9
|
35.68
|
2015655
|
Geochanggun(Jisangyo)
|
128.01
|
35.67
|
2015680
|
Hapcheongun(Hapcheondam)
|
128.03
|
35.53
|
(b) Namgang Dam
|
Code
|
Name
|
Longitude
|
Latitude
|
2018695
|
Jinjusi(Panmundong)
|
128.03
|
35.18
|
2018685
|
Hadonggun(Daegokri)
|
127.92
|
35.18
|
2018690
|
Jinjusi(Naepyungri)
|
128.02
|
35.15
|
2.4 모형 평가지표
본 연구에서는 예측 모의 성능을 정량적으로 평가하기 위해 세 가지 대표적인 회귀 성능 지표인 상관계수(Correlation Coefficient,
CC), Nash-Sutcliffe Efficiency(NSE), 그리고 평균제곱근오차(Root Mean Square Error, RMSE)를 적용하였다(Nash and Sutcliffe, 1970). 이들 지표는 예측값과 관측값 간의 선형 상관성, 설명력, 평균 오차 크기를 각각 반영하는 척도로, 수문 및 환경 분야에서 예측 모형 성능평가에
널리 활용되고 있다. 이들의 계산식은 Eq. (5), Eq. (6), Eq. (7)에서 제시된다.
$n$은 자료의 개수, $\hat{y_{i}}$는 예측값, $\overline{\hat{y_{i}}}$는 예측값의 평균, $y_{i}$는 관측값,
$\overline{y_{i}}$는 관측값의 평균을 뜻한다. RMSE는 0에 가까울수록, CC는 절댓값 1에 가까울수록, NSE는 1에 가까울수록
해당 모형의 성능이 우수함을 나타낸다.
3. 적용 결과
3.1 최적의 지체 시간과 임베딩 차원 결정
본 연구에서는 예측 모형의 학습 및 검증을 위하여, 2002년 1월 1일부터 2023년 12월 31일까지의 기간 동안 발생한 강우 사상(rainfall
events)을 분석에 활용하였다. 강우 사상은 홍수기에 한정하지 않고, 누적 강우량이 0 mm 초과인 연속적인 강우 구간으로 정의하였으며, 이 중
총 누적 강우량이 30 mm 이상인 강우 사상만을 입력 자료로 채택하였다. 전체 자료는 80 %의 훈련 자료(training set)와 20 %의
검증 자료(validation set)로 나누었다. 최종적으로 합천댐은 총 160개, 남강댐은 총 229개의 강우 사상을 활용하였다.
입력 자료 구축을 위해 각 변수(댐 유입량, 유역 평균 강우량, 수위 관측값)에 대해 지체 시간과 임베딩 차원을 산정하였다. 먼저, 댐 유입량 시계열의
경우에는 AMI를 활용하여 최적 지체 시간을 추정하였으며, FNN 알고리즘을 적용하여 임베딩 차원을 결정하였다.
유역 평균 강우량의 경우, 누적 시간 누적값이 유입량에 미치는 영향을 고려하기 위해 다양한 누적 시간과 지체 시간 조합에 따른 상관성 분석을 수행하였으며,
최대 상관성을 확보하면서도 가장 짧은 누적 시간을 선택하였다. 분석 결과, 합천댐과 남강댐 모두 유역 평균 강우량의 누적 시간은 24시간으로 결정되었다.
상류 수위 관측 자료의 경우, 각 수위 시계열과 해당 시점의 댐 유입량 간 상관성을 분석하여 지체 시간을 산정하였다. 마찬가지로 FNN 기법을 활용하여
임베딩 차원을 결정하였다. 이러한 과정을 거쳐 도출된 변수별 지체 시간과 임베딩 차원, 입력 변수의 단위는 Table 2에 정리되어 있으며, 이는 예측 모형의 입력 시계열 재구성에 직접적으로 적용되었다.
Table 2. Configuration of Input Variables, Including Units, Time Scale, Delay Time
and Embedding Dimension, for (a) Hapcheon Dam and (b) Namgang Dam
(a) Hapcheon Dam
|
Variables
|
Unit
|
Time Scale
|
Delay Time
|
Embedding Dimension
|
Dam Inflow
|
m3/s
|
Hourly
|
6 hr
|
4
|
Average Areal Rainfall
|
mm
|
1 hr
|
4
|
Water
Level
|
Geochanggun
(Uidonggyo)
|
EL.m
|
1 hr
|
5
|
Geochanggun
(Geoyeolgyo)
|
1 hr
|
5
|
Geochanggun
(Jisangyo)
|
1 hr
|
5
|
Hapcheongun
(Hapcheondam)
|
1 hr
|
5
|
(b) Namgang Dam
|
Variables
|
Unit
|
Time Scale
|
Delay Time
|
Embedding Dimension
|
Dam Inflow
|
m3/s
|
Hourly
|
8 hr
|
3
|
Average Areal Rainfall
|
mm
|
3 hr
|
3
|
Water
Level
|
Jinjusi
(Panmundong)
|
EL.m
|
2 hr
|
5
|
Hadonggun
(Daegokri)
|
8 hr
|
4
|
Jinjusi
(Naepyungri)
|
1 hr
|
5
|
Table 3. Optimized Hyperparameters Used in (a) LSTM and (b) SVM Models
(a) LSTM
|
Dam
|
Number of Hidden Units
|
Initial Learning Rate
|
LSTM Depth
|
Dropout Rate
|
Hapcheon Dam
|
256
|
0.008
|
2
|
50 %
|
Namgang Dam
|
256
|
0.001
|
1
|
50 %
|
(b) SVM
|
Dam
|
Kernel Function
|
Epsilon
|
Standardize
|
Box Constraint
|
Hapcheon Dam
|
Linear
|
0.17028
|
True
|
1 m3/s
|
Namgang Dam
|
Linear
|
0.06657
|
True
|
1 m3/s
|
3.2 모형 결과
모형의 초매개변수(hyperparameter) 조합은 Grid Search 기법을 통해 탐색하였으며, 모형별 최적 조합은 Table 3에 정리하였다.
이후 LSTM을 적용하여 선행 시간(forecast lead time)에 따른 예측 성능을 분석하였으며, 합천댐과 남강댐에 대한 관측 유입량과 예측
유입량 간의 비교 결과는 Fig. 3, Fig. 4에서 확인할 수 있다. 시점별 정량적 평가지표(CC, NSE, RMSE)는 Fig. 5, Fig. 6에서 나타내었다.
3.2.1 LSTM 적용 결과
합천댐에 대한 LSTM 적용 결과, 선행 시간이 증가함에 따라 예측 성능이 점진적으로 저하되는 경향이 나타났다(Fig. 3). 예를 들어, 5시간 예측의 CC는 0.811였으나, 6시간 예측에서는 0.751로 급감하였다(Fig. 5). 이는 예측 안정성 한계가 5시간 전후에 위치함을 시사한다. 또한, 유입량이 1,000 m3/s 이상으로 증가하는 경우에서 전반적인 과소 추정 경향이, 그 이하 구간에서는 과대 추정 경향이 확인되었다(Fig. 3). 이는 예측 모형이 극한 유입량에 대한 민감도를 충분히 확보하지 못했음을 의미한다.
남강댐에 대한 LSTM 적용 결과 또한 선행 시간 증가에 따른 성능 저하가 발생하였으나, 합천댐에 비해 성능 저하 폭이 상대적으로 작았다. 1시간
예측의 CC는 0.991, 5시간 예측은 0.878, 6시간 예측은 0.858로, 전 구간에서 안정적인 예측 성능을 유지하였다(Fig. 6). 또한 2,000 m3/s 이상의 관측 유입량에 대해서는 일부 과소 추정이 있었으나, 이후 발생한 유입량 첨두(peak)에 대해서는 정확한 응답 특성을 나타냈다(Fig. 4).
두 댐의 LSTM 기반 예측 결과를 비교한 결과, 남강댐의 예측 성능이 전반적으로 우수한 것으로 평가되었다. 이는 부분적으로 학습에 사용된 강우 사상
수의 차이에 기인한 것으로 보인다. 남강댐은 총 229개 강우 사상 중 184개를 훈련 자료로 활용한 반면, 합천댐은 총 160개 중 128개만을
사용하였다. 훈련 자료가 충분하지 않은 경우, 모형이 다양한 유입 패턴을 학습하는 데 한계를 가지며, 이에 따라 예측 성능이 저하될 수 있다.
이와 더불어, 댐의 물리적 특성 차이 또한 성능 차이에 영향을 미친 요인으로 해석된다. 합천댐은 저수지 면적은 남강댐보다 작지만, 저수용량은 약 2.6배
더 큰 대규모 댐으로, 유입량의 급격한 변화가 모형의 유입 첨두를 정확하게 포착하기 어려운 구조적 한계가 존재할 수 있다. 반면, 남강댐은 상대적으로
저수용량이 작고 유입량 변화에 민감하게 반응함으로써, LSTM 모형이 더 명확한 학습 패턴을 형성할 수 있었던 것으로 판단된다.
Fig. 3. Dam Inflow Prediction Results for Hapcheon Dam at Varying Forecast Lead Times.
Model Performance Outputs are Shown for Different Forecast Horizons. (a) 1 Hour, (b)
2 Hours, (c) 3 Hours, (d) 4 Hours, (e) 5 Hours, and (f) 6 Hours Ahead
Fig. 4. Dam Inflow Prediction Results for Namgang Dam at Various Forecast Lead Times.
Forecasting Performance of the Model is Illustrated for Multiple Lead Times. (a) 1
Hour, (b) 2 Hours, (c) 3 Hours, (d) 4 Hours, (e) 5 Hours, and (f) 6 Hours
3.2.2 SVM 적용 결과
합천댐에 대한 SVM 적용 결과, 선행 시간이 증가함에 따라 예측 성능은 소폭 저하되는 경향을 보였으나, 전반적인 성능 저하 폭은 LSTM보다 작았다.
1시간 예측 시 CC는 0.995, 6시간 예측에서는 0.887로 유지되어, LSTM에서 나타났던 급격한 성능 저하(6시간 예측 시 CC = 0.751)와
비교했을 때 상대적으로 안정적인 성능 유지를 확인할 수 있었다(Fig. 5). NSE 또한 유사한 추세를 보였으며, RMSE에서는 SVM의 우수성이 더 뚜렷하게 나타났다. SVM의 6시간 예측 RMSE는 88.9 m³/s로,
LSTM의 동 시간대 RMSE인 116 m³/s에 비해 약 1.3배 낮은 수치를 기록하였다(Fig. 5). 다만, SVM은 예측 선행 시간이 증가할수록 유입량 전반에 대해 일정한 과소 추정 경향을 지속적으로 보였다. 이는 극한 유입량의 반응 민감도
부족을 시사한다.
남강댐에 대한 SVM 적용 결과는 합천댐 대비 전반적으로 낮은 예측 성능을 보였다. 1시간 예측 시 CC는 0.993으로 높은 수준을 기록하였으나,
5시간 및 6시간 예측에서는 각각 0.909, 0.878로 감소하였다(Fig. 6). 이는 합천댐의 SVM 결과와 유사한 수준이지만, 전 구간에서 예측의 일관성과 첨두 응답성 측면에서는 더 불안정한 경향을 보였다. Fig. 5와 Fig. 6을 통해 확인한 바와 같이, 합천댐에서는 전반적인 과소 추정이 주로 발생했지만, 남강댐에서는 과소 및 과대 추정이 동시에 나타나는 비선형적 반응 패턴이
관찰되었으며, 이 경향은 선행 시간이 길어질수록 더 두드러졌다.
SVM 적용 결과를 종합적으로 비교해 보면, 합천댐에서의 예측 성능이 남강댐보다 전반적으로 우수하게 나타났으며, 이는 두 댐의 최대 유입량 및 유입량
변화 범위의 차이에 기인한 것으로 판단된다. 학습 동안 합천댐의 최대 유입량은 약 2,500 m³/s 수준이었으며, 남강댐은 약 8,000 m³/s로,
훨씬 더 급격한 유입량 변화를 포함하고 있었다. SVM은 구조적으로 급변 패턴보다는 평균적 경향에 민감하게 반응하는 특성을 가지므로, 유입량 변화가
완만한 합천댐의 경우 더 안정적인 예측 성능을 보일 수 있었다.
이러한 경향은 Essam et al.(2022)의 연구 결과와도 일치한다. 해당 연구에서는 말레이시아의 11개 하천을 대상으로 LSTM과 SVM 기반 유입량 예측을 비교하였으며, SVM은 평균적
흐름 예측에 강점을 보였으나, 극한 유입량에 대해서는 일관된 과소 추정 경향을 나타냈다. 또한, Park and Yang(2024)에서도 SVM이 LSTM보다 전반적으로 우수한 예측 성능을 보였으며, 특히 복잡한 비선형성과 고변동성을 가진 AMI(Advanced Metering
Infrastructure) 시계열 예측에 대해 SVM이 더 안정적인 결과를 보였다. 해당 연구에서는 SVM이 LSTM에 비해 상대적으로 학습자료의
양이 적고, 하이퍼파라미터 조정에 덜 민감하여 자료 수가 제한적인 경우에도 강건한 예측 성능을 유지한 것을 확인하였다.
Fig. 5. Comparative Model Evaluation Results for Hapcheon Dam Using LSTM and SVM Models.
Model Performance was Assessed Across Six Forecast Lead Times(1-6 Hours) Using Three
Evaluation Metrics: Correlation Coefficient(CC), Nash-Sutcliffe Efficiency(NSE), and
Root Mean Square Error(RMSE). (a) Lead Time = 1 hr, (b) Lead Time = 2 hr, (c) Lead
Time = 3 hr, (d) Lead Time = 4 hr, (e) Lead Time = 5 hr, (f) Lead Time = 6 hr, (g)
Lead Time = 1 hr, (h) Lead Time = 2 hr, (i) Lead Time = 3 hr, (j) Lead Time = 4 hr,
(k) Lead Time = 5 hr, (l) Lead Time = 6 hr
Fig. 6. Comparative Model Evaluation Results for Namgang Dam Using LSTM and SVM models.
Model Performance was Assessed Across Six Forecast Lead Times(1-6 Hours) Using Three
Evaluation Metrics: Correlation Coefficient(CC), Nash-Sutcliffe Efficiency(NSE), and
Root Mean Square Error(RMSE). (a) Lead Time = 1 hr, (b) Lead Time = 2 hr, (c) Lead
Time = 3 hr, (d) Lead Time = 4 hr, (e) Lead Time = 5 hr, (f) Lead Time = 6 hr, (g)
Lead Time = 1 hr, (h) Lead Time = 2 hr, (i) Lead Time = 3 hr, (j) Lead Time = 4 hr,
(k) Lead Time = 5 hr, (l) Lead Time = 6 hr
4. 결 론
본 연구는 기존 물리 기반 강우-유출 모형이 가지는 구조적 불확실성과 예측 성능 한계를 극복하고자, 상태-공간 기반 시계열 재구성 기법을 도입하여
기계학습 기반 댐 유입량 예측 모형을
개발하였다. 특히, 비선형·비정상성을 포함하는 수문 시계열의 동역학적 특성을 반영하기 위해 지체 시간(delay time)과 임베딩 차원(embedding
dimension)을 정량적으로 추정하여 입력 변수를 구축하였으며, 예측 모형으로는 LSTM과 SVM을 각각 적용하여 성능을 비교·평가하였다.
예측 결과, LSTM과 SVM 모두 선행 시간 증가에 따른 예측 성능 저하 경향을 공통으로 나타냈으며, SVM은 전반적으로 더 안정적인 예측 성능과
낮은 RMSE 값을 기록하였다. 특히 SVM은 LSTM에 비해 급격한 성능 저하 없이 장기 예측에 대응할 수 있는 구조를 가지며, 평균 유입 패턴을
학습하는 데 강점을 보였다. 반면, SVM은 첨두 유입량(peak inflow) 구간에서 일관된 과소 추정 경향을 나타냈으며, 이는 유입량 변화가
큰 남강댐에서 더욱 두드러지게 나타났다. 이러한 경향은 Essam et al.(2022)의 연구 결과와도 일치하며, SVM의 구조적 한계로 해석된다.
댐 규모에 따른 예측 성능 비교에서는, 유입량 변화가 완만한 합천댐에서 SVM의 성능이 더 우수하게 나타났으며, 이는 소규모 또는 유량 변동이 적은
댐에 SVM이 더 적합함을 시사한다. 반면, LSTM은 극한 유입량에 반응할 수 있는 구조적 강점을 가지나, 학습자료의 수량과 다양성에 따라 과대
추정 또는 성능 저하가 발생할 수 있음을 확인하였다. 합천댐의 경우, 상대적으로 적은 학습 사상 수로 인해 고유입 구간에서의 과대 추정 현상이 나타났으며,
이는 향후 추가적인 학습자료 확보를 통해 보완 가능할 것으로 판단된다.
본 연구는 실제 관측 자료를 기반으로 예측 모형을 구축하고, 수문 시계열의 재구성 및 입력 최적화 기법을 함께 적용함으로써 기계학습 기반 수문 예측
모형의 실효성을 제시하였다. 특히, 물리 모형 구축이 어려운 유역, 또는 입력 자료 제약이 있는 상황에서 상태-공간 기반의 시계열 예측 접근은 유효한
대안이 될 수 있음을 실증적으로 입증하였다. 앞으로는 기상예보 자료, 위성 기반 강우 자료, 공간적 유역 특성 정보와의 융합을 통해 모형의 일반화
성능과 공간 확장성을 제고할 수 있을 것이다. 아울러, LSTM과 SVM의 장점을 결합한 하이브리드 모형을 개발하여 단기-중기-장기 예측에 따른 유연한
구조를 구현하는 것도 중요한 향후 연구 방향이 될 것이다.
Acknowledgements
This research was supported by a grant(2022-MOIS63- 001(RS-2022-ND641011)) of Cooperative
Research Method and Safety Management Technology in National Disaster funded by Ministry
of Interior and Safety(MOIS, Korea).
References
"Devia, G. K., Ganasri, B. P. and Dwarakish, G. S. (2015). “A review on hydrological
models.” Aquatic Procedia, Vol. 4, pp. 1001-1007, https://doi.org/10.1016/j.aqpro.2015.02.126."

"Essam, Y., Huang, Y. F., Ng, J. L., Birima, A. H., Ahmed, A. N. and El-Shafie, A.
(2022). “Predicting streamflow in Peninsular Malaysia using support vector machine
and deep learning algorithms.” Scientific Reports, Vol. 12, No. 1, 3883, https://doi.org/10.1038/s41598-022-07693-4."

"Fraser, A. M. and Swinney, H. L. (1986). “Independent coordinates for strange attractors
from mutual information.” Physical Review A, Vol. 33, No. 2, pp. 1134-1140, https://doi.org/10.1103/PhysRevA.33.1134."

"Gao, S., Huang, Y., Zhang, S., Han, J., Wang, G., Zhang, M. and Lin, Q. (2020). “Short-term
runoff prediction with GRU and LSTM networks without requiring time step optimization
during sample generation.” Journal of Hydrology, Vol. 589, 125188, https://doi.org/10.1016/j.jhydrol.2020.125188."

"Hilborn, R. C. (1994). Chaos and Nonlinear Dynamics, Oxford University Press."

"Hu, C., Wu, Q., Li, H., Jian, S., Li, N. and Lou, Z. (2018). “Deep learning with
a long short-term memory networks approach for rainfall-runoff simulation.” Water,
Vol. 10, No. 11, 1543, https://doi.org/10.3390/w10111543."

"Jeong, D. I., Kim, Y. O., Cho, S. and Shin, H. (2003). “A study on rainfall-runoff
models for improving ensemble streamflow prediction -1. Rainfall-runoff models using
artificial neural networks-.” Journal of the Korean Society of Civil Engineers B,
Vol. 23, No. 6B, pp. 521-530 (in Korean)."

"Kwon, H. H. and Moon, Y. I. (2005). “The forecast of hydrologic time series using
the state-space model and the nearest neighbor method.” Journal of the Korean Society
of Civil Engineers B, Vol. 25, No. 4B, pp. 275-283 (in Korean)."

"Kwon, H. H. and Moon, Y. I. (2006). “Dynamic nonlinear prediction model of univariate
hydrologic time series using the support vector machine and state-space model.” Journal
of the Korean Society of Civil Engineers B, Vol. 26, No. 3B, pp. 279-289 (in Korean)."

"Mok, J., Choi, J. and Moon, Y. (2020). “Prediction of multipurpose dam inflow using
deep learning.” Journal of Korean Water Resources Association, Vol. 53, No. 2, pp.
97-105, https://doi.org/10.3741/JKWRA.2020.53.2.97 (in Korean)."

"Moon, Y. I. and Lall, U. (1996). “Atmospheric flow indices and interannual great
salt lake variability.” Journal of Hydrologic Engineering, ASCE, Vol. 1, No. 2, pp.
55-62, https://doi.org/10.1061/(ASCE)1084-0699(1996)1:2(55)."

"Nash, J. E. and Sutcliffe, J. V. (1970). “River flow forecasting through conceptual
models part I - A discussion of principles.” Journal of Hydrology, Vol. 10, pp. 282-290,
https://doi.org/10.1016/0022-1694(70)90255-6."

"Park, M. and Yang, H. (2024). “Comparative study of time series analysis algorithms
suitable for short-term forecasting in implementing demand response based on AMI.”
Sensors, Vol. 24, 7205, https://doi.org/10.3390/s24227205."

"Sauer, Y., Yorke, J. A. and Casdagli, M. (1991). “Embedology.” Journal of Statistical
Physics, Vol. 65, pp. 579-616, https://doi.org/10.1007/BF01053745."

"Takens, F. (1981). “Detecting strange attractors in turbulence. In, Rand, D.A. and
L.S. Young (eds.).” Dynamical systems and Turbulence. Springer-Verlag. Berlin, Vol.
898, pp. 366-381."
