Mobile QR Code QR CODE : Journal of the Korean Society of Civil Engineers

  1. 동아대학교 건설시스템공학과 석사과정 (Donga University · ysong010120@gmail.com)
  2. 정회원 · 한국건설기술연구원 수자원하천연구본부 (Korea Institue of Civil Engineering and Building Technology · sukany@kict.re.kr)
  3. 한국건설기술연구원 수자원하천연구본부 (Korea Institue of Civil Engineering and Building Technology · jungsooyoon@kict.re.kr)
  4. 종신회원 · 한국건설기술연구원 수자원하천연구본부 (Korea Institue of Civil Engineering and Building Technology · naraekang@kict.re.kr)
  5. 정회원 · 교신저자 · 동아대학교 건설시스템공학과 조교수 (Corresponding Author · Donga University · wna92@dau.ac.kr)



돌발홍수, 예측 성능 평가, 비정형 데이터, 뉴스 미디어, SNS
Flash flood, Predictive performance evaluation, Unstructured data, New media, Social network services

1. 서 론

기후변화의 영향으로 다양한 유형의 재해가 다양한 방식으로 발생하고 있다. 그 중 극한 강우로 인해 유발되는 돌발홍수는 급경사 지형의 소규모 유역에서 주로 발생하며, 국지적인 피해를 야기한다. 국내에서는 돌발홍수의 발생을 선제적으로 예측하기 위한 다양한 방법론이 개발되어 왔고(Bae and Kim, 2007a; 2007b; Hwang et al., 2020; Lee et al., 2016; Park and Yoon, 2017), 이에 대한 평가 방식 또한 함께 고안되어왔다. 예경보시스템의 전통적 평가는 주로 강우량, 수위, 유출량 등의 실시간 수문자료를 기반으로 시스템의 경보 정확성과 적시성(lead time)을 정량적으로 분석하는 방식이다(Bae and Kim, 2007a). 일반적으로 관측자료와 모델 예측값 간의 일치도를 나타내는 지표를 사용하여 경보 성능을 평가하며, 임계값 기반 경보 발생 시점의 오차와 경보 지속시간의 적절성도 중요한 평가 요소로 간주된다. 또한, 과거 재현사례를 통한 모의 검증이나 실제 발생한 돌발홍수 사례를 바탕으로 시스템의 민감도와 오탐률 등을 비교 분석함으로써 경보의 신뢰성과 활용 가능성을 종합적으로 판단한다(Hapuarachchi et al., 2011; Henao Salgado and Zambrano Nájera, 2022).

방대한 데이터의 출현은 기존의 시스템 평가 방식을 보완할 수 있는 방법론을 추가적으로 고려할 수 있게 한다. 즉, 준실시간 정보인 뉴스 미디어와 실시간 정보인 SNS의 활용이다(Joseph et al., 2018; Erokhin and Komendantova, 2024). 최근 SNS 사용자는 지속적으로 증가하는 추세이며, 사용자들은 방대한 양의 정보를 생산하고 있다(Im, 2017; Kim, 2022; 2024). 특히, 재난·재해 발생시 사용자들은 사건 관련 SNS 게시물을 실시간으로 업로드 하고, 이러한 비정형 데이터로부터 재난 정보를 획득 및 재난 예측에 활용하는 연구가 수행되어 왔다(Seo et al., 2013; Choi et al., 2021; Karimiziarani, 2023). 홍수 및 침수 등 수재해의 사전 감지 목적에서도 마찬가지이다. Huang et al.(2018)은 원격 감지 이미지와 데이터를 통합하여 실시간에 가까운 홍수 확률 지도를 계산하였다. Basnyat et al.(2017)은 도시 지역에서 발생한 돌발홍수의 영향을 평가하기 위하여 소셜 미디어의 텍스트와 이미지를 분석하였다. Asmai et al.(2019), Fang et al.(2019), Putra et al.(2020)도 유사한 연구를 수행하였다.

국내에서도 집중호우와 태풍 등의 영향으로 크고 작은 피해가 발생하고 있으며, 홍수 및 침수 피해 저감을 목적으로 SNS의 활용을 시도하고 있다. Kwon et al.(2020)은 침수 발생 전 전조 tweet의 증가를 확인하고, 침수 감지 수단으로의 가능성을 검토하였다. Lee and Hwang(2019)은 홍수 관련 키워드를 기반으로 데이터 추출이 가능한 웹 크롤러(Web Crawler)를 개발하였다. 포털 사이트(Naver, Daum)와 개방형 SNS (Twitter, Instagram)에서 수집한 데이터의 패턴과 실제 강우사상의 패턴 비교를 통하여 홍수에 대한 SNS 데이터의 활용성을 평가하였다. Lee et al.(2020; 2021)은 머신러닝 기법 중 하나인 Long Short-Term Memory (LSTM) 기반의 하천 수위 예측에 SNS 데이터를 적용하기도 하였다.

뉴스 미디어 및 SNS 데이터는 돌발홍수 예경보시스템을 평가하는 데 적합하다(Guo et al., 2023). 이는 미디어 플랫폼이 가지는 몇 가지 특징에 기인한다. 첫째, 예경보 결과와 SNS에 업로드되는 재해 정보가 모두 실시간으로 생성된다. 즉, 예경보시스템에서 예측한 결과에 대한 즉각적인 검증을 통해 예경보의 품질 향상을 기대할 수 있다(Wang et al., 2025). 일정 수준의 지연시간을 가지는 뉴스 미디어 정보는 실시간 활용을 기대하기는 어렵지만, 보다 정제된 정보로 쓰일 수 있다. 둘째, SNS 재해 정보는 상당히 높은 체감도를 가진다. 시민이 직접 보거나 느낀 정보를 업로드하기 때문에 해당 시점과 지역의 재해 상황을 오차 없이 반영한다. 뉴스 미디어 정보는 사후 재해 정보라는 점에서 더욱 신뢰도가 높다. 마지막으로, 접근성이 좋다. 전통적인 방식으로 수집되는 데이터는 관련 전문 기관에서 여러 절차를 통해 생성되고 공개되는 데에도 어느 정도의 지연 시간이 요구된다. 그러나 미디어 데이터는 개방되어 있으며, 언제 어디서나 사용자가 접근할 수 있다(Oudat et al., 2023; He and Hu, 2025).

본 연구에서는 실시간으로 공유되는 비정형 미디어 데이터를 활용하여 홍수 예경보시스템의 예측 성능을 평가하는 방법론을 제시하고, 그 적정성을 평가한다. 먼저, 국내의 주요 뉴스 미디어 및 SNS 이용자 수가 많은 플랫폼 중 게시물 검색이 용이한 Facebook, Instagram, X(구 Twitter)에서 홍수 및 침수 관련 게시물을 조사하고 활용할 수 있는 방법을 도출한다(Debreceny et al., 2017). 다음으로 2020년부터 2024년까지 침수 피해사례 관련 미디어 데이터를 수집하여 DB를 구축한다. 이는 키워드 검색 및 검증의 과정으로 진행되며, 예경보 정보의 적중, 오보 여부를 결정하는 자료로 활용된다. 해당 기간 동안 시스템에서 발령된 홍수 예경보 정보의 예측 정확도는 미디어 데이터와의 평가지표를 통해 정량화된다. 이를 통해 미디어 데이터를 활용한 홍수예경보 품질 평가를 수행한다. 마지막으로 본 연구로부터 얻은 시사점을 제시한다.

2. 기존 돌발홍수 예경보시스템 평가에 대한 고찰

2.1 돌발홍수 예경보시스템 현황

Hwang et al.(2020)은 한강홍수통제소에서 제공하는 강우레이더 기반 초단기 예측자료를 활용하여 돌발홍수 예경보시스템을 구축하였다(Fig. 1). 환경부 한강홍수통제소에서는 총 6기의 S-밴드 이중편파 레이더로부터 획득한 합성 지상 보정 강수량 자료를 기반으로, 초단기 강수 예측 자료를 생산하고 있다. 이 자료가 예경보시스템의 입력자료로 활용된다. 한계강우량 산정을 위한 기초자료로는 피해 이력을 기반으로 한 Cho et al.(2018)의 방법론을 채택하였으며, 피해 이력이 부족한 지역의 경우 유역 유출특성을 활용한 추정법을 적용하였다. 특히, 미계측 지역의 한계강우량 산정을 위해 침수특성과 유속특성 간의 관계식을 도출하였다. 이는 계측 지역에서 산정된 침수 특성(예: 침수 깊이, 유출량)과 유속 특성(예: 경사, 유역면적, 하천 형상)을 기반으로 하며, 해당 관계식을 통해 미계측 유역에서도 유속 특성으로부터 침수 특성을 유추할 수 있도록 설계되었다. 그 결과로 전국 5,047개 동·읍·면 행정구역을 대상으로 지속시간별(10분, 30분, 60분, 180분), 위험수준별(주의, 경계, 심각) 한계강우량을 산정하였다.

현재 운영 중인 돌발홍수 예경보시스템은 초단기 강수 예측의 정확도를 반영하여, 최대 60분 이내의 돌발홍수 발생 가능성을 웹 기반으로 제공하고 있다(Fig. 1). 이 시스템은 실시간 강우량 자료를 기반으로 경보 수준을 주의(낮은 위험), 경계(중간 위험), 심각(높은 위험)의 3단계로 구분하여 제공하며, 각 위험 수준에 따라 지역별 홍수 대응 역량을 제고하는 데 목적이 있다. 특히, 동 단위까지 상세한 공간 분해능을 갖춘 예보가 가능하여, “도-시(군)-구-읍·면·동“ 등 행정구역별 공간 위계를 따라 예보 대상 지역의 정보가 시각적으로 표출된다(Fig. 1). 이러한 기능은 지방자치단체 및 관련 유관기관이 지역별 홍수 위험을 직관적으로 인지하고, 신속하고 효과적인 대응 전략을 수립하는 데 유용한 정보를 제공한다.

Fig. 1. Algorithm and Application Results of the Flash Flood Early Warning System Presented by Hwang et al. (2020)

../../Resources/KSCE/Ksce.2025.45.5.0577/fig1.png

2.2 기존 돌발홍수 예측 품질 평가 방식

통상적으로 돌발홍수 예경보시스템의 성능 평가에는 contingency table을 이용한다. Contingency table은 hit, miss, false alarm, zero 등 네 가지로 예측 성패를 평가하는 방식이다. 사고 발생 시 예보가 발령되었을 경우 hit, 사고 발생 시 예보가 발령되지 않았을 경우 miss, 사고 미발생 시 예보가 발령되었을 경우 false alarm, 사고 미발생 시 예보가 발령되지 않은 경우 zero로 평가한다. 해당 연구에서는 뉴스를 근거한 사고 발생 사례를 정확도 평가에 사용하였기 때문에 사고 발생 경우에 대한 예측 정확도 평가만 가능하였다. 이에 따라 hit, miss 항목만 활용 가능하였으며 hit, miss 항목만 사용하는 평가지표 Probability Of Detection(POD)를 활용하여 시스템의 예측 정확도를 평가하였다. POD는 전체 사고 사례 횟수에 대한 예측이 성공한 피해사례 횟수의 비율을 의미한다(1).

(1)
$POD=\dfrac{H}{H+M}\times 100$

여기서 H는 시스템에서 홍수 피해사례를 예측한 경우 즉 hit, M은 시스템에서 홍수 피해사례를 예측하지 못한 경우 즉 miss의 횟수이다.

Hwang et al.(2020)은 1시간 선행 예보를 대상으로 돌발홍수 예경보시스템의 예측 정확도를 평가하기 위해, 2019년에 발생한 침수 및 홍수 사례를 뉴스 보도를 통해 수집하고, 이를 기반으로 POD 분석을 수행하였다. 분석 결과, 예경보시스템의 POD는 90.3 %로 나타나 높은 수준의 예측 정확도를 보였으며, 해당 시스템이 돌발홍수 예경보에 효과적으로 기여할 수 있음을 입증하였다.

2.3 미디어 데이터 활용의 한계점 및 개선 방안

Hwang et al.(2020)은 뉴스 기사를 활용하여 돌발홍수 예경보시스템의 예측 정확도를 평가하였으며, 그 결과 높은 수준의 정확도를 확인한 바 있다. 그러나 뉴스 기반의 평가 방식은 사건 발생 시각과 정보 제공 시점 간의 시간적 불일치성이라는 한계를 지닌다. 뉴스 기사는 통상 사고 발생 직후가 아닌 일정 시간이 경과한 후, 제보 또는 외부 기관의 보도자료를 바탕으로 작성되는 경우가 많기 때문에, 실제 홍수 발생 시각과 보도 시점 간에 시간 지연이 발생하고, 이는 정량적 정확도 평가에 어려움을 초래할 수 있다.

이에 본 연구에서는 기존 뉴스 기반 평가 방식의 한계를 보완하고자, 침수 및 홍수 사례를 SNS 기반에서 수집하여 돌발홍수 예경보시스템의 성능 평가에 활용하였다. 재해 발생 시 SNS에서는 실시간으로 방대한 양의 비정형 데이터가 생성되며, 이를 적절히 가공할 경우 유용한 재해 정보로 활용될 수 있다. 즉, 홍수 및 침수 피해 정보를 보다 신속하고 다양하게 수집할 수 있으며, 뉴스에 보도되지 않은 지역적이고 미소한 피해 사례까지 포착할 수 있다는 점에서 기존 방식 대비 실시간성과 공간적 포괄성이 우수하다는 차별성을 갖는다.

3. 미디어 데이터 수집 및 DB 구축

3.1 침수 피해 관련 미디어 데이터 수집 과정

본 연구에서는 2020~2024년도의 침수 및 홍수 피해사례를 수집하여, 돌발홍수 예경보시스템의 예측 정확도를 평가하였다. 예측 시스템은 검증은 검증 자료의 양과 질에 크게 의존하며, 충분한 검증 자료 확보는 시스템의 정확도와 신뢰성을 높이는데 중요한 역할을 한다(Huang and Bárdossy, 2020). Hwang et al.(2020)에서는 2019년도 침수 및 홍수 피해사례를 활용하여, 돌발홍수 예경보시스템의 정확도 평가를 실시하였다. 본 연구에서는 해당 조사가 이루어진 2019년 이후, 최근 5년 내의 침수 및 홍수 피해사례를 활용하였다. 최근 발생한 대량의 검증 자료는 돌발홍수 예경보시스템의 예보 정확도 검증에 실질적인 기여를 할 것으로 기대된다.

2020~2024년도 침수 및 홍수 피해사례 조사는 Case 1: 2020~2023년 뉴스 데이터, Case 2: 2024년 뉴스 및 SNS 데이터 두 가지로 나누어 진행하였다. SNS의 검색 알고리즘은 키워드 검색 시, 사용자의 정보(예: 좋아요, 팔로우, 선호 컨텐츠 등) 및 최신 인기 컨텐츠를 반영하여 관련도순으로 게시물을 정렬한다. 이러한 특성으로 인하여, SNS 사용자 개인의 관심사와 연구자로서 목표로 하는 수집 데이터 간 불일치가 발생할 경우, 원하는 데이터를 수집하는데 어려움이 있을 수 있다. 추가적으로 키워드와 관계된 방대한 양의 게시물을 모두 확인하고 선별하는 것은 현실적으로 한계가 있다. 본 연구에서는 SNS 검색 알고리즘의 특성과 데이터 수집의 효율성을 고려하여, SNS 데이터 수집 기간을 최근 1년인 2024년으로 한정하였다.

침수 및 홍수 피해사례는 다양한 뉴스 매체와 SNS를 통해 수집하였다. 뉴스 데이터의 경우 연합뉴스, KBS, MBC, SBS, 중앙일보, 조선일보, 동아일보 등 주요 언론사를 포함하였으며, 이외에도 각종 지역 일간지 및 지방 언론 자료까지 조사 대상에 포함하였다. SNS 데이터 수집에는 국내 SNS 이용자 수가 상위권인 플랫폼 중 게시물 검색이 상대적으로 편리한 Facebook, Instagram, X를 활용하였다. 돌발홍수 예경보시스템의 예보 정보는 동네 규모이며, 10분 단위로 예보를 발령한다. 따라서, 미디어 자료 조사 대상을 사고가 발생한 위치(읍/면/동)와 시각을 명확하게 확인할 수 있는 경우로 한정하였다. 조사된 사고 사례의 발생시각은 예보 발령 시각과 해상도를 통일하기 위하여 반올림하여 10분 단위로 조정하였다.

조사에 사용한 키워드로는 “침수”, “홍수”, “수재해”, “기상이변”, “태풍”, “폭우”, “범람”, “호우”, “물난리”, “장대비” 등이 있다. SNS에서는 비공식적이고 개인적인 게시물의 특성을 고려하여 “비 엄청 와”, “비 많이”, “비 좀 그만”, “워터파크 개장”, “다 젖음”, “장대비”, “비 그만 와” 등의 일상적인 표현을 추가하여 조사하였다. 각 미디어 종류별 키워드를 사용한 조사 과정은 다음과 같다(Fig. 2).

Fig. 2. Procedure for Collecting Inundation and Flood Accidents Using News Media and SNS

../../Resources/KSCE/Ksce.2025.45.5.0577/fig2.png

3.2 침수 피해사례 조사 결과

미디어를 활용하여 침수 및 홍수 피해사례를 조사한 결과, Case 1(뉴스 데이터 활용)은 229건, Case 2(뉴스 및 SNS 데이터 활용)는 192건으로 총 421건의 사고 사례가 확인되었다(Tables 1 and 2). 조사 과정에서 사고 사례를 다룬 뉴스 기사나 SNS 게시물은 상당수 확인되었으나, 정확한 시각 및 위치 정보의 부재로 분석 자료에서 제외시킨 경우가 많았다. 여름철에 강우가 집중되는 국내 강우 특성상, 사고 사례는 5월에서 9월에 대부분 발생하였다. 본 연구에서 조사된 사고에는 2020년 7월 부산 초량 제1지하차도 침수사건, 2023년 7월 충북 청주시 오송 지하차도 사건 등 큰 규모의 사고뿐만 아니라 배수기능 저하 등과 같은 시설물 피해사례까지 포함된다. 조사 과정에서 주요한 침수 및 홍수 피해사례는 모두 포함이 되었으나, 누락된 사례가 있을 수 있음을 고려하여 분석 결과를 해석하길 권장한다.

Table 1. Number of Inundation and Flood Damage Cases Collected from News Media (2020-2023)

                          Year

Region                          

2020

2021

2022

2023

Total

Seoul/Gyeongin

18

3

26

6

53

Gangwon-do

4

0

3

0

7

Chungcheong-do

17

3

4

10

34

Gyeongsang-do

33

39

17

20

109

Jeolla-do

8

7

0

11

26

Total

80

52

50

47

229

Table 2. Number of Inundation and Flood Damage Cases Collected from News and SNS Platforms (2024)

                          Year

Region                          

News articles

Facebook

X

Instagram

Total

Seoul/Gyeongin

52

5

3

3

63

Gangwon-do

6

1

0

0

7

Chungcheong-do

10

16

0

3

29

Gyeongsang-do

35

13

14

10

72

Jeolla-do

6

12

3

0

21

Total

109

47

20

16

192

4. 결 과

예측 정확도 평가는 시공간적 위계를 고려하여 진행하였다. 시스템의 예보 정보는 시(군)-구-읍,면,동의 공간적 위계와 선행 10분, 30분, 1시간의 시간적 위계에 따라 제공된다. 이에 예측 평가 또한 각 위계를 나누어 수행하였다. 예컨대, 2024년 6월 29일 20시 20분에 부산시 서구 동대신동에서 홍수 피해사례가 발생하였는데 시스템에서는 19시 20분에 부산시 해운대구 우동에 1시간 선행 예보를 발령한 경우라면 시(군) 단위의 예측에는 성공(hit)하였지만 구 및 동네(읍, 면, 동) 단위의 예측에는 실패(miss)한 것이다. 추가로, 예경보 발령이 행정구역 단위로 이루어지는 것을 감안하여 평가시 서울시, 인천시, 경기도, 강원도 지역을 한강유역, 부산시, 대구시, 울산시, 경상도 지역을 낙동강유역, 대전시, 세종시, 충청도 지역을 금강유역, 광주시 및 전라도 지역을 영산강·섬진강유역으로 간주하였다.

시스템 입력 예측강우자료 및 한계강수량 산정 방식의 불확실성을 고려하여 시간적 위계를 고려하지 않은 평가도 함께 진행하였다. 이는 선행시간의 구분을 완화시킨 경우에 해당한다. 즉, 피해발생 시점에 대해 시스템에서 10분, 30분, 1시간 선행시간 중 하나라도 예보가 성공한 경우 hit로 간주하는 평가 방식이다. 해당 결과는 시스템에서 선행시간에 관계없이 예경보가 발령되면 최대 1시간 내에 사고가 발생할 가능성에 대한 신뢰도가 어느 정도인지를 보여줄 것이다. 아울러 본 분석에서는 위험수준(주의, 경계, 심각)을 구분하지 않고 “주의” 이상의 경보가 발령되었으면 사고를 예측한 것으로 간주하였다. 피해사례의 심각도와 위험수준 사이의 명확한 관계 규명이 어렵기 때문이다.

4.1 Case 1: 2020-2023년 뉴스 데이터를 활용한 예경보 평가

돌발홍수 예경보시스템의 전국 규모의 예측 성능은 양호한 것으로 확인되었다(Table 3). 예측 정확도는 선행시간이 짧을수록, 공간규모가 클수록 향상되었다. 즉, 1시간 선행 예측보다는 10분 선행 예측이, 읍-면-동 단위의 예측보다는 시(군) 단위의 예측력이 더 좋은 것으로 나타났다. 10분 예측에 대한 POD는 읍-면-동 단위에서 0.6 정도, 시(군) 단위에서는 0.8 이상으로 2020년에는 0.926까지 증가하였다. 1시간 예측에 대한 POD는 읍-면-동 단위에서 0.4 이상, 시(군) 단위에서는 0.6-0.7 이상으로 나타났다. 선행시간의 구분을 완화시킨 10분, 30분, 1시간 선행시간 중 하나라도 예보가 성공한 경우 hit로 간주하는 평가 방식에 근거하면 예측 정확도가 크게 상승한다. 이 경우에는 동네규모인 읍-면-동 단위의 POD도 0.7 이상으로 우수한 예측 성능을 가지게 된다. 시(군) 규모에서는 0.9에 육박하는 높은 예측 정확도를 제공한다. 종합적으로 선행시간의 구분을 완화하는 경우, 돌발홍수 예경보시스템의 예측성능은 우수한 것으로 판단된다.

Table 3. PODs of Inundation and Flood Damage Case Prediction Accuracy for Case 1 at Nationwide Level

Year

                          Time

Spatial Level                          

10-min Prediction

30-min Prediction

1-hour Prediction

Lead Time Relaxation

2020

City/County

0.926

0.765

0.704

0.951

District (Gu)

0.686

0.514

0.429

0.771

Town/Township

0.593

0.420

0.395

0.728

2021

City/County

0.846

0.808

0.769

0.865

District (Gu)

0.810

0.762

0.714

0.857

Town/Township

0.615

0.538

0.519

0.692

2022

City/County

0.800

0.740

0.600

0.800

District (Gu)

0.781

0.688

0.500

0.781

Town/Township

0.720

0.640

0.480

0.720

2023

City/County

0.813

0.729

0.604

0.833

District (Gu)

0.600

0.600

0.320

0.640

Town/Township

0.646

0.563

0.375

0.667

Total

City/County

0.857

0.762

0.675

0.874

District (Gu)

0.717

0.628

0.478

0.761

Town/Township

0.636

0.524

0.437

0.706

피해 규모가 큰 주요 침수 및 홍수사례들에 대한 동네규모 예보가 가능했다는 점도 돌발홍수 예경보시스템의 우수성을 보여준다. 지하차도 인명피해가 발생했던 2020년 7월 23일 부산 호우시 동네규모의 1시간 선행 예측에 성공하였다. 극심한 호우가 동반되었던 2020년 9월 경상북도의 피해사례에서도 동네규모의 1시간 선행 예측에 성공하였다. 2022년 8월 8일 수도권 폭우시에는 서울시에서 발생한 네 건의 피해사례를 역시 동네규모의 1시간 선행 예측하였다. 2023년 7월 15일 충청북도 청주시 지하차도 피해사례에 대한 예측도 양호하게 수행하였다. 그럼에도 불구하고 여전히 동네규모 1시간 선행 예측의 성능 개선이 필요한 것은 사실이다. 특히, 인구수가 상대적으로 많은 수도권과 경상도 지역의 예측에 실패한 사례가 다수 확인되었기 때문이다.

다음으로 여러 지역 중 가장 많은 뉴스 데이터를 확보한 낙동강 유역을 대상으로 예경보 성능을 평가하였다. 돌발홍수 예경보시스템의 낙동강 유역 대상 침수 및 홍수 예측 성능은 전국 규모와 유사한 경향을 보이나 예측 정확도의 수준은 전국 평균치보다 높은 것으로 나타났다(Table 4). 전국 규모의 예측 결과와 유사하게 1시간 선행 예측보다는 10분 선행 예측이, 읍-면-동 단위의 예측보다는 시(군) 단위의 예측력이 더 높았다. 그러나 전체적으로 POD 수치가 전국 규모의 지표보다 더 높은 것으로 확인되었다. 특히, 10분 선행 시(군) 단위의 홍수 예측에 대한 POD는 2022년을 제외하고는 모두 0.92 이상으로 산정되었다. 1시간 예측 성능 또한 시(군) 규모에서는 0.7 이상으로 우수한 것으로 나타났다. 선행시간을 완화시킨 경우에는 예측 능력이 매우 뛰어났다. 시(군) 단위의 POD는 0.945, 읍-면-동 단위의 POD도 0.8 정도로 대부분의 피해사례를 시스템에서 예측하였다. 전국 대비 낙동강 유역의 예측성능은 뛰어난 것으로 확인되었으나 광역시에서의 동네규모 예측력의 향상이 필요한 것으로 판단된다. 동네규모의 1시간 예측에 실패한 사례 중 부산, 대구, 울산광역시에 해당하는 경우가 대부분이었다.

Table 4. PODs of Inundation and Flood Damage Case Prediction Accuracy for Case 1 at Nakdong River Basin

Year

                          Time

Spatial Level                          

10-min Prediction

30-min Prediction

1-hour Prediction

Lead Time Relaxation

2020

City/County

0.939

0.848

0.818

0.970

District (Gu)

0.727

0.591

0.455

0.818

Town/Township

0.606

0.394

0.455

0.758

2021

City/County

0.923

0.846

0.821

0.923

District (Gu)

0.882

0.824

0.765

0.941

Town/Township

0.744

0.667

0.641

0.821

2022

City/County

0.882

0.824

0.706

0.882

District (Gu)

0.917

0.833

0.667

0.917

Town/Township

0.824

0.765

0.647

0.824

2023

City/County

0.950

0.850

0.750

1.000

District (Gu)

0.733

0.733

0.467

0.800

Town/Township

0.750

0.700

0.550

0.800

Total

City/County

0.927

0.844

0.789

0.945

District (Gu)

0.803

0.727

0.576

0.864

Town/Township

0.716

0.606

0.569

0.798

4.2 Case 2: 2024년 뉴스 및 SNS 데이터를 활용한 예경보 평가

SNS 데이터를 활용한 돌발홍수 예경보시스템의 전국 단위 평가 결과, 예측 성능은 양호한 것으로 확인되었다(Table 5). Case 1 분석 결과와 마찬가지로 예측 정확도는 대체로 선행시간이 짧을수록, 공간 규모가 클수록 향상되었다. 즉, 30분보다는 10분 선행 예측이, 읍-면-동 단위의 예측보다는 시(군) 단위의 예측력이 더 좋은 것으로 나타났다. 1시간 예측에 대한 POD는 읍-면-동 단위에서 0.4에 가깝게, 시(군) 단위에서는 0.8 정도에 다다랐다. 선행시간의 구분을 완화시킨 경우(10분, 30분, 1시간 선행시간 중 하나라도 예보가 성공한 경우 hit로 간주하는 평가 방식)에는 홍수 예측 정확도가 뚜렷하게 상승하였다. 이 경우에는 동네 규모인 읍-면-동 단위의 POD도 0.5 이상으로 우수한 예측 성능을 가지게 된다. 시(군) 규모에서는 0.9에 육박하는 높은 예측 정확도를 제공한다. 종합적으로 뉴스 미디어 이외의 SNS 데이터를 함께 활용하는 경우에도 선행시간의 구분을 완화하는 경우, 돌발홍수 예경보시스템의 예측성능은 우수한 것으로 나타났다.

다음으로 대유역별로 세분화하여 평가를 진행하였다. 또한, 공간 위계를 고려하여 시(군) 단위(Fig. 3), 구 단위(Fig. 4), 읍-면-동 단위(Fig. 5)의 침수 및 홍수 사례를 추적하였다. 평균적인 POD는 좁은 공간 위계에서 넓은 위계로 갈수록 점차 커지며, 선행시간이 완화된 경우에 높았다. 특히, 시(군) 단위의 평가 결과는 SNS 데이터가 추가됨에도 뉴스 데이터만을 활용한 평가 결과와 큰 차이가 없다는 점에서 SNS의 예경보시스템 평가 목적으로의 활용도가 확보될 수 있음을 보여준다.

한강유역에서는 2024년 70건의 홍수 피해사례가 보도되었으며, 돌발홍수 예경보시스템의 예측 성능은 전국 단위의 결과와 유사한 것으로 확인되었다. 예측 정확도는 대체로 선행시간이 짧을수록, 공간 규모가 클수록 향상되었다. 즉, 1시간 보다는 10분 선행 예측이, 읍-면-동 단위의 예측보다는 시(군) 단위의 예측력이 더 좋은 것으로 나타났다. 1시간 예측에 대한 POD는 읍-면-동 단위에서 0.4에 가깝게, 시(군) 단위에서는 0.8 정도에 다다랐다. 선행시간의 구분을 완화시킨 경우에는 홍수 예측 정확도가 뚜렷하게 상승한다. 이 경우에는 동네 규모인 읍-면-동 단위의 POD도 0.5 이상으로 우수한 예측 성능을 가지게 된다. 시(군) 규모에서는 0.85에 육박하는 높은 예측 정확도를 제공한다. 종합적으로 선행시간의 구분을 완화하는 경우, 돌발홍수 예경보시스템의 예측성능은 우수한 것으로 판단된다.

낙동강유역에서는 2024년 72건의 홍수 피해사례가 보도되었으며, 돌발홍수 예경보시스템의 예측 성능은 전국 단위의 결과와 유사하고 한강유역의 결과보다는 우수한 것으로 확인되었다. 다만, 읍-면-동 규모의 예측 정확도는 상대적으로 낮은 것으로 나타났다. 1시간 예측에 대한 POD는 읍-면-동 단위에서 0.35에 가깝게, 시(군) 단위에서는 0.8 이상이었다. 선행시간의 구분을 완화시킨 경우에는 동네 규모인 읍-면-동 단위의 POD도 0.5에 가까운 예측 성능을 가지게 된다. 시(군) 규모에서는 0.85 이상의 높은 예측 정확도를 제공한다. 종합적으로 선행시간의 구분을 완화하는 경우, 돌발홍수 예경보시스템의 예측성능은 우수한 것으로 판단된다.

금강유역에서는 2024년 29건으로 다른 대유역에 비해 홍수 피해사례가 적었다. 그러나 읍-면-동 단위 돌발홍수 예경보시스템의 예측 성능은 모든 유역 중 가장 우수하였다. 특히, 1시간 예측에 대한 POD는 읍-면-동 단위에서 0.65 이상으로 매우 높은 값이 산출되었으며, 시(군) 단위에서는 0.8 이상이었다. 예외적으로 짧은 선행시간의 예경보에 비해 긴 선행시간의 경우 더욱 예측 정확도가 우수함을 확인할 수 있다. 선행시간의 구분을 완화시킨 경우에는 동네 규모인 읍-면-동 단위의 POD가 0.7에 가까운 매우 높은 예측 성능을 가지게 된다. 또한, 시(군) 규모에서도 0.85 이상의 높은 예측 정확도를 제공한다. 이러한 결과는 두 가지 측면으로 해석이 가능하다. 우선적으로 홍수예경보시스템이 금강유역의 지형적, 기후적 특성을 잘 반영하는 형태로 구축되었거나, 해당 유역의 뉴스기사 또는 SNS로 보도된 피해사례의 규모가 크거나 주요하여 시스템에 잘 포착되는 형태에 해당하는 것으로 볼 수 있다.

영산강·섬진강유역에서는 2024년 21건의 홍수 피해사례가 보도되었으며, 이는 모든 대유역 중 가작 적은 보도자료 수이다. 해당 유역의 돌발홍수 예경보시스템의 예측 성능 특징은 시(군) 규모의 POD가 매우 높다는 점이다. 특히, 선행시간의 구분을 완화시킨 경우(10분, 30분, 1시간 선행시간 중 하나라도 예보가 성공한 경우 hit로 간주하는 평가 방식)에는 모든 시(군) 규모의 예측을 성공하였다. 동네 규모인 읍-면-동 단위의 POD도 0.5에 가까운 예측 성능을 보였다. 예측 선행시간이 짧을수록, 공간 규모가 커질수록 예측 성능이 향상되었으나, 읍-면-동 규모의 예측 정확도는 상대적으로 낮은 것으로 나타났다. 특히, 1시간 예측에 대한 POD는 0.1 이하로 낮았다. 그러나 시(군) 규모 및 구 단위의 예측성능은 금강유역과 유사하거나 그 이상으로 높았다.

Fig. 3. PODs for Different Lead Times at the City/County Level by Major River Basin in Case 2. Bluish Colors for Each Basin Indicate the Averaged Values of POD

../../Resources/KSCE/Ksce.2025.45.5.0577/fig3.png

Fig. 4. PODs for Different Lead Times at the District (Gu) Level by Major River Basin in Case 2. Bluish Colors for Each Basin Indicate the Averaged Values of POD

../../Resources/KSCE/Ksce.2025.45.5.0577/fig4.png

Fig. 5. PODs for Different Lead Times at the Town/Township Level by Major River Basin in Case 2. Bluish Colors for Each Basin Indicate the Averaged Values of POD

../../Resources/KSCE/Ksce.2025.45.5.0577/fig5.png

Table 5. PODs of Inundation and Flood Damage Case Prediction Accuracy for Case 2 at Nationwide Level

                          Time

Spatial Level                          

10-min Prediction

30-min Prediction

1-hour Prediction

Lead Time Relaxation

City/County

0.777

0.772

0.808

0.870

District (Gu)

0.599

0.588

0.556

0.663

Town/Township

0.375

0.309

0.360

0.515

5. 결 론

본 연구에서는 2020년부터 2024년까지 발생한 침수 및 홍수 피해사례를 대상으로 돌발홍수 예경보시스템의 예보 정확도를 평가하였다. 평가지표로는 POD를 이용하였다. 평가 결과, 돌발홍수 예경보시스템의 전국 규모의 예측 성능은 우수하며, 특히 금강유역의 예측 정확도가 높은 수준으로 확인되었다. 피해 규모가 큰 주요 침수 및 홍수사례들에 대한 동네 규모 예보가 가능했다는 점도 고무적이다. 평가시 시공간의 위계를 구분하였는데, 예측 정확도는 선행시간이 짧을수록, 공간규모가 클수록 향상되었다. 만일 선행시간에 관계없이 10분이든 30분이든 예보 결과를 1시간 예보에 반영한다면 상당한 예측 정확도의 향상을 기대할 수 있을 것이다. 시가화 지역이 많고 인구밀도가 높은 대도시는 침수 및 홍수의 피해에 취약한 지역이므로 그만큼 침수 발생 사례가 많다. 따라서 예측에 성공하는 사례도 많은 반면, 실패한 사례도 다른 시(군)에 비해 많다. 즉, 지역별 인구수, 인구밀도, 연령대에 따라 SNS 활동량(샘플의 수)에 차이가 있고, 이러한 정보의 불균질성에 의한 POD의 차이가 확인되었다. 향후에는 각 유역에 거주하는 시민들의 업로드 성향, 뉴스 기사화가 되는 빈도 등이 평가에 충분히 고려되어야 할 것이다.

또한, 본 분석에서는 뉴스 기사뿐만 아니라 Facebook, Instagram, X 등과 같은 SNS 기반의 사례 조사를 통해 샘플 수를 대폭 증가시켰다. 주목할 점은, 뉴스 데이터만 활용하는 Case 1과 SNS 데이터를 함께 활용하는 Case 2의 돌발홍수 예경보시스템 성능 평가 결과가 비교적 유사하였다는 점이다. 즉, 시스템 평가의 목적으로 SNS 데이터가 충분히 활용할 수 있음을 시사한다. 다만, 예측 시스템의 성능을 종합적으로 평가하기 위하여 향후에는 POD 이외에 False Alarm Ratio, Critical Success Index 등을 도입하여 거짓된 예경보 정보에 대한 정량적 평가도 동반할 필요가 있다. 아울러 피해사례의 경중(輕重)에 대한 구분을 조사에 포함할 계획이며, 이를 통해 주요한 피해사례(hot spots)에 대한 예경보의 정확도를 평가할 수 있을 것으로 보인다. 더 나아가서는 지역별 피해 규모·인명피해·경제적 손실 등을 고려한 가중치 평가도 가능할 것이다.

소셜 미디어 데이터는 재해 피해 저감에 활용 가능성이 높은 것으로 확인되었지만, 해결해야 할 과제도 존재한다. 비정제된 비정형 빅데이터로 유용한 재해 정보를 생산할 수 있는 잠재력이 높지만, 사용자들이 일상에서 사용하는 다양한 어휘로 인한 어려움을 겪는다. 이를 재해 “정보”로 변환하기 위해서는 비속어나 일상어를 적절히 제거하는 필터링 과정이 필요하다. 다음으로, “공식적인” 사고 정보와 “비공식적인” 사고 정보를 구분할 필요도 있다. 뉴스 기사 정보에 대한 신뢰도는 상대적으로 높은 편이지만, 흔히 말하는 가짜 정보(침수가 발생할 수준의 상황이 아님에도 개인의 주관적인 판단에 근거한 정보)의 취득 가능성이 있는 SNS는 신뢰도 측면에서 아직까지 의문이라고 볼 수 있다. 또한, 소셜 미디어의 특성상 게시글 업로드 시각은 개인마다 차이가 있으며, 재해 발생과 게시글의 시간 차이가 큰 경우 재해 예측 목적에서 한계로 작용할 수 있다. 특히, 뉴스기사는 사후 정보(post-event information)에 해당하므로 지연시간을 반드시 고려해야 한다. 더불어, 소셜 미디어를 활용한 재해 예측에는 충분한 샘플 수가 필수적이지만, 인구 규모, 인구밀도, 연령 분포 등에 따라 지역별 SNS 샘플 수가 차이 날 수 있다. 예를 들어, 서울 및 수도권 지역은 젊은 층의 인구 비중과 밀도가 높아 재해 발생 시 관련 SNS 정보가 실시간으로 공유될 가능성이 높은 반면, 고령층이 주로 거주하는 지방 농촌 지역에서는 동일한 빈도의 재해가 발생하더라도 이를 즉각적으로 공유할 경로가 상대적으로 제한적이다.

이를 해결하기 위해서는 두 자료의 특성을 상호보완적으로 활용하는 새로운 플랫폼 또는 프레임워크의 도입이 필요하다고 판단된다. 예를 들어, 스마트폰 어플리케이션 기반의 재해 정보 플랫폼을 구축하여 시민들이 실시간으로 재해 발생 정보를 업로드할 수 있도록 제안할 수 있다. 해당 플랫폼은 정확한 재해 정보의 교환을 목적으로 시민들에게 개방되며, 사용자에게는 참된 재해 정보 제공 시 건별 리워드를 부여하고, 거짓 정보 제공 시에는 사용을 제한하는 방식으로 운영될 수 있다. 나아가, 도심 지역에 설치된 CCTV, 드론 등 기존의 관측 장비를 병행 활용함으로써 정보의 품질을 실시간으로 검증하는 방안도 고려할 수 있다. 다만, 이러한 대안의 실현을 위해서는 지자체와의 협력이 전제되어야 하며, 동시에 시민 참여를 적극적으로 유도할 수 있는 효과적인 홍보 전략이 뒷받침될 필요가 있다.

Acknowledgements

This research was supported by the Korea Institute of Civil Engineering and Building Technology (KICT) through a research project funded by the Ministry of Science and ICT, Republic of Korea (Project No. 20250108-001, Development of Digital New Deal-based Integrated Water Resources Management Technology Convergence Platform (IWRM-K)).

References

1 
"Asmai, S. A., Abidin, Z. Z., Basiron, H. and Ahmad, S. (2019). “An intelligent crisis-mapping framework for flood prediction.” International Journal of Recent Technology and Engineering, Vol. 8, No. 2, pp. 1304-1310, https://doi.org/10.35940/ijrte.B1058.0882S819."DOI
2 
"Bae, D. H. and Kim, J. H. (2007a). “Development of Korea flash flood guidance system: (I) Theory and system design.” Journal of the Korean Society of Civil Engineers B, Vol. 27, No. 3B, pp. 237-243 (in Korean)."URL
3 
"Bae, D. H. and Kim, J. H. (2007b). “Development of Korea flash flood guidance system: (II) Component development and system analysis.” Journal of the Korean Society of Civil Engineers B, Vol. 27, No. 3B, pp. 245-254 (in Korean)."URL
4 
"Basnyat, B., Anam, A., Singh, N., Gangopadhyay, A. and Roy, N. (2017). “Analyzing social media texts and images to assess the impact of flash floods in cities.” Proc. 2017 IEEE Int. Conf. Smart Computing (SMARTCOMP), pp. 1-6, https://doi.org/10.1109/SMARTCOMP.2017.7946987."DOI
5 
"Cho, J., Bae, C. and Kang, H. (2018). “Development and application of urban flood alert criteria considering damage records and runoff characteristics.” Journal of Korea Water Resources Association, Vol. 51, No. 1, pp. 1-10, https://doi.org/10.3741/JKWRA.2018.51.1.1 (in Korean)."DOI
6 
"Choi, Y., Hyun, S. and Shin, Y. (2021). “A study on the perception of disaster and crisis using SNS (Twitter).” Proc. 2021 Conf. Korea Info. Process. Soc., Vol. 28, No. 2, pp. 483-486."DOI
7 
"Debreceny, R., Wang, T. and Zhou, M. J. (2017). “Research in social media: Data sources and methodologies.” Journal of Information Systems, Vol. 31, No. 3, pp. 1-28, https://doi.org/10.2308/isys-51984."DOI
8 
"Erokhin, D. and Komendantova, N. (2024). “Social media data for disaster risk management and research.” International Journal of Disaster Risk Reduction, Vol. 114, 104980, https://doi.org/10.1016/j.ijdrr.2024.104980."DOI
9 
"Fang, J., Hu, J., Shi, X. and Zhao, L. (2019). “Assessing disaster impacts and response using social media data in China: A case study of 2016 Wuhan rainstorm.” International Journal of Disaster Risk Reduction, Vol. 34, pp. 275-282, https://doi.org/10.1016/j.ijdrr.2018.11.027."DOI
10 
"Guo, K., Guan, M. and Yan, H. (2023). “Utilising social media data to evaluate urban flood impact in data scarce cities.” International Journal of Disaster Risk Reduction, Vol. 93, 103780, https://doi.org/10.1016/j.ijdrr.2023.103780."DOI
11 
"Hapuarachchi, H. A. P., Wang, Q. J. and Pagano, T. C. (2011). “A review of advances in flash flood forecasting.” Hydrological Processes, Vol. 25, No. 18, pp. 2771-2784, https://doi.org/10.1002/hyp.8040."DOI
12 
"He, C. and Hu, D. (2025). “Social media analytics for disaster response: classification and geospatial visualization framework.” Applied Sciences, Vol. 15, No. 8, 4330, https://doi.org/10.3390/app15084330."DOI
13 
"Henao Salgado, M. J. and Zambrano Nájera, J. (2022). “Assessing flood early warning systems for flash floods.” Frontiers in Climate, Vol. 4, 787042, https://doi.org/10.3389/fclim.2022.787042."DOI
14 
"Huang, X., Wang, C. and Li, Z. (2018). “A near real-time flood- mapping approach by integrating social media and post-event satellite imagery.” Annals of GIS, Vol. 24, No. 2, pp. 113-123, https://doi.org/10.1080/19475683.2018.1450787."DOI
15 
"Huang, Y. and Bárdossy, A. (2020). “Impacts of data quantity and quality on model calibration: Implications for model parameterization in data-scarce catchments.” Water, Vol. 12, No. 9, 2352, https://doi.org/10.3390/w12092352."DOI
16 
"Hwang, S., Yoon, J., Kang, N. and Lee, D. (2020). “Development of flood forecasting system on city, mountains, and small river area in Korea and assessment of forecast accuracy.” Journal of Korea Water Resources Association, Vol. 53, No. 3, pp. 225-236, https://doi.org/10.3741/JKWRA.2020.53.3.225 (in Korean)."DOI
17 
"Im, K. H. (2017). “SNS big data analysis technology trend and development direction.” Journal of the Korea Contents Association, Vol. 15, No. 1, pp. 38-43 (in Korean)."URL
18 
"Joseph, J. K., Dev, K. A., Pradeepkumar, A. P. and Mohan, M. (2018). “Big data analytics and social media in disaster management.” Integrating Disaster Science and Management, pp. 287-298, https://doi.org/10.1016/B978-0-12-812056-9.00016-6."DOI
19 
"Karimiziarani, M. (2023). “Social media analytics in disaster response: A comprehensive review.” arXiv:2303.11181 [cs.CY], https://doi.org/10.48550/arXiv.2307.04046."DOI
20 
"Kim, B. S. and Kim, H. S. (2008). “Estimation of the flash flood severity using runoff hydrograph and flash flood index.” Journal of Korea Water Resources Association, Vol. 41, No. 2, pp. 185- 196 (in Korean)."URL
21 
"Kim, Y. H. (2022). “Social network service (SNS) usage behavior by generation.” KISDI STAT Report, 22(11), Korea Information Society Development Institute, pp. 1-6."URL
22 
"Kim, Y. H. (2024). “Social network service (SNS) usage behavior by generation.” KISDI STAT Report, 24(09), Korea Information Society Development Institute, pp. 1-6."URL
23 
"Kwon, S. J., Kang, Y. H., Lee, Y. H., Min, S., Park, S. H. and Kang, M. J. (2020). “Analysis of disaster safety situation classification algorithm based on natural language processing using 119 calls data.” KIPS Transactions on Software and Data Engineering, Vol. 9, No. 10, pp. 317-322, https://doi.org/10.3745/KTSDE.2020.9.10.317 (in Korean)."DOI
24 
"Lee, B. J., Choi, S. M., Yoon, S. S. and Choi, Y. J. (2016). “The evaluation of TOPLATS land surface model application for forecasting flash flood in mountainous areas.” Journal of Korea Water Resources Association, Vol. 49, No. 1, pp. 19-28, https://doi.org/10.3741/JKWRA.2016.49.1.19 (in Korean)."DOI
25 
"Lee, J. H. and Hwang, S. H. (2019). “A study on the application of social network service data for monitoring flood damage.” Journal of the Korean Society of Hazard Mitigation, Vol. 19, No. 7, pp. 77-85, https://doi.org/10.9798/KOSHAM.2019.19.7.77 (in Korean)"DOI
26 
"Lee, S. Y., Yoo, H. J. and Lee, S. O. (2020). “Development of a river stage forecasting algorithm and its applicability using non-parametric data.” Water for Future, Vol. 53, No. 5, pp. 82-89."URL
27 
"Lee, S. Y., Yoo, H. J. and Lee, S. O. (2021). “Role of unstructured data on water surface elevation prediction with LSTM: case study on Jamsu Bridge, Korea.” Journal of Korea Water Resources Association, Vol. 54, No. S-1, pp. 1195-1204, https://doi.org/10.3741/JKWRA.2021.54.S-1.1195 (in Korean)."DOI
28 
"Oudat, Q., Bakas, T. and Ghoneum, A. (2023). “Merits and pitfalls of social media as a platform for recruitment of study participants.” Journal of Medical Internet Research, Vol. 25, No. 1, e47705, https://doi.org/10.2196/47705."DOI
29 
"Park, D. I. and Yoon, S. H. (2017). “The big data method for flash flood warning.” Journal of Digital Convergence, Vol. 15, No. 11, pp. 245-253, https://doi.org/10.14400/JDC.2017.15.11.245 (in Korean)."DOI
30 
"Putra, P. K., Sencaki, D. B., Dinanta, G. P., Alhasanah, F. and Ramadhan, R. (2020). “Flood monitoring with information extraction approach from social media data.” Proc. IEEE Asia-Pacific Conf. Geosci., Electron., Remote Sens. Technol. (AGERS), pp. 113-119, Jakarta, Indonesia: Badan Pengkajian dan Penerapan Teknologi, https://doi.org/10.1109/AGERS51788.2020.9452770."DOI
31 
"Seo, T. W., Park, M. G. and Kim, C. S. (2013). “Design and implementation of the extraction mashup for reported disaster information on SNSs.” Journal of Korea Multimedia Society, Vol. 16, No. 11, pp. 1297-1304, https://doi.org/10.9717/kmms.2013.16.11.1297 (in Korean)."DOI
32 
"Wang, S., Li, R., Wu, H., Li, J. and Shen, Y. (2025). “Fine-grained flood disaster information extraction incorporating multiple semantic features.” International Journal of Digital Earth, Vol. 18, No. 1, 2448221, https://doi.org/10.1080/17538947.2024.2448221."DOI