1. 서 론
인도네시아는 인도네시아 전체 인구의 99%가 자연재해에 대한 위험이 높은 지역에 거주하고 있을 정도로(Jakarta Globe, 2014), 자연재해에
대한 노출이 크다. 그 중에서도 산사태는 인도네시아에서 오랫동안 심각한 재해로 최근 기후변화와 산지 주위의 무분별한 도시 개발로 인해 그 위험이 가중되고
있다(Anderson and Holcombe, 2013; Jakarta Globe, 2014). 인도네시아 재난관리국(BNPB, National Disaster
Management Agency)의 발표에 따르면, 인도네시아 2억 4천만 인구 중 약 1억 4천만이 산사태 위험이 높은 지역에 거주하고 있어(News24,
2013), 산사태로 인한 피해를 키우는 원인이 되고 있다.
산사태의 위험을 경감하기 위한 일차적인 단계는 산사태 취약성(landslide susceptibility)에 대해 파악하는 것이다(Samodra et
al., 2017). 산사태 취약성은 해당지역의 지형 특성에 의해 근거하여 산사태가 발생할 가능성을 의미하며(Brabb, 1984), 산사태가 발생할
공간적인 확률에 대해 일관적인 정보를 제공하기 때문에 산사태 관리에 있어서 중요한 도구로 여겨진다(Petschko et al., 2014).
특히 인도네시아 자바(Java)지역은 산사태가 집중되어 발생하는 지역이다. 따라서 산사태 피해가 심각한 인도네시아 자바 지역에 대한 산사태 취약성
분석이 필요하지만, 인도네시아 자바를 대상으로 진행된 선행 연구들은 일부 지역 혹은 유역 수준에서 진행되었다(Basofi et al., 2016;
Fowze et al., 2010; Gunadi et al., 2017; Hadmoko et al., 2017; Lakmal Deshapriya et
al., 2016; Ngadisih et al., 2016; Samodra et al., 2017; Wati et al., 2010). 기존의 연구들은
자바의 일부 지역만을 대상으로 하고 있어, 자바와 같은 광역의 지역에 대한 산사태 취약성을 파악하지는 않았다. 산사태는 인도네시아의 주요 재해이므로,
국가적인 차원에서 산사태 취약성을 평가하는 보편적인 방법론이 필요하며 보다 광역적 측면에서 산사태 취약성 분석이 이루어지는 것이 바람직하다. 이를
위하여 인도네시아 자바 지역 전체를 대상으로, 산사태와 관련된 최종 변수를 선택하고 대표적인 데이터기반 접근 방법을 서로 비교하여 적합한 모델을 제시하고자
한다. 따라서, 본 연구에서는 산사태 취약성 분석 모델 비교를 통한 인도네시아 전역의 산사태 취약성을 분석하고자 한다.
2. 연구대상지역 및 자료 구축
2.1 연구대상지역
본 연구에서는 인도네시아 자바를 대상지역으로 선정하였다(Fig. 1). 인도네시아는 적도를 중심으로 북위 5°에서 남위 10° 사이에 위치하고 있으며,
총 18,108개의 섬으로 이루어진 대표적인 도서 국가이다(Wikipedia, 2017). 그 중 자바는 인도네시아의 가장 큰 섬으로 인도네시아 전체
인구의 절반 이상인 약 1억 4천만 명이 거주하고 있다(City population, 2017). 자바의 면적은 우리나라의 1.4배에 해당하는 138,794km²이며,
동서 방향으로 긴 형상을 하고 있기 때문에 자바 내 기후 특성은 동서 방향으로 다르다. 서부지역은 습하고 열대우림, 동부에는 건조한 사바나 환경까지
포함하고 있다(Hadmoko et al., 2017).
Fig. 1.
The Study Area: (a) Geographical Position of Indonesia and Java Island (Red Box);
(b) Landslide Locations in Java Island
인구밀도가 높은 자바는 폭우로 인한 산사태가 자주 발생하며, 세계적으로도 산사태가 빈번하게 발생하는 지역으로 꼽힌다(Petley, 2012). 자바에서
1981-2007년에 발생한 산사태는 1400건 이상이며, 약 2,500명의 인명피해를 초래했다(Hadmoko et al., 2017). 따라서 본
연구는 산사태 발생이 빈번하고, 인구가 집중되어 피해가 큰 자바를 대상으로 산사태 취약성 분석을 수행하고자 하였다.
2.2 자료 구축
산사태는 해당 지역의 자연환경과 관련된 요소들과 많이 연관되어 있다. 지형관련인자, 수문 요인, 토지 이용 및 인위적 요인으로 분류되어 산사태 취약성과
관련성이 연구되고 있으며(Hadmoko et al., 2017; Samodra et al., 2017), 본 연구는 이들 연구에서 사용된 분류 체계와
변수를 참고하여 최종 변수를 선정하였다.
2.2.1 산사태 발생 이력
우선 산사태 취약성 모델링을 위해 가장 필수적인 정보는 산사태 발생과 관련된 정보이다. 본 연구에서는 인도네시아 재난관리청 GEOSPASIAL-BNPB
에서 취득 가능한 2011년 9월부터 2015년 6월까지 발생한 산사태 정보를 사용하였다(BNPB, 2011). 해당 자료는 산사태가 발생한 지역의
위치정보를 포함하여, 발생 일자, 간단한 설명 등이 포함되어 있다.
2.2.2 지형관련인자
지형관련인자에는 표고(elevation), 경사도(slope), 경사향(aspect), 단면곡률(profile curvature) 및 접선곡률(tangential
curvature)과 같은 변수들이 포함되어 있다. 지형관련인자는 주로 중력에 따른 에너지의 흐름과 연관되어 있고, 사면의 형태를 결정하기 때문에
산사태 발생 취약성 분석에 중요한 요소이다(Samodra et al., 2017).
표고는 USGS (United States Geological Survey)에서 제공하는 SRTM (Shuttle Radar Topography Mission)
3 Arc-Second 자료를 이용하였다. 경위도(WGS 84) 좌표계를 UTM 49S로 변환하였고 격자크기 90m로 생성된 수치표고모형(DEM,
Digital Elevation Model)을 사용하였다. 표고는 지형 특성을 나타내는 가장 기초적인 자료라고 할 수 있다.
경사도는 산사태 발생에 결정적인 인자이다(Kim et al., 2007). 경사가 가파를수록 전단응력이 증가하고 토양 수분 및 간극압에 영향을 미쳐
산사태가 발생 확률을 높이게 된다(Samodra et al., 2017).
경사향은 경사의 방향을 나타내는 값으로, 일사량 및 증발산량과 관련된 토양수분의 차이를 반영할 수 있다(Samodra et al., 2017). 경사향은
0부터 360까지 값을 가지며 8개의 클래스로 나누어 북쪽, 동북쪽, 동쪽, 남동쪽, 남쪽, 남서쪽, 서쪽, 북서쪽, 총 8가지로 구분하였다.
곡률은 사면의 곡면이 휜 정도를 나타내는 변화율로 곡률 반경의 역수이다(Kang et al., 2015; Yoon et al., 2015). 지표의
곡률은 지표수 흐름의 방향, 가속도, 침식 등에 영향을 미치는 중요한 변수로(Choi et al., 2013), 경사 방향에 평행한 방향(등고선의
수직방향)의 사면곡률인 단면곡률(윤곽구배곡률)과 경사 방향에 수직(등고선의 수평)방향의 사면곡률인 평면곡률을 보정한 접선곡률(접선구배곡률)이 포함된다.
곡률은 물 흐름의 수렴 및 발산을 평가하며, 흐름의 속도나 침전 이송과정의 변화를 파악하는데 중요한 요소이다(Samodra et al., 2017).
곡률 값이 양이면 볼록한 단면, 음이면 오목한 단면이 위로 향하는 것을 의미하며, 0에 가까울수록 단면이 평평함을 의미한다.
TPI (Topographic Position Index)는 분석하고자 하는 셀의 표고와 인접한 셀의 평균표고와의 차이에 의해 값이 결정되며 이를
통해 특정 지역의 상대적 위치를 정량적으로 나타낼 수 있다(Lee et al., 2015; Weiss, 2001). TPI가 양이면 분석하려고 하는
셀이 주변 지역보다 높은 곳에 있다는 것을 의미하며, 음의 값이 면 주변 지역보다 낮은 곳에 있다는 것을 의미한다. TPI의 값이 0에 가깝다면 이
셀은 평평하다고 볼 수 있다(Lee et al., 2015).
2.2.3 수문 요인
산사태는 지표수로 인한 침식, 지하수로 인한 토양 간극압 변화로 인해 발생할 수 있다(Samodra et al., 2017). 따라서 수문 요인에는
지표수 및 지하수의 영향을 나타내는 척도로써, SPI (Stream Power Index), TWI (Topographic Wetness Index)
및 하천과의 거리가 포함된다.
SPI (Moore et al., 1991)는 물의 흐름에 의한 사면의 침식 정도를 추정하는데 사용된다(Florinsky, 2011). 유역의 면적과
사면의 경사의 곱에 자연로그를 취하여 계산하게 된다. 유역 면적과 사면 경사도가 증가함에 따라, 상부에서 흐르는 물의 양과 유속이 증가하여 SPI가
증가한다. 이는 사면의 침식 정도를 높여 산사태 발생 위험을 높인다.
TWI (Beven and Kirkby, 1979)는 사면의 경사에 따라 토양 수분을 축적하는 경향을 설명하며, 토양 수분 분포를 나타내는 적합한
지표이다(Pei et al., 2010). TWI 지수가 높을수록 토양 수분 함량이 높음을 나타낸다.
하천까지의 거리는 침식과 관련이 있으며, 하천과의 거리가 가까울수록 산사태가 많이 발생할 것으로 가정한다. 하천 자료는 OSM (Open Street
Map)을 통해 취득하였다.
2.2.4 토양 요인
포화된 토양은 전단응력의 감소로 산사태가 발생할 확률이 높은데, 토양의 종류 및 성분에 따라 강우에 의해 포화되는 속도가 다르다(Oh, 2010).
자료는 FAO (Food and Agriculture Organization)에서 제공하는 토양도를 사용하였다(FAO, 2017).
2.2.5 인위적 요인
인위적 요인은 토지 이용과 도로로부터의 거리를 포함하며, 인간 활동으로 인한 산사태 발생과 관련되어 있다(Samodra et al., 2017).
토지피복도는 USGS GLCC (Global Land Cover Characteristics) Level 1 자료를 활용하였으며, 해당 연구지역 내
도시지역, 농업지역, 방목지역, 산림, 수역 총 5개의 클래스가 분포하고 있다.
도로까지의 거리는 주로 주택 및 택지 개발과 관련이 많은 요인으로(Samodra et al., 2017), OSM 도로 데이터를 이용하여 산출하였다.
Table 1은 본 연구에서 변수로 사용된 산사태 취약성에 영향을 미치는 요인을 정리한 것으로, 각 요인과 자료 출처를 보여준다. 관련 요인들은 모두
입력 자료의 축척을 고려하여 90m×90m 격자 크기를 가지는 Grid 자료로 동일한 공간해상도의 데이터베이스로 구축되었다(Fig. 2).
Table 1. Landslide Controlling Factors and Their Sources
|
Fig. 2.
Thematic Layers of the Landslide Controlling Factors: (a) Elevation; (b) Slope; (c)
Aspect; (d) Profile Curvature; (e) Tangential Curvature; (f) TPI; (g) SPI; (h) TWI;
(i) Distance to River; (j) Soil Types; (k) Land Cover; (l) Distance To Roads
3. 연구 방법
산사태 취약성을 분석하기 위한 방법으로는 다양한 자료를 GIS 기반의 통계적 기법을 이용하여 분석하는 데이터기반 접근법(data-driven approach)을
사용하는 연구가 가장 활발하게 진행되고 있다. 데이터기반 접근법은 다양한 데이터로부터 산사태 취약성을 추정하므로, 선행 지식이나 변수설정이 필요하지
않고, 보다 객관적이라는 장점이 있다. 또한 분석에 소요되는 시간이 길지 않아 대규모 지역을 분석하기에 적합하다(Samodra et al., 2017).
WoE, 로지스틱 회귀분석(LR, Logistic Regression), 의사결정트리 알고리즘(decision tree algorithm), 인공신경망(ANN,
Artificial Neural Network)과 같은 방법을 이용한 연구가 많이 진행되어 왔다(Gomez and Kavzoglu, 2005; Kim
and Park, 2017; Lee and Kim, 2012; Lee and Sambath, 2006; Yoon et al., 2015). 다양한
접근방법이 개발되어 산사태 취약성을 분석하였으나, 어떤 변수를 반드시 고려해야 하는지, 어떤 절차로 분석을 수행해야 하는지, 어떤 기법이 가장 효과적인
것인지에 대한 학문적 합의는 이루어지지는 않았다(Kim and Park, 2017; Samodra et al., 2017). 이에 본 연구에서는 WoE,
의사결정트리, 인공신경망 등 대표적인 데이터기반 접근법들을 인도네시아 자바 지역에 적용하고 결과를 비교하여 적합한 모델을 찾고자 하였다.
3.1 WoE (Weight of Evidence)
WoE 기법은 기존의 산사태의 분포와 표고, 경사, 토양 등 지형공간정보 사이의 관계를 확률로 표현하는 자료유도형 방법으로써, 베이지안 확률을 기반으로
하고 있다(Oh, 2010). 사전확률과 사후확률을 사용하여 산사태와 각 변수와의 관계를 파악하여 산사태 발생 확률을 추정하는 방법이다.
WoE는 다음 Eqs. (1) and (2)와 같이 정의되며, Eq. (1)은 산사태 유발 요인을 고려한 산사태가 발생할 조건부 확률, Eq. (2)는
해당 요인을 고려하지 않았을 때 산사태가 존재할 조건부 확률을 의미한다.
(1)
(2)
여기서, 는 해당 사건이 발생할 확률, 는 특정 산사태 유발 요인이 존재할 경우, 는 해당 요인이 부재한 경우, 은 산사태가 발생한 경우, 는 산사태가 발생하지 않았을 경우, 는 산사태가 발생하거나 발생하지 않았을 때 임의의 요인 가 존재할 확률에 대한 우도비(likelihood ratio), 는 산사태가 발생하거나 발생하지 않았을 때 임의의 요인 에 사건이 존재하지 않을 확률에 대한 우도비를 의미한다(Bonham-Carter, 2002).
가 양수이고 가 음수일 때는 산사태와 변수가 양의 상관관계에 있음을 의미하며, 반대의 경우는 음의 상관관계를 나타낸다. ==0인 경우, 각 변수와 산사태 분포 특성과는 관계가 없다는 것을 의미한다.
Eq. (3) 와 의 차이를 통해 (weight contrast)가 구해지며, 가 양수이면 양의 상관관계, 음수이면 음의 상관관계임을 나타낸다. 각 변수 구간별로 값이 결정되면, 각 요인별 의 합으로 산사태 발생 취약성 지수(LSI, Landslide Susceptibility Index)를 산출할 수 있다. LSI 값이 클수록 산사태
발생 취약성이 높다는 것을 의미한다.
(3)
3.2 의사결정트리
의사결정트리는 의사결정규칙을 도표화하여 관심대상이 되는 집단을 몇 개의 소집단으로 분류하거나 예측을 수행하는 분석방법으로, 분석과정이 트리구조로 표현된다.
예를 들어, ‘조건이 A이고 조건이 B이면 결과집단 C’라는 형태의 규칙으로 표현되며, 분석과정을 쉽게 이해할 수 있다는 장점이 있다(Yoo et
al., 2010).
Fig. 3은 의사결정트리를 단순화한 모식도이며, 각 네모상자는 노드(node)라고 부른다. 뿌리노드(root node)는 시작되는 노드로 전체 자료를
포함하며, 자식노드(child node)는 하나의 노드로부터 분리되어 나간 2개 이상의 노드이며, 더 이상 자식노드가 없을 때 종단노드(terminal
node)가 된다. 이렇게 특정 법칙에 의해 노드를 나누는 것을 가지치기(pruning)라고 한다.
일반적으로 의사결정트리 분석은 의사결정트리 형성(성장), 가지치기, 타당성 평가, 해석 및 예측의 과정을 거치는데 이러한 분석 과정에서 분리기준,
평가기준 등을 어떻게 지정하느냐에 따라 서로 다른 의사결정트리가 형성된다(Choi and Seo, 1999). 본 연구에서는 가장 대표적으로 많이
사용되고 있는 Kass (1980)에 의해 제안된 CHAID (Chi-squared Automatic Interaction Detection) 알고리즘을
이용해 의사결정트리를 생성하였다. CHAID 알고리즘은 목표변수가 범주형일 때, Pearson의 카이제곱 통계량 또는 우도비 카이제곱 통계량(likelihood
ratio Chi-square statistic)을 분리기준으로 사용하여 다지분리(multi-way split)를 수행한다. 다지분리는 부모노드에서
자식노드로 2개 이상의 분리를 수행하는 것이다.
CHAID는 계산된 통계량의 p-value를 기본으로 변수의 병합과 분리를 반복하여 최종 결정트리를 생성한다. p-value가 가장 작은 예측변수와
그 때의 최적분리에 의해서 자식노드를 형성시킨다(Choi and Seo, 1999). 예측변수의 각 범주에 따른 목표변수의 분포가 서로 동일하면,
카이제곱 통계량이 자유도에 비해서 매우 작다는 것을 의미하며, 예측변수가 목표변수의 분류에 영향을 주지 않는 것이다. 본 연구에서는 목표변수가 산사태가
발생 여부, 예측변수가 산사태 유발 요인이 되므로, 해당 인자가 산사태 발생에 큰 영향을 주지 않는다고 결론지을 수 있다. 의사결정트리로 산출되는
LSI는 종단노드에서 최종적으로 분류된 그룹의 산사태 발생 비율로 산출하였다.
3.3 인공신경망
인공신경망은 인간 두뇌의 신경망에서 영감을 얻어 개발된 통계학적 학습 알고리즘으로, 두뇌의 뉴런의 역할을 하는 노드들로 네트워크를 구성하고, 학습을
통해 뉴런 간의 결합 세기를 변화시켜 모델을 구성한다(Fig. 4). 기본 요소는 노드이며, 여러 개의 노드가 입력층(input layer), 하나
또는 두 개의 은닉층(hidden layer), 출력층(output layer)으로 배열되어 구성된다(Taheri and Zomaya, 2006).
노드들의 출력은 층간 경중률(, )을 통해서 확대 또는 감소되어 다른 층의 노드로 전달되며, 각 연결의 경중률은 학습을 통해 갱신된다.
Fig. 4.
Diagram of a Neural Network
경중률 갱신을 위해 역전파 알고리즘(back propagation al-gorithm)을 사용하며, 역전파 알고리즘은 목표 출력값과 실제 출력값과의
차의 제곱을 최소화하도록 경중률을 갱신한다(Paola and Schowengerdt, 1995). Eq. (4)는 목표 출력값 , 훈련데이터로 산출된 실제 출력값 의 차이로 계산되는 평균제곱오차(MSE, Mean Squared Error)를 나타낸다. 본 연구에서는 역전파 학습 알고리즘으로 LM (Levenberg-Marquardt)
기법(Marquardt, 1963)을 이용하여 경중률 값을 갱신하였다.
(4)
LM기법은 비선형 최적화 문제에 사용되는 대표적인 방법으로, 기울기법(gradient method)과 뉴턴법(Newton’s method)를 결합하여
빠르고 정확한 해를 얻을 수 있다(Kang et al., 2009). LM기법은 MSE를 최소화하는 방향으로 경중률을 탐색한다.
본 연구에서는 표고, 경사 등 산사태 관련 인자인 12개의 변수들이 입력층의 값()으로 입력된다. 입력된 값들은 경중률 와 곱해져 은닉층()으로 입력되며 해당 값은 다시 경중률 를 통해 출력층 값()으로 산출된다. 최종 출력값은 activation 함수를 통해 얻을 수 있으며, 해당 출력값을 LSI로 사용하였다.
4. 결과 및 분석
4.1 모델별 결과
4.1.1 WoE
WoE 경중률은 양수일 때 산사태와 해당 변수와 양의 상관관계, 음수일 때 음의 상관관계, 0에 가까울수록 상관관계가 없다고 판단한다. 산사태에 영향을
미치는 요인 내에서도 어떤 범위에서 더 영향을 주는지 파악할 수 있다. Table 2는 WoE 분석 결과를 보여준다. 우도비(likelihood ratio)는
각 요인 등급별 산사태 발생 면적의 비율이므로, 1보다 크면 산사태 발생 확률이 높다는 것을 의미한다.
먼저 지형관련인자를 살펴보면, 표고가 높아질수록 산사태 취약성이 높아지는데 약 600m에서 800m 사이가 가장 높았다. 경사의 경우도 경사도가 높을수록
산사태 발생확률이 높은 경향을 보인다. 곡률의 경우, 단면곡률은 음수일 때(등고선 수직 방향으로 오목할 때), 접선곡률은 양수일 때(등고선 수평 방향으로
볼록할 때)가 산사태 발생확률이 높았다. TPI의 경우 아주 높거나 낮은 구간에서 우도비가 큰 값을 보였는데, 이는 TPI가 인근 셀의 높이 차에
비례하기 때문에 표고의 차이가 큰 지역에서 산사태 발생확률이 높은 것을 의미한다. 수문요인에서 SPI와 TWI는 큰 경향성을 보이지는 않았고, 하천까지의
거리는 가장 작은 구간에서 우도비 값이 가장 크게 나타났으나 거리가 큰 구간에서도 우도비 값이 높게 나타났다. 토양도에서는 안도솔(Th)일 때 우도비가
3을 넘어 가장 큰 값을 보이는데, 해당 토양은 화산활동으로 유래한 토양으로, 사면에서 쉽게 흘러내리기 특성을 가지고 있다(Chesworth, 2007).
인도네시아는 불의 고리에 속해 있어 화산활동이 빈번하고 이 때문에 안도솔로 이루어진 토양에서 산사태가 쉽게 발생했다고 볼 수 있다. 인위적 요인에서는
도시지역에서, 그리고 도로로부터의 거리가 가까울수록 산사태가 쉽게 발생하는 경향을 보였다.
Table 2. WoE between Landslide and Related Factors
|
Table 2. WoE between Landslide and Related Factors (Continued)
|
Table 2. WoE between Landslide and Related Factors (Continued)
|
Table 2. WoE between Landslide and Related Factors (Continued)
|
4.1.2 의사결정트리
산사태 취약성 분석을 위해 의사결정트리 알고리즘을 적용하여 도출된 결과는 Fig. 5와 같으며, 뿌리노드에서 종단노드까지 각 노드에는 해당 노드로
분류된 데이터 중 산사태가 발생한 지역과 아닌 지역의 비율이 표시되어 있다. 트리 구조의 노드는 총 21개, 종단노드는 13개이며, 표고, 도로까지의
거리, 경사도, 단면 곡률이 분류에 사용된 인자이다. 표고 값이 357m 이상일 때 산사태가 발생할 확률이 높고, 157m 이하일 때는 산사태 발생확률이
낮았다. 도로까지의 거리는 100m 이내일 때 산사태 발생확률이 높고, 단면 곡률은 음수일 때(오목) 산사태 발생확률이 높은 것으로 나타났다.
Fig. 5.
Decision Tree for Landslide Susceptibility Mapping
4.1.3 인공신경망
인공신경망은 Table 3과 같이 구성하였다. 12개의 변수가 노드가 되는 입력층, 10개의 노드를 가진 1개의 은닉층, 1개의 출력층으로 구성된다.
은닉층에서는 시그모이드 함수를 활성함수로 설정하였으며, 출력층에서 얻어지는 값이 산사태 취약지수가 된다. 최대 반복 횟수는 1,000회, 경중률은
LM 방법을 이용하여 최적화한다. Fig. 6은 생성된 인공신경망의 최종 경중률을 도식화한 것이다.
Table 3. The Parameter Setting of ANN
|
4.2 산사태 취약성 지도
본 연구에서는 산사태 취약성 지수를 매핑하기 위해 WoE, 의사결정트리, ANN을 사용하였고, 그 결과로 각 모델에서 산출된 산사태 발생 취약성 지도를
얻을 수 있었다. Fig. 7은 순서대로 산사태 취약성을 (a) WoE, (b) 의사결정트리, (c) 인공신경망을 이용하여 예측한 결과이다. 해당
그림은 LSI를 Chung and Fabbri (1999) 의 기준을 참고하여 산사태 발생 취약성을 매우 높음, 높음, 보통, 낮음, 매우 낮음으로
재분류한 것이다. 각 모델을 통해 산출된 LSI 값을 분위수(10%, 25%, 40%, 60%)를 사용하여 분류하였다.
Fig. 7.
Landslide Susceptibility Maps based on Difference Models: (a) WoE; (b) Decision Tree;
(c) ANN
세 가지 모델 모두, 산사태 발생이 취약한 지역은 세 모델의 결과 모두 표고와 경사도가 높은 지역과 유사한 지역에 위치하고 있다. WoE 결과는 다른
두 모델과 비교하여 산사태 취약지수 구간별 경계가 명확하지 않다. 다른 모델에 비해 의사결정트리의 결과가 도로를 중심으로 산사태 취약성이 덜 낮다고
판단하였으며, 인공신경망 결과는 표고가 높은 지역에서 산사태에 매우 취약한 지역이 분포하고 있다.
4.3 산사태 취약성 모델 비교
서로 다른 모델을 이용하여 생성된 산사태 취약지도를 비교하기 위해 이를 위해 SRC (Success Rate Curve)와 AUC (Area Under
the Curve)를 사용하였다. SRC는 산사태 취약성 지수 값에 대한 상대적 순위에 대한 산사태 발생 누적 비율을 도시한 그래프로, 산사태 취약성과
실제로 발생한 산사태 간 공간 정확도에 대한 분석을 가능케 한다(Chung and Fabbri, 1999; Samodra et al., 2017).
SRC의 X축은 산사태 취약성이 높은 지역을 상위 퍼센트로 나열한 값이고, Y축은 산사태 발생 횟수를 누적 퍼센트로 표시한 값이다. 만약, X축의
값이 1%일 때 Y축이 100%라면, 산사태 취약성 지수 상위 1% 픽셀 내 산사태 발생 위치가 모두 존재한다는 것을 의미한다. AUC는 SRC와
X축과의 면적을 계산하여 얻을 수 있으며, 면적이 높을수록 산사태 취약성 예측 정확도가 높다고 할 수 있다.
Fig. 8은 각 모델의 SRC와 AUC를 구한 것으로, WoE를 적용하였을 때 AUC는 66.95%, 의사결정모델의 경우 67.04%, 인공신경망의
경우 69.67%의 예측 정확도를 보이고 있다. 전체적으로 세 모델의 예측 정확도에서 큰 차이가 존재하지 않지만 인공신경망의 예측 정확도가 가장 높았다.
Fig. 8.
Success Rate Curve of WoE, Decision Tree, and ANN
5. 결 론
본 연구는 인도네시아 자바지역을 대상으로 산사태 취약성을 분석하기 위해, 다양한 산사태 관련 요인의 자료를 구축하였고, 대표적인 모델을 적용 및 비교하여
취약지도를 제작하였다. 산사태 발생에 영향을 미치는 인자로서 표고, 경사도, 경사향, 곡률, TPI와 같은 지형관련인자, SPI, TWI, 하천으로부터의
거리를 포함하는 수문 요인, 토양 종류, 토지피복 및 도로까지의 거리 등을 고려하였다. WoE 결과를 통해 토양의 종류와 표고의 영향이 가장 크게
작용하는 것을 확인할 수 있었고, 의사결정트리에서는 표고, 도로까지의 거리, 경사도, 단면 곡률이 분류에 사용되었다. ANN에서도 산사태 취약성과
표고의 관련성이 높은 것으로 판단되었으며, 지형인자 중 표고 값이 세 가지 모델에서 모두 중요한 역할을 하는 것을 알 수 있었다.
인도네시아는 재해로 인한 영향을 많이 받는 국가로, 앞으로의 지속적인 성장을 위해서는 도시공간계획 등의 정책계획에서 자연재해 취약도 및 재난 관리를
고려해야 한다. 따라서 본 연구에서 자바지역을 대상으로 산사태 취약성을 파악하기 위한 모델 및 연구결과는 향후 인도네시아 산사태 관련 정책 결정에
사용될 수 있을 것이다. 또한 본 연구에서는 공개된 자료를 이용하였기 때문에, 본 연구의 방법론을 다른 국가에 적용할 때에도 수혜국에 경제적 부담을
주지 않는다는 장점이 있다. 본 연구의 결과는 산사태 관련 재난관리 정책과 매우 관련성이 높은 자료로서, 해당 정책 의사결정에 있어 중요하게 사용될
수 있을 것으로 기대한다.