Mobile QR Code QR CODE : Journal of the Korean Society of Civil Engineers

  1. 정회원 ․ 서울과학기술대학교 철도전문대학원 철도안전공학과 박사과정 (Seoul National University of Science and Technology ․ shc171717@naver.com)
  2. 종신회원 ․ 교신저자 ․ 서울과학기술대학교 철도전문대학원 철도경영정책학과 교수 (Corresponding Author ․ Seoul National University of Science and Technology ․ sigonkim@seoultech.ac.kr)



철도사고 발생 유형, 철도사고 발생 요인, 데이터 전처리, 통계적 유의성
Types of railway accidents, Causes of railway accidents, Data preprocessing, Statistical significance

1. 서 론

1.1 연구배경 및 목적

본 연구는 철도사고의 유형별 발생 요인과 경제적 영향을 분석하는 데 중점을 두었다. 철도사고는 인적 요인, 기술적 요인, 외부 요인 등을 주요한 발생원인으로 분류할 수 있으며, 이러한 사고가 경제적으로 미치는 영향 또한 매우 중요하다. 철도사고의 발생 요인들이 경제적으로 어떤 영향을 미쳤는지를 조사·분석함으로써, 철도 안전을 강화하고 사고를 예방하기 위한 효과적인 전략을 개발하고자 한다. 철도사고 유형, 철도 차량 종별(고속철도, 일반철도 및 도시철도)과 발생 원인(인적 요인, 기술적 요인 및 외부 요인) 사이의 상관관계를 통계적으로 검증함으로써 각 요인이 철도사고에 미치는 영향을 파악하고, 사고 예방 전략을 수립하기 위한 근거 자료를 제시하여 철도 안전 관리의 효율성을 증대시키고 공공의 안전을 확보하는 데 기여하고자 한다.

1.2 연구내용 및 방법

일반적으로 광역철도는 일반철도와 도시철도를 혼용해서 운행하는 것을 의미하지만, 본 연구에서는 철도차량 사고분류에 따른 데이터 집계를 일반철도와 도시철도로 분류해서 철도차량종별 철도사고 유형과 발생 요인간의 통계적 유의성을 분석하였다.

본 연구는 철도 사고와 관련한 데이터 마이닝 알고리즘을 수행해서 데이터의 통계 분석을 하기에 효율적이며 통계적 상관관계 분석에 적합한 효과를 지닌 R-studio를 활용하여 철도사고의 발생유형과 그 원인과의 연관성을 분석하였다.

철도사고 유형과 원인 간의 상관관계를 가설설정하여 사고데이터를 종합적이고 통계적으로 분석한 선행연구가 미비하여, 본 연구에서는 이러한 상관관계의 통계적 유의성을 평가하기 위해 다양한 통계적 방법을 사용하였으며, 사고발생 원인에 대해 인적, 기술적, 외부적 요인으로 분류된 사고유형과 원인 간의 관계에 대한 연관성을 통계 기법을 활용하여 조사 결과의 중요성을 검증하고 결과의 신뢰성을 나타내고자 하였다.

철도차량의 종별 즉, 고속철도, 일반철도, 도시철도 등 다양한 유형의 철도차량을 대상으로 사고 원인과 영향의 변화를 분석하고자 독립변수는 차량의 종류와 사고원인으로 하였으며, 종속변수는 피해금액으로 설정하였다. 포괄적인 통계적 접근 방식은 이전에 탐구되지 않았던 중요한 패턴과 관계를 밝혀서 사고 원인의 경제적 영향을 강조함으로써 표적화된 안전의 중요성을 부각함으로써 철도 사고로 인한 경제적 부담을 완화하고 전반적인 안전 조치개선에 기여하고자 한다.

1.3 연구과정

사고유형 분석결과에 대한 데이터 분석을 통해 통계적 유의성을 검정하고, ANOVA 결과분석과 사후분석인 Scheffés 분석 결과로 철도종별과 사고원인의 상관관계와 철도종별과 사고원인에 대한 개별 그룹간 평균 차이분석 그리고 교차분석을 통한 가설검증을 하였다(Cho and Chung, 2009).

1.4 가설의 설정

고속철도, 일반철도 및 도시철도 등의 철도차량종별 및 발생원인을 독립변수로 설정하였으며, 이에 대한 피해액이 얼마나 되는지를 종속변수로 변수설정을 하였다.

하나의 독립변수 수준에 종속변수의 평균변화율에 대한 상관관계 평균독립변수와 종속변수간의 인과관계를 확인하였다. 독립변수인 철도종별과 종속변수(피해액의 평균)의 상호작용 효과에 대해 다음과 같이 귀무가설(H0)과 대립가설(H1)을 수립하였다.

․ 귀무가설(H0) : 차량종별 및 발생원인에 따른 피해액의 차이가 없다.

․ 대립가설(H1) : 차량종별 및 발생원인에 따른 피해액의 차이가 있다.

2. 데이터 전처리

2000. 01.부터 2022. 12.까지 철도사고 누적 데이터를 철도차량 종별로 교통사상사고, 안전사상사고, 철도안전사고 및 충돌. 탈선. 화재 사고발생 등의 유형으로 총 5,033건의 데이터 분석하였다.

철도차량별 사고 발생현황은 Fig. 1에 나타난 바와 같이 교통사상사고는 3,097건, 안전사상사고는 1,430건, 전체 철도종류에 따른 사상사고가 4,526건으로 전체 89.8 %를 차지하고 있다. 이는 대부분의 철도 사고가 교통사상사고와 안전사상사고와 관련이 있음을 시사하고 있으며, 분석 결과는 철도 안전 강화를 위한 기초 자료로 활용될 수 있을 것으로 사료된다.

철도차량 종별에 따른 사고발생 건 수는 고속철도 5.2 %(260건), 일반철도 53.6 %(2,699건), 도시철도 41.2 %(2,074건)로 분석하였고, 발생 요인별로는 차종과 무관하게 외적요인은 일반철도 0.4 %, 도시철도 0.4 %, 고속철도 0 %이고, 기술적인 요인은 일반철도 3.1 %, 도시철도 3.1 %, 고속철도 2.7 %이며, 인적요인은 96.4 %로 절대적으로 압도적인 결과가 나타났다. 인적요인에 대한 차종별로 세부적으로는 일반철도 96.4 %(1,999건), 도시철도 96.4 % (2,603건) 및 고속철도 97.3 %(253건)이다.

또한, 대상기간을 5년 단위로 그룹핑해서 분석한 결과, 연도별 발생요인별 건 수는 2016년 이후부터는 눈에 띄게 감소하는 추세를 나타나고 있으며, 그중에서 특히, 인적요인(이전 대비 39.7 %, 27.1 %, 49.1 % 차지)에 대한 감소 추세가 눈에 띄게 줄었다는 것이 특이사항인데, 이 현상은 여러 가지 변수를 고려할 수 있겠으며 우선, 노후된 차량시스템의 대폐차 주기와의 연관성, 스마트한 유지보수시스템 도입 여부, 그리고 운영기관별로 인적오류 방지를 위한 교육시스템(안전 5종방호) 강화, 설비투자 등을 고려할 수 있겠다.

차량종별에 따른 피해 금액과의 연관성은 전체 8백7십억원 중 전체 사고의 5.2 % 밖에 안되는 고속철도가 전체 피해 금액의 42.6 %(3백7십억원)를 차지하고 있으므로, 이는 고속철도 차량시스템의 비용이 다른 차량에 비해 부품이 고가이기 때문인 것으로 판단할 수 있다. 일반철도는 40.7 %(3백5십억원), 도시철도는 16.7 %(1백4십억원)으로 피해금액이 분석되었다.

Fig. 1. Status of Accidents by Type of Railway Vehicles

../../Resources/KSCE/Ksce.2025.45.3.0413/fig1.png

Fig. 2. Analysis of Accident Types by Rail Vehicle

../../Resources/KSCE/Ksce.2025.45.3.0413/fig2.png

Fig. 3. Railway Vehicle Accident Damage

../../Resources/KSCE/Ksce.2025.45.3.0413/fig3.png

3. 데이터 변수 인코딩

ANOVA 통계 분석을 위한 사전작업으로 명목변수에 대한 데이터 코딩을 설정하였다. Table 1과 같이 고속철도, 일반철도, 도시철도 등 철도종별과 인적요인, 기술적요인, 외적요인 등 사고요인에 대해서 일련번호 부여로 데이터 코딩을 하였으며, 피해액은 백만원 이하, 오백만원 이하, 천만원 이하, 오천만원 이하 그리고 오천만원을 초과한 경우로 구분하여 일련번호를 부여하여 데이터를 코딩하였다.

Table 1. Data Coding for Nominal Variables

../../Resources/KSCE/Ksce.2025.45.3.0413/tb1.png

4. 통계적 유의성 검정

4.1 레빈 테스트(Levene’s test)를 통한 분산의 동질성 검증

레빈 테스트는 후속 통계 분석의 견고함과 적절성을 보장하기 위한 사전 검정으로 등분산 가정이 만족할 때만 ANOVA를 수행하므로 분산이 동일할 때 즉, 등분산일 때 ANOVA 테스트의 신뢰성이 높기 때문에 ANOVA 테스트를 수행하기 전에 레빈 테스트 절차를 거쳐 등분산 테스트 즉 분산의 동질성 검증을 수행하였다.

4.2 철도종별과 사고원인의 연관성

레빈 테스트 수행 결과 철도종별이나 사고원인 모두 p 값이 0.05보다 작기 때문에 등분산이 아니므로 Welch ANOVA를 수행하였다.

4.3 이원분산 및 웰치분산 분석(Two-way ANOVA / Welch’s ANOVA)

두 개의 독립 변수(요인)가 종속 변수에 미치는 영향을 동시에 분석하기 위해 양 방향 분산분석(ANOVA)을 시행하여 각 독립 변수의 개별 효과(main effect)와 두 독립 변수 간의 상호작용 효과(interaction effect)를 확인하였다(Lim and Kim, 2006).

철도차량 종별, 사고원인 그리고 철도차량의 종별과 사고원인의 상호관계에 대한 피해금액의 차이 유무를 이원분산(Two-way ANOVA)을 수행한 결과, 등분산이 아님을 고려하여 웰치 아노바(Welch ANOVA)를 수행하였다. 우선 ① 철도차량 종별은 “철도차량 종별에 따른 피해액의 차이가 없다”를 귀무가설로, “철도차량 종별에 따른 피해액의 차이가 있다”를 대립가설로 설정하였으며, ② 사고원인은 “사고원인에 따른 피해액의 차이가 없다”를 귀무가설로 “사고원인에 따른 피해액의 차이가 있다”를 대립가설로 설정하였다. 또한 ③ 두 가지 요인의 상호작용은 “철도차량의 종별과 사고원인이 상호작용해도 피해액의 차이가 없다”를 귀무가설로 “철도차량의 종별과 사고원인이 상호작용해도 피해액의 차이가 있다”를 대립가설로 가설을 설정하였다.

그 결과 p 값이 각각 0.0002455와 7.012의–13승 및 1.75의–11승으로 p 값이 모두 0.05보다 작아서 각각의 귀무가설은 기각하였으며, 이것은 철도차량 종별 및 사고원인 그리고 이 두 개의 독립변수 상호간의 작용이 피해액에 차이가 없다는 것을 의미하며, 철도차량 종별, 사고원인 및 두 요인의 상호작용 모두 피해액에 영향을 끼치는 것으로 판단할 수 있다(Chung and Lee, 2013).

Fig. 4. Levene's Test for Railroad Classification

../../Resources/KSCE/Ksce.2025.45.3.0413/fig4.png

Fig. 5. Levene's Test for Accident Causes

../../Resources/KSCE/Ksce.2025.45.3.0413/fig5.png

Fig. 6. Two-way ANOVA/Welch’s ANOVA

../../Resources/KSCE/Ksce.2025.45.3.0413/fig6.png

Table 2. Distributed Division and Welch’s Distribution Results

../../Resources/KSCE/Ksce.2025.45.3.0413/tb2.png

4.4 사후분석(Scheffés Test)

ANOVA 수행으로 그룹 간의 유의미성 유무를 판단할 수 있으므로 철도종별과 사고원인이 피해액에 구체적으로 어떤 영향을 미치는 지를 분석하기 위해 사후분석을 수행해 보았다. Fig. 7에서 ① 철도종별에 대한 피해액의 차이를 그룹별로 분류하여 사후분석(좌측자료)을 시행한 결과, 고속철도(1)는 그룹별로(a), 일반철도(2)와 도시철도(3)는 동일한 그룹(b)을 공유하므로 평균규모 측면에서 큰 차이가 없음을 나타내고 있다. ② 사고원인에 대한 피해액이 차이를 사후분석(우측자료)한 결과, 고속철도(1), 일반철도(2) 및 도시철도(3) 각각의 그룹이 (a), (b) 및 (c)로 피해액에 영향을 미치는 것으로 나타내었다.

Fig. 7. Scheffés Test on Railway Types and Causes of Accidents

../../Resources/KSCE/Ksce.2025.45.3.0413/fig7.png

③ 철도종류별로 사고원인 피해액에 영향을 미친다는 것을 의미하며, 이러한 결론은 철도의 종류와 사고 원인 모두 피해 규모를 결정하는 중요한 요소임을 시사한다. 철도의 종류(일반 vs. 도시)는 한 가지 측면에서 큰 차이를 가져오지만, 사고 원인을 고려하면 철도의 종류마다 뚜렷한 영향이 있음을 알 수 있다.

Fig. 8. Results of Hypothesis Testing Through Chi-Squared Analysis (1/2)

../../Resources/KSCE/Ksce.2025.45.3.0413/fig8.png

Fig. 9. Results of Hypothesis Testing Through Chi-Squared Analysis (2/2)

../../Resources/KSCE/Ksce.2025.45.3.0413/fig9.png

4.5 카이스퀘어(chi-squared)를 통한 가설검증

철도종별과 사고원인과의 두 범주형 변수 간에 관계를 이해하고자 교통사상사고의 종류(13가지)에 따라 철도차량별 사고발생 빈도에 차이가 있는 지를 분석하였으며, 귀무가설(Ho)은 “교통사상사고의 종류에 따라 철도차량별 사고발생 빈도에 차이가 없다.” 대립가설(H1)은 “교통사상사고의 종류에 따라 철도차량별 사고발생 빈도에 차이가 있다.”로 가설을 설정하였다. 명목변수에 대한 데이터 코딩은 1부터 13까지 일련번호를 부여하였다. 카이스퀘어 통계량은 1,370.6이며, 자유도는 24이고, p 값은 <0.05이므로 귀무가설을 기각하고 대립가설을 채택하였다. 즉, 교통사상사고 종류에 따라 철도차량별 사고발생 빈도에 차이가 있었다(Jin and Lee, 2017).

5. 결론 및 향후 연구과제

본 연구는 “카이스퀘어 결과는 유의수준(α)이 0.05 수준에서 통계적으로 유의하다”는 통계적 유의성과, 테스트된 변수간에 연관성이 없다는 귀무가설을 기각할 수 있다는 근거가 있음을 확인할 수 있었다. 즉, 철도차량의 사고유형별로 분석한 결과 신뢰수준 95 %에서 차량 종별에 다른 사고발생 빈도는 차이가 없다는 귀무가설은 기각하고 대립가설을 채택하였다. 따라서, 고속철도 일반철도 및 도시철도의 차량종별 사고발생 빈도에 차이가 있다는 결론을 도출하였다. 사후분석을 통해 독립변수인 철도종별과 종속변수인 피해액의 평균 즉, 두 독립변수의 상호작용 연관성이 있음을 확인할 수 있었다(Park and Kang, 2023).

데이터 분석기간을 5년 단위로 그룹핑해서 분석한 결과에 따르면 2016년부터는 인적 요인에 의한 사고가 눈에 띄게 감소하였다. 이러한 추세는 인적 오류 방지를 위한 차량 시스템 개선, 시설 투자, 교육 인프라 개선과 잠재적인 관계가 있음을 시사하며, 이러한 관계를 좀 더 심도있게 탐구하는 데 중점을 두어 연구할 필요가 있다. 첫째, 차량시스템 개선이 사고감소에 미치는 영향에 대한 심도있는 분석이 필요하다. 둘째, 철도안전 제고를 위한 시설투자의 효과성을 평가할 필요가 있다. 셋째, 인적 오류 예방을 위한 교육 인프라와 연관성을 조사한다. 또한, 철도 안전에 남아 있는 과제를 해결하기 위해 보다 체계적인 전략기법을 개발하는 것이 중요하다고 할 수 있다. 사고 데이터를 지속적으로 모니터링하고 분석함으로써 효과적인 안전 조치를 개발할 수 있을 것으로 기대된다.

References

1 
"Cho, C. H. and Chung, B. H. (2009). “A study of the user's evaluation on the Korea-China railferry system.” Journal of the Korean Society for Railway, Vol. 12, No. 5, pp. 707-713 (in Korean)."DOI
2 
"Chung, S. Y. and Lee, W. Y. (2013). “A study on the estimation function of the operation cost for an urban railway (with a focus on medium-sized rapid transit).” Journal of the Korean Society for Railway, Vol. 16, No. 4, pp. 318-330, https://doi.org/10.7782/JKSR.2013.16.4.318 (in Korean)."DOI
3 
"Jin, S. B. and Lee, J. W. (2017). “Study on accident prediction models in urban railway casualty accidents using logistic regression analysis model.” Journal of the Korean Society for Railway, Vol. 20, No. 4, pp. 482-490, https://doi.org/10.7782/JKSR.2017.20.4.482 (in Korean)."DOI
4 
"Lim, K. K. and Kim, S. G. (2006). “The classification of railroad accident types and its standardization.” Journal of Civil and Environmental Engineering Research, Vol. 26, No. 1D, pp. 133-140, https://doi.org/10.12652/Ksce.2006.26.1D.133 (in Korean)."DOI
5 
"Park, J. H. and Kang, B. B. (2023). “Statistical correlation analysis of influence of causes of railway accidents on the amount of damage.” Journal of the Korean Society for Railway, Vol. 26, No. 8, pp. 581-594, https://doi.org/10.7782/JKSR.2023.26.8.581 (in Korean)."DOI