JOURNAL OF THE KOREAN SOCIETY OF CIVIL ENGINEERS. December 2019. 833-839
https://doi.org/10.12652/Ksce.2019.39.6.0833


ABSTRACT


MAIN

  • 1. 서 론

  • 2. 선행 연구

  •   2.1 버스도착시간 정보 관련 연구

  •   2.2 시사점

  • 3. 방법론

  •   3.1 분석을 위한 지표설정 및 알고리즘의 구성

  •   3.2 패턴인식 알고리즘

  •   3.3 패턴선택 알고리즘

  •   3.4 예측 알고리즘

  • 4. 적용 및 검증

  •   4.1 모의예측 환경 설정

  •   4.2 BIS 도착예측정보 이력자료와의 비교 검증

  • 5. 결론 및 향후과제

1. 서 론

BIS (Bus Information System: 버스정보시스템, 이하 BIS)는 시내버스 운행과 관련된 각종 정보를 수집하고 이를 제공하는 시스템으로 서울시의 경우 2004년 427개 노선을 대상으로 시스템을 구축하였다. BIS는 GPS (Global Positioning System: 범지구적 위치결정 시스템, 이하 GPS)와 근거리 무선통신(정류장-차량단말기 통신)을 기반으로 실시간 버스운행정보를 수집, 가공 및 제공하고 있다. BIS의 주요 정보는 정류장별 버스도착시간 정보로 버스 이용자의 이용편의성, 접근성을 크게 향상시키는데 기여하고 있다. 버스도착시간 정보는 정류장 도착, 출발의 이벤트 발생 시각 정보형태로 수집되어 예측알고리즘을 통해 이용객에게 정보를 제공하고 있다.

현재 버스도착시간 예측알고리즘은 입력 자료에 따라 동일 구간을 통행한 최근 정보를 통해 예측하는 방법, 해당노선의 동시간대 과거이력자료를 통해 도착시간을 예측하는 방법으로 구분된다. 동일 구간을 통행한 최근 정보를 통해 예측하는 방법은 해당 구간의 소통상황을 반영하지만 예측 대상노선의 특성을 반영할 수 없다는 한계가 있다. 특히, 동 시간대 동일 구간을 통행한 정보의 양이 적을 경우 예측정보의 신뢰성을 보장할 수 없다. 반면 해당노선의 동시간대 과거이력자료를 통해 예측하는 방법은 노선 특성에 따른 예측 통행시간을 기대할 수 있다. 하지만 현재 소통상황이 과거 동시간대 소통상황과 동일하다는 전제와 가정을 내포하고 있어 비교적 소통상황의 변동성이 큰 첨두시 예측에 한계가 있는 실정이다. 2016년 기준 서울시 BIS는 알고리즘 고도화를 통해 해당노선의 동시간대 과거이력자료와 동일 구간을 통행한 최근정보를 융합한 예측 알고리즘을 탑재하여 운영 중이나 첨두시 일정수준의 예측오차를 극복하지 못하고 있다.

본 연구에서는 첨두시, 비첨두시 모두 일정수준 이상의 예측 신뢰성을 확보하기 위해 다음과 같은 기존 방법론의 한계점을 극복하고자 하였다. 첫째 동일 구간을 통행한 최근정보는 시간적, 공간적 범위에 따라 가용 정보의 질과 양이 크게 변한다. 둘째 동시간대 과거이력자료는 첨두시 변동성이 크고 예측대상 노선의 특성을 반영할 수 없다. 셋째 예측시점과 가장 유사한 과거이력자료는 동시간대 외의 시간대에 존재할 수 있으며, 동시간대 과거이력자료가 예측시점과 가장 유사하다고 단정할 수 없다. 전술한 한계를 극복하기 위해 예측알고리즘의 입력 자료로 과거이력자료만을 고려하였으며, 과거이력자료의 시간적 범위를 동시간대에 한정하지 않았다. 모든 시점의 자료를 대상으로 예측알고리즘을 수행하는 방법은 막대한 연산시간이 소요된다. 따라서 예측대상 시점의 통행패턴을 인식하고 가장 유사한 과거 시점의 통행패턴을 선택할 수 있는 패턴탐색 기술을 개발하였다. 패턴탐색 기술을 통해 여과된 이력자료의 적정성을 검증하기 위해 단순평균법을 적용한 예측알고리즘의 결과를 서울시 BIS 도착예측정보이력과 비교 검증하였다.

2. 선행 연구

2.1 버스도착시간 정보 관련 연구

Chien and Kuchipudi(2003)은 실시간 자료와 과거이력자료를 각각 이용하여 버스의 도착 예측시간을 오전첨두 6시 30분~9시 30분, 오후첨두 4시 40분~7시, 비첨두 시간으로 설정하여 결과를 제시하였다. 첨두시의 경우 과거이력자료를 사용해 예측한 결과의 신뢰성이 더 높았고 사고로 인한 갑작스런 혼잡의 경우 실시간 자료의 신뢰성이 더 높게 나타났다고 언급했다.

Shalaby and Farhan(2004)은 한 노선을 대상으로 승객의 승하차 카드정보, 차량위치정보 자료를 이용해 4가지 버스도착시간 예측 모형을 적용해 결과를 산출하고 각 방법의 결과를 비교 및 검증했다. 도착시간 예측 결과 동일시간대 과거이력자료를 단순 평균한 경우 최대 90 % 오차율을 보여 현재와 동일한 시간대 이력자료는 현재 소통상황을 대표하지 못한다고 시사했다.

Cheng et al.(2010)은 요일별, 시간별로 구분된 과거 이력자료를 통해 구간별 통행시간 자료를 구축하였고, 해당 자료를 이용해 KNN (K-Nearest Neighbor: K 근접 이웃, 이하 KNN) 모형을 통해 통행시간을 예측하는 모형을 구축했다. 총 19개의 지점별 RMSE (Root Mean Squared Error: 평균제곱근오차, 이하 RMSE)가 30~40초대로 양호한 수준의 예측결과를 도출했다고 언급했다.

Yu et al.(2013)은 요일별, 시간별로 구분된 과거이력자료를 통해 구간별 속도 분포의 패턴을 도출하고 해당 구간의 과거통행속도를 추출했다. 추출된 통행속도 값과 예측할 버스노선의 정류장간 구간길이를 이용해 통행시간을 산정하였으며 61개 정류장 평균절대값 오차가 21 %로 양호한 수준의 예측결과를 도출했다고 언급했다. 특히 정류장간 길이가 700 m 미만인 경우 29 %의 오차율을 보였고, 700 m 이상인 경우 15 %로 정류장간 길이가 상대적으로 길수록 버스 도착 예측시간과 실제 도착시간 간의 오차가 적다는 것을 시사했다.

Chang et al.(2010)은 버스의 출발점으로부터 목적지까지의 다중 구간 및 경로 여행시간을 예측하기 위해 이력자료 기반의 동적 예측모형을 개발하고 성능을 검증했다. 1 주일의 버스통행시간을 예측한 결과 동시간대별 과거 이력자료 평균기반 예측 결과 MAPE (Mean Absolute Percent Error: 평균절대퍼센트오차, 이하 MAPE)가 6 %수준을 보이는 반면 구축한 모형은 3 %수준으로 양호하게 나타났다고 언급했다.

Kim et al.(2009b)은 실시간 BIS 자료를 이용해 간선도로 버스도착시간예측 모형을 제시했다. 해당 모형은 BIS 자료를 이용해 버스정류장 체류시간, 교차로 체류시간, 순행구간 통행시간을 나누어 회귀식 모형을 구축했으며 구축된 모형은 95 %의 신뢰수준에서 검증을 실시한 결과 매우 유효하며 지수 평활화를 통해 시간대별로 적용할 모형을 4가지로 제시했다.

Kim et al.(2009a)은 실시간 BIS 자료를 이용해 기존 개별노선단위로 적용하고 있는 정류장간 통행시간의 산정의 문제점을 시사하고, 가중이동평균법을 적용해 노선 그룹단위 모형을 구축해 기존 방법론의 버스도착 예측시간과 비교하였다. 기존 개별노선단위 예측법을 적용한 결과 오후 첨두 기준 RMSE가 23~222.4초대의 분포를 보인 반면 노선그룹단위 모형에서는 23~116.7초대의 양호한 결과를 도출했다고 언급했다.

2.2 시사점

국내외로 버스 도착시간 예측의 오차율을 줄이기 위해 다양한 방법으로 접근하고 있다. Chien and Kuchipudi(2003), Shalaby and Farhan(2004), Chang et al.(2010)에 따르면, 해당 노선의 동시간대 이력자료 기반의 예측 신뢰성이 가장 낮음을 언급하였다. 이는 동시간대 소통상황이 유사하지 않음을 의미한다. 따라서 Kim et al.(2009a), Kim et al.(2009b)와 같이 다양한 예측 기법 및 방법론을 통해 이력자료를 활용하고 있는 실정이다. 또한 Yu et al.(2013)은 버스 정류장간 거리가 길수록 예측의 정확성은 증가함을 시사했다. 국내의 경우 대부분 정류장이 500 m 내외로 비교적 짧게 배치되어 있으며 교통상황의 변동성이 크고 정류장간 최소 교차로가 1개 이상씩 존재해 일정 수준 이상 오차를 극복하기에는 어려운 현실이다.

3. 방법론

3.1 분석을 위한 지표설정 및 알고리즘의 구성

기본적으로 서울시 BIS 정류소 출도착정보 자료는 각 정류장별 도착/출발시각 정보가 존재한다. 본 연구에서는 예측수행을 위한 통행시간(현재정류장 도착시각 – 이전정류장 도착시간) 지표와 패턴인식 기반의 필터링을 적용하기 위한 통행시간 증감추이(통행시간 간 증감 패턴)지표를 설정하였다.

알고리즘은 Fig. 1과 같이 크게 3가지로 구성 된다. 첫째 예측대상 시점과 유사한 패턴을 인식하여 추후 예측 알고리즘의 연산횟수를 대폭 감소시킬 수 있는 패턴인식(Pattern recognition) 알고리즘으로 통행시간 증감추이지표를 활용한다. 둘째 패턴인식 알고리즘을 통해 선정된 과거시점들의 통행시간 자료를 입력 자료로 사용하기 위한 가용자료를 선정하는 패턴선택(Pattern selection) 알고리즘으로 통행시간지표 기반 대상-과거 간 평균제곱근 오차의 분포의 특성을 사용한다. 셋째 산정된 입력 자료별 통행시간 패턴기반의 예측 알고리즘으로 일정 조건을 만족하는 이력자료의 다음 정류장 통행시간을 추출하여 예측 통행시간으로 산정한다.

http://static.apub.kr/journalsite/sites/ksce/2019-039-06/N0110390617/images/Figure_KSCE_39_06_17_F1.jpg
Fig. 1.

The Composition of Pattern Based Prediction Algorithm

3.2 패턴인식 알고리즘

시스템 내 구축된 이력자료의 입력과 동시에 통행시간과 증감추이지표를 동시에 산출하여 예측 대상 시점의 자료의 패턴과 유사여부를 판단한다. n개의 정류장 기준 각 정류장 간 통행시간은 n-1개가 존재하며, 해당 통행시간 증감추이는 n-2개가 산출된다. 통행시간 증감추이는 Eq. (1)과 같이 정의한다. 이력자료의 규모에 따라 증감추이 산정식을 보다 강하게 설정할 수 있다. 통행시간 증감추이는 구간의 소통상황과 시계열적 진화정도를 내포하게 된다. Fig. 2와 같이 예측 대상 시점까지 생성된 정류장간 통행시간(tk)과 바로 이전 정류장간 통행시간(tk-1)의 차이(Tk)가 0보다 작은 경우 –1, 0이상 1로 색인화 하여 행렬을 구축한다.

$$\begin{array}{l}T_k\left\{\begin{array}{lc}-1&if\;t_k-t_{k-1}<0\\1&if\;t_k-t_{k-1}\geq0\end{array}\right.\\T'_k\left\{\begin{array}{lc}-1&if\;t'_k-t'_{k-1}<0\\1&if\;t'_k-t'_{k-1}\geq0\end{array}\right.\\TT=\left\lceil T_k,\;T_{k-1},\;T_{k-2},\;T_{k-3},\;T_{k-}4,\;\cdots\right\rceil\\TT'=\left\lceil T'_k,\;T'_{k-1},\;T'_{k-2},\;T'_{k-3},\;T'_{k-4},\;\cdots\right\rceil\end{array}$$ (1)

Where, Tk : kth Travel time pattern (trend) in target data

T'k : kth Travel time pattern (trend) in historical data

tk : kth Travel time data (target)

t'k : kth Travel time data (past)

TT : Travel time pattern (target)

TT' : Travel time pattern (past)

http://static.apub.kr/journalsite/sites/ksce/2019-039-06/N0110390617/images/Figure_KSCE_39_06_17_F2.jpg
Fig. 2.

Concept of Travel Time Pattern Recognition Algorithm

3.3 패턴선택 알고리즘

동일한 패턴을 보이는 과거 이력자료와 예측대상 데이터 간의 RMSE를 지표로 경계오차(Boundary error)를 설정하였다. 경계오차는 동일한 패턴을 가진 이력데이터들의 RMSE의 분포를 활용하여 데이터에 내재된 특성에 따라 유동적으로 변화하도록 설계하였다. 경계오차가 설정되면 해당 오차 이하의 값을 기록한 이력자료가 추후 예측알고리즘의 입력 값으로 선정되며 해당 조건은 Eq. (2)와 같이 정의한다. i번째 이전 정류장 간 통행시간의 증감추이가 현재와 동일한지 여부(TTi-TTi'=0)에 따라 n번째 이전 까지 모두 동일한 이력자료를 선택한다. 선택된 이력자료 대상 i번째 이전 정류장 간 통행시간의 현재대비 오차(ti-ti') 기반의 RMSE를 산정하여 일정 수준 이하를 기록한 이력자료를 2차로 선택한다. 즉, Fig. 3(a)와 같이 1차적으로 패턴의 유사성을 기반으로 이력자료의 범위가 축소되고, Fig. 3(b)와 같이 경계오차 선정을 통해 2차적으로 패턴 내 내제되어 있는 데이터 특성에 따라 가용대상 이력자료의 범위가 최종적으로 선택된다.

http://static.apub.kr/journalsite/sites/ksce/2019-039-06/N0110390617/images/Figure_KSCE_39_06_17_F3.jpg
Fig. 3.

Concept of Travel Time Pattern Selection Algorithm

3.4 예측 알고리즘

Fig. 4와 같이 과거 이력자료 통행시간의 인식 및 선택 알고리즘을 통해 최종 선정된 자료는 단순평균, 가중평균, 클러스터링 기법 등 다양한 방법론 적용을 통한 예측이 가능하다. 클러스터링, 가중평균 기법은 단순평균 기법에 비해 예측 신뢰성이 높다는 장점이 있으나, 보다 많은 연산시간이 소요된다. 본 연구에서는 패턴 인식 및 선택 알고리즘의 최소 예측 신뢰성을 검증하기 위해 Eq. (3)과 같이 단순평균 기법을 적용하였다. 예측 결과는 동시간대 과거 이력자료, 동일 구간의 최근 정보를 융합한 예측 알고리즘을 탑재한 BIS 도착예측정보이력과 비교 검증 하였다.

$$T_p=\frac{\sum_{i=1}^nt_{(k+1)i}^p}n$$ (3)
http://static.apub.kr/journalsite/sites/ksce/2019-039-06/N0110390617/images/Figure_KSCE_39_06_17_F4.jpg
Fig. 4.

Concept of Prediction Algorithm

4. 적용 및 검증

4.1 모의예측 환경 설정

본 연구에서는 서울시 BIS 정류소 출도착정보 5개 노선(간선, 지선, 광역), 14일(2016년 9월 26일 ~ 10월 9일)의 자료를 사용했다. 패턴 인식 및 선택에 필요한 통행시간 패턴의 공간적 범위를 산정하기 위해 산정 구간(현재기준 n번째 전 정류장까지의 구간)에 따른 평균제곱근 오차가 최소가 되고 현실적으로 가용할 수 있는 구간의 범위를 설정했다. Fig. 5와 같이 통행시간 패턴의 공간적 범위가 커질수록 오차는 감소하는 것으로 나타났으나 범위가 커질수록 알고리즘의 연산속도는 감소하기 때문에 적정 범위로써 5개의 통행시간 패턴(6개 정류장 간 통행시간으로 산출)으로 설정하였다.

http://static.apub.kr/journalsite/sites/ksce/2019-039-06/N0110390617/images/Figure_KSCE_39_06_17_F5.jpg
Fig. 5.

Relationship between Travel Time Pattern Count and Errors

4.2 BIS 도착예측정보 이력자료와의 비교 검증

서울시 도착예측정보이력은 대상 버스별 도착정보를 정류장별로 생성한 시점과 예측 통행시간, 실제 통행시간을 기록한 데이터로서 본 연구의 예측알고리즘과 비교 검증을 수행하였다. 본 연구에서 구득한 자료 중 간선버스 260번 버스 오전 첨두(09시 경 배차), 비첨두(15시 경 배차), 오후 첨두(18시 경 배차)의 비교 검증 결과를 수록하였다. 예측 대상일은 2016년 10월 6일(금)로 설정하였으며, 이력자료의 범위는 9월 26일(월) ~ 10월 5일(목)을 대상으로 예측을 수행하였다. BIS 도착예측정보의 이력자료 범위는 본 연구에서 활용한 자료의 기간보다 큼에도 불구하고 1분 기준 예측의 정확도, 평균제곱근 오차, 결정계수 모두 본 연구의 예측 성능이 높게 나타났다. 정류장 간 통행시간의 변동성이 비교적 낮은 비첨두시의 경우 Fig. 6과 같이 평균제곱근 오차가 39.12초 → 36.58초로 크게 차이 나지 않는 반면 첨두시 Figs. 7 and 8과 같이 각각 56.56초 → 43.11초, 53.92초 → 36.58초로 상당한 개선효과를 보였다. 이는 동일 시점 이력자료 기반 예측을 수행하는 BIS 시스템의 한계로 판단되며, 교통상황이 급변하는 첨두시에는 일정수준 이상의 오차를 극복하지 못하는 것으로 나타났다.

http://static.apub.kr/journalsite/sites/ksce/2019-039-06/N0110390617/images/Figure_KSCE_39_06_17_F6.jpg
Fig. 6.

Off Peak Time (15:14:01) Prediction Result

http://static.apub.kr/journalsite/sites/ksce/2019-039-06/N0110390617/images/Figure_KSCE_39_06_17_F7.jpg
Fig. 7.

Morning Peak Time (09:03:44) Prediction Result

http://static.apub.kr/journalsite/sites/ksce/2019-039-06/N0110390617/images/Figure_KSCE_39_06_17_F8.jpg
Fig. 8.

Afternoon Peak Time (17:50:07) Prediction Result

5. 결론 및 향후과제

본 연구에서 제시한 알고리즘의 예측 성능을 비교 검증하기 위해 실제 운영중인 BIS 시스템의 버스도착예측정보 이력과 비교하였다. 비교 검증 결과 상대적으로 활용한 이력자료가 소량임에도 불구하고 본연구의 예측 신뢰성이 기존 BIS 시스템 대비 높은 것으로 분석되었다. 오전 및 오후 첨두시 모두 ±1분을 기준으로 한 예측치의 정확도가 3~10 % 향상되었으며, 평균제곱근오차 또한 13~20초대 감소한 40초대로 상당부분 개선된 것으로 나타났다. 비첨두시의 경우 ±1분을 기준으로 한 예측치의 정확도가 2~7 % 향상되었으며, 평균제곱근오차의 경우 3~6초대 감소한 35초대로 첨두시에 비해 개선의 정도가 낮은 것으로 나타났다. 기존 예측 알고리즘(동일시간대 이력자료 사용)은 교통상황의 변동성이 적은 비첨두시에 비해 변동성이 큰 첨두시의 예측성능이 크게 감소(비첨두시 평균제곱근오차: 약 40초, 첨두시 평균제곱근오차: 약 60초)하는 것으로 보인다. 반면, 본 연구의 예측 알고리즘은 비첨두시, 첨두시 모두 유사한 정도(비첨두시 평균제곱근오차: 약 35초, 첨두시 평균제곱근오차: 약 40초)의 예측성능을 보인다. 이는 현재와 동일한 과거 시간대를 제외한 타 시간대에도 현재 교통상황을 대표할 수 있는 자료가 존재함을 의미하며, 이는 첨두시 보다 두드러지게 나타났다.

본 연구에서 제시한 예측 알고리즘은 지선 및 간선노선의 경우 각 정류장 간 통행시간의 평균제곱근오차가 비첨두시 약 35초(기존: 40초), 첨두시 약 40초(기존: 60초)로 기존대비 약 10~20 %의 개선을 보였다. 특히 본 연구에서 사용한 BIS 이력자료가 14일치로 보다 많은 이력자료의 가용을 통해 보다 정교한 예측 결과를 도출할 것으로 판단된다. 하지만 사고, 공사 등으로 인해 지체가 생기는 경우, 첨두시 교통상황이 급변하는 시점(혼잡의 시작 및 종료 시점)의 예측이 불안정한 한계를 극복하기 위한 노력이 필요하다.

Acknowledgements

본 연구는 국토교통부 교통물류연구사업의 연구비지원(19TLRP- B148966-02)에 의해 수행되었습니다.

References

1 

Chang, H. H., Park, D. J., Lee, S. J., Lee, H. S. and Baek, S. (2010). "Dynamic multi-interval bus travel time prediction using bus transit data." Transportmetrica, Vol. 6, No. 1, pp. 19-38.

10.1080/18128600902929591
2 

Cheng, S., Liu, B. and Zhai, B. (2010). "Bus arrival time prediction model based on APC data." In Transportation of China (AFTC 2010) 6th Advanced Forum on IET, pp. 165-169.

10.1049/cp.2010.1123
3 

Chien, S. I. J. and Kuchipudi, C. M. (2003). "Dynamic travel time prediction with real-time and historic data." Journal of Transportation Engineering, Vol. 129, No. 6, pp. 608-616.

10.1061/(ASCE)0733-947X(2003)129:6(608)
4 

Kim, T. G., Ahn, H. C. and Kim, S. G. (2009a). "Predictive modeling of the bus arrival time on the arterial using real-time BIS data." J. Korean Soc. Civ. Eng., KSCE, Vol. 29, No. 1D, pp. 1-9 (in Korean).

5 

Kim, W. G., Roh, C. G., Heo, M. G. and Son, B. S. (2009b) "A development of bus arrival time estimation model." The Seoul Institute Seoul Studies, Vol. 10, No. 2, pp. 21-29 (in Korean).

6 

Shalaby, A. and Farhan, A. (2004). "Prediction model of bus arrival and departure times using AVL and APC data." Journal of Public Transportation, Vol. 7, No. 1, pp. 41-61.

10.5038/2375-0901.7.1.3
7 

Yu, H., Xiao, R., Du, Y. and He, Z. (2013). "A bus-arrival time prediction model based on historical traffic patterns." In 2013 International Conference on Computer Sciences and Applications, pp. 345-349.

10.1109/CSA.2013.87
페이지 상단으로 이동하기