(Hyungjoo* Kim)
김형주*{ label needed for aff[@id='aff-1'] }
(Kitae** Jang)
장기태**{ label needed for aff[@id='aff-2'] }†
-
*한국과학기술원 조천식 녹색교통대학원 박사과정
()
-
**한국과학기술원 조천식 녹색교통대학원 조교수
(**KAIST)
Key words (Korean)
실시간 교통정보, 통행시간 예측, 단거리 전용 통신, 인공신경망, 랜덤난수
Key words
Real-time traffic information, Travel time prediction, DSRC, Artificial neural network, Random number
-
1. 서 론
-
2. 관련이론 및 선행연구 고찰
-
2.1 인공신경망
-
2.2 통행시간 예측모형 고찰
-
2.3 국내·외 선행연구 고찰
-
2.4 선행연구와의 차별성
-
3. 연구방법론
-
3.1 실시간 통행시간 예측
-
3.2 통행시간 예측결과 검증
-
4. 방법론 적용 및 분석
-
4.1 분석구간 및 자료
-
4.2 실시간 통행시간 예측결과
-
4.3 통행시간 예측결과 검증결과
-
5. 결 론
-
5.1 결 론
-
5.2 향후 연구과제
1. 서 론
지능형 교통체계(Intelligent Transportation System, 이하 ITS)의 중요한 하위시스템인 첨단여행자교통정보시스템(Advanced
Traveller Information Systems, 이하 ATIS)은 우리나라에 ITS 기본계획이 수립된 이후 지금까지 활발한 연구가 진행되고
있다. ATIS 분야에 있어 통행시간 정보는 수집된 교통자료를 이용하여 통행(travel)과 관련된 교통조건을 예측하여 여행자에게 정보제공을 목적으로
한다. 실시간 교통정보 제공은 운전자들에게 최적의 경로선택을 유도하여 이용자 편의와 교통안전을 제공하기 위함이다.
현재 고속도로상의 교통정보는 대부분 루프검지기 및 단거리 전용 통신(Dedicated Short Range Communications, 이하 DSRC)을
이용하여 수집되고 있다. 루프검지기의 경우 차량검지에 있어 높은 정확도를 가지는 장점이 있지만, 검지기 오작동으로 인한 복구시 오랜 시간이 소요되는
단점이 있다. 또한 통행시간 산정시 하류부의 정체 및 사고로 인한 영향이 왜곡될 수 있어 통행시간 정보의 신뢰성을 보장할 수 없다. 반면, DSRC
자료를 이용한 구간검지의 경우 실제 통행시간을 산정하여 신뢰성 높은 교통정보를 제공한다.
현재까지 통행시간 예측과 관련된 다양한 연구들이 수행되었지만, 한국고속도로 특성에 맞는 예측방법론에 대한 실증연구는 부족한 실정이다. 또한 예측 통행시간에
대한 정확도 검증이 수행되지 못해 분석결과의 신뢰성을 보장하지 못하는 한계가 존재한다.
이에 본 연구에서는 실제 통행시간을 기반으로한 DSRC 자료를 바탕으로 한국고속도로에 적절한 예측방법론을 도출한다. 이를 위하여 한국도로공사에서 수집된
경부고속도로 안성JC~오산IC 구간의 24시간 DSRC 자료를 이용하며, 단주기 통행시간 예측 및 비선형(non-linear) 관계에서 높은 정확도를
보이는 인공신경망(Artificial Neural Network)을 적용한다. 이어서 예측 통행시간의 정확도 검증을 위하여 랜덤난수(random number)를
이용하여 비교・분석을 실시한다. 마지막으로 결론에서는 본 연구의 성과 및 한계, 그리고 향후 연구방향을 도출한다.
2. 관련이론 및 선행연구 고찰
2.1 인공신경망
최초의 신경회로망 개념은 1943년 미국의 Warren McCulloch와 수학자 Walter Pitts에 의해 고안되었다. 신경망은 컴퓨터가 사람의
학습능력을 수행하고자 개발되었으며, 수학적 알고리즘으로 구성되어 있다. 신경망은 뉴런에 속하는 유닛(unit)들과 유닛 사이의 연결강도(weight)로
구성되어 있으며, 계층의 수에 따라 단측 신경망과 다층 신경망으로 구분된다. 신경망 모형에서 뉴런의 주요 기능은 입력과 연결강도의 가중합(NET)을
구한 후 활성화 함수에 의해 출력을 내보내는 것이다. 활성화 함수(Activation function)은 단조 증가하는 함수이어야 하며, 일반적으로
단극성/양극성 함수, 선형/비선형 함수, 연속/이진 함수 등으로 분류한다.
신경망 모형에서 역전파 학습이란, 특정한 응용 목적에 적합하도록 뉴런간의 연결강도를 적응시키는 과정으로 현재 신경망 모형에서 가장 널리 이용되는 델타학습(Delta
learning)은 다층 신경망의 학습규칙으로 주로 사용된다. 이렇게 다층 신경망과 델타규칙을 결합한 형태를 역전파 알고리즘(Backpropagation
algorithm)이라 부르며, 연속 활성화 함수만을 사용한다. 델타학습은 학습신호로서 목표치와 실제 출력치의 차이값과 활성화 함수의 미분값이 사용되는
점이 특징이다.
2.2 통행시간 예측모형 고찰
통행시간 예측 모형은 크게 통계적 방법과 시뮬레이션 방법으로 나눌 수 있다. 통계적 방법은 이력자료 및 실시간 자료를 이용하여 예측 통행시간을 도출한다.
반면에 시뮬레이션 모형은 교통상황 및 정체로 인한 충격파 속도에 기반하여 통행시간 예측을 수행한다. 통계적 방법의 경우 회귀분석 모형, 시계열 모형,
인공신경망, 칼만필터 등이 사용된다. 회귀분석 모형은 일반적(Stationary) 상황의 단기예측에는 우수한 예측력을 보이지만, 유고 및 정체로 인한
교통현상에서는 낮은 정확도를 가진다. 시계열 모형은 속도, 교통량, 점유율 등의 시계열 정보를 사용하는 것으로 ARIMA 모형이 대표적으로 사용되고
있으며, 계절적 변동에 우수한 예측력을 가진다. 하지만 사고 및 정체로 인한 교통현상에서는 낮은 신뢰성을 가지는 단점이 있다. 인공신경망 모형은 비선형
통계적 기법으로 향상된 지도학습 방법을 통해 최적의 결과를 도출한다. 또한 통행시간 예측시 사고 및 정체현상에서도 우수한 예측력을 가진다. 칼만필터는
단일시간대 우수한 예측력을 보이고 있으며, 수행속도가 빠른 장점이 있다. 하지만 인공신경망에 비해 예측력이 낮으며, 비선형 시스템인 경우 예측에 어려움이
존재한다.
시뮬레이션 모형은 거시적 모형(macroscopic models), 중간적 모형(mesoscopic models), 미시적(microscopic models)
등으로 나눌 수 있다. 거시적 모형은 교통량, 밀도, 그리고 평균속도 등의 교통류 특성에 기반하여 분석을 실시하는 것으로 LWR 모형 및 METANET
모형이 대표적으로 사용되고 있다. 중간적 모형은 교통모수의 평균값과 개별차량 행태를 함께 고려하는 것으로 거시적 모형과 미시적 모형의 중간적 성격을
가진다. 중간적 모형은 개별차량을 시뮬레이션 할 수 있지만, 차량의 움직임 및 반응은 링크단위의 집계값이 적용된다. 대표적으로 MIT에서 개발된 DYNAMIT
모형이 널리 사용되고 있다. 미시적 모형은 개별차량의 동적인 움직임을 모두 포함하는 장점을 가진다. 차량특성(차량길이, 최대 가속능력 등), 차량
움직임 특성(속도, 시간, 거리 등), 운전자 행태(차량 추종, 차선변경 등)를 모두 포함하며, 대표적으로 CA(Cellular Automata)모형이
사용된다.
이에 본 연구에서는 통계적 방법의 일환인 인공신경망을 이용한 통행시간 예측에 대한 연구를 실시한다. 인공신경망의 경우 통행시간 예측시 유고 및 정체현상에서도
우수한 예측력을 가지며, 단주기 통행시간 예측에 높은 정확도를 보이고 있어 한국고속도로 특성에 적합하다고 판단된다.
2.3 국내·외 선행연구 고찰
인공신경망은 비선형 통계적 모형으로 연속류 및 단속류 구간 통행시간 예측에 널리 적용된다. Kang and NamKoong (2002) 연구에서는
고속도로 통행료수납시스템(Toll Collection System, 이하 TCS)에서 수집되는 자료의 속성과 시계열적 패턴을 규명하였으며, 통행시간
예측에 모듈라 신경망모형(Modular Neural Network Model)을 제안하였다. 모듈라 신경망모형은 다층 퍼셉트론 신경망으로 대규모 입력자료를
통한 통행시간 예측시 학습시간이 길어지는 단점을 보안하기 위해 비슷한 입력자료를 분류하여 학습을 진행시키는 구조이다. 분석결과 단거리와 장거리 모두
예측가능한 시간적 범위를 도출하였으며, 1개의 신경망으로 학습한 최대/최소의 예측범위내에서 동일한 수준의 예측력을 보였다.
Kim and Kim (2001) 연구에서는 단속류 도로에서 통행시간 정보제공을 위해 퍼지이론과 인공신경망의 합성모형인 FALEM (Fuzzy Adaptive
Learning Estimator for travel time from Multi- information sources)을 적용하였다. 지점 및 구간
검지체계에서 수집된 검지자료를 활용하였으며, 타 모형과 비교를 통한 유용성 검증을 실시하였다. 하지만 개발모형의 최소 표본 임의성문제와 상이한 통행패턴의
점유율 처리 등에 대한 한계점이 존재한다.
Lee (2009) 연구에서는 클러스터링 방법과 인공신경망 모형을 결합하여 통행시간 예측 모형을 개발하였다. 예측모형의 종속변수는 버스의 실시간 통행시간이며,
VDS, GPS, 그리고 사고자료 등이 독립변수로 활용되었다. 인공신경망을 이용한 각 링크의 예측 통행시간과 실제통행시간의 MAPE 분석결과 약 5%의
오차율을 보였다.
Innamaa (2005) 연구에서는 도시부 고속도로의 통행시간 이력자료를 바탕으로 feedforward multilayer perceptron (MLP)
인공신경망을 적용하여 통행시간 예측을 실시하였다. 각 링크의 예측 통행시간과 실제통행시간의 MAPE 분석결과 약 6%의 오차율을 보였다. 하지만 제안된
모형의 경우 실시간 자료와 연계시 이력자료의 오류치 제거에 어려움이 존재하며, 인공신경망의 학습과정에서 교통 혼잡상황을 반영하지 못하는 한계를 가진다.
Jeong and Rilett (2004) 연구에서는 Automatic Vehicle Location (AVL) 자료 및 인공신경망 모형을 이용하여
버스의 도착시간을 예측하였다. 버스 통행시간에는 승・하차 시간 및 배차간격이 고려되었다. 인공신경망을 이용한 MAPE 분석결과 약 4~8%의 오차율을
보였으며, Historical data based models 및 회귀모형에 비해 높은 정확도를 보였다.
Cherrett et al. (1996) 연구에서는 feed-forward ANN 모형을 이용하여 링크의 통행시간 예측을 실시하였다. 기계론적(mechanistic)
방법론의 경우 정체상황에서 통행시간 예측에 어려움이 있었으며, 반대로 인공신경망의 경우 유고 및 정체상황에서도 높은 예측력을 보였다.
Ohba et al. (1997) 연구에서는 통행시간 예측에 있어 혼합 인공신경망 모형을 제안하였다. 혼합 인공신경망 모형은 장기간 발생되는 유고
및 정체상황에 적합한 예측모형으로 실제고속도로 자료를 통한 분석결과 높은 예측력을 보였다.
2.4 선행연구와의 차별성
선행연구검토에서 확인할 수 있듯이 한국고속도로 특성에 맞는 예측방법에 대한 실증연구는 부족한 실정이다. 외국의 경우 prove vehicles 자료를
취득할 수 있는 구간이 제한적이며, sample 수가 적어 실제 분석에 활용하기에는 한계가 있다. 특히 미국의 Mobile Millenium Project
(2008)에서 알 수 있듯이 실제 통행시간 산정의 어려움을 극복하기 위해 GPS를 장착한 스마트폰을 이용하여 분석구간에 대한 자료를 수집하였다.
반대로 한국고속도로의 경우 Hi-pass 도입 후 probe vehicles이 증가되어 신뢰성 있는 실제 통행시간 결과도출이 가능하여 교통류 분석
및 운영에 활용이 가능하다. 이에 본 연구에서는 실제 통행시간을 기반으로한 DSRC 자료를 바탕으로 인공신경망을 이용한 예측방법론을 도출한다. 이어서
랜덤난수를 이용한 통행시간 예측력 검증을 통해 기존 연구의 한계를 완화・개선하고자 한다.
3. 연구방법론
3.1 실시간 통행시간 예측
본 연구에 적용된 방법론은 DSRC 패턴DB를 이용한 인공신경망 기법으로 Fig. 1과 같다. 통행시간 패턴DB 및 인공신경망 예측과정 등으로 크게
나눌 수 있으며, 세부 과정은 다음과 같다.
|
Fig. 1. Structure of Methodology
|
[단계1]DSRC 자료의 5분 집계 패턴정보를 구축하며, 결측값 및 오류치 제거
[단계2] 이력자료의 경우, 5 step 시간간격의 DSRC 시계열 자료 평활화 작업(smoothing process)을 실시
(1)
[단계3] 실시간 자료와 이력자료의 매칭에는 유클리드 거리(Euclidean distance)를 사용
(2)
|
|
(a) Historical data
|
(b) Actual data
|
Fig. 2. Pattern Matching by Euclidean Distance
|
[단계4] 이력자료의 목표값(target)에 따른 인공신경망 학습 및 가중치 산정
|
Fig. 3. Process of ANN Learning and Weight
|
① 가중치 초기화 및 학습횟수 설정
② 학습율() 및 최대오차() 설정
③ 은닉층 계산
④ 출력층 계산
⑤ 출력층의 오차신호 계산
⑥ 은닉층의 오차신호 계산
⑦ 가중치 업데이트
⑧ 허용오차 범위일 경우 종료, 허용오차 벗어날 경우 ③으로 이동
[단계5] 최종 예측치의 오차에 영향을 주는 입력층과 은닉층의 수는 시행착오(trial and error) 방법을 통해 선정
[단계6] 실시간 자료에 기반하여 도출된 가중치에 의해 통행시간 예측 결과가 도출
|
Fig. 4. Process of Travel Time Prediction
|
3.2 통행시간 예측결과 검증
인공신경망을 이용한 통행시간 예측결과의 검증을 위해서 랜덤난수를 이용해 통행시간 예측결과의 정확도를 검증한다. 이를 위해서 이력자료의 평균, 표준편차,
최소값, 최대값 등의 통계치를 고려하여 랜덤난수를 발생시킨다. 또한 통행시간 예측결과의 패턴DB 의존도를 비교하기 위해서 실시간 자료에 랜덤패턴을
포함하여 비교・분석을 실시한다.
4. 방법론 적용 및 분석
4.1 분석구간 및 자료
본 연구에서는 한국고속도로에서 제공하는 경부고속도로 DSRC 자료를 이용한다. 실시간 자료는 5월 6일(금)이며, 이력자료는 실시간 자료를 제외한
2011년 3월 1일~5월 31일 자료이다. 분석구간은 Fig. 5와 같이 안성JC~오산IC 구간의 종점방향(부산 시점)을 선정하였다.
4.2 실시간 통행시간 예측결과
본 연구에서는 인공신경망 기법의 예측오차에 영향을 주는 입력층과 은닉층의 수는 시행착오(trial and error) 방법을 이용하였다. 분석결과
Fig. 6과 같이 입력층 3개, 은닉층 5개에서 오차율이 가장 낮았으며, 입력층 및 은닉층의 수가 늘어날수록 오차율이 증가하는 경향을 보였다.
이어서 인공신경망을 이용한 통행시간 예측을 위해 예측주기를 따른 분석을 실시하였다. 먼저 Fig. 7과 같이 실시간 DSRC 기반 통행시간 예측을
실시하였다. 분석결과 실측 통행시간과의 오차율이 3.95%로 우수한 예측력을 보였다. 또한 산점도 분석결과 R2이 0.96으로 높은 상관관계를 보였다.
|
Fig. 6. Optimum Input and Hidden Layer
|
|
|
Fig. 7. Prediction of Actual Travel Time
|
|
|
Fig. 8. Actual Predicted Result
|
|
|
Fig. 9. Actual Predicted Scatter Diagram
|
4.3 통행시간 예측결과 검증결과
인공신경망을 이용한 통행시간 예측결과의 검증을 위해서 랜덤난수를 이용한 통행시간 예측결과와 정확도를 비교하였다. 이를 위해서 랜덤난수 발생시 이력자료의
평균, 표준편차, 최소값, 최대값 등의 통계치를 고려하였으며, Table 1과 같다. 또한 통행시간 예측결과의 패턴DB 의존도를 비교하기 위해서 실시간
자료에 랜덤패턴을 포함하여 비교・분석을 실시하였다.
인공신경망의 예측오차에 영향을 주는 입력층과 은닉층의 수는 시행착오 과정을 통해 Fig. 10과 같이 입력층 9개, 은닉층 9개로 도출되었다. 인공신경망의
통행시간 예측결과에 대한 패턴의존도는 Figs. 11~14의 결과와 같다. 통행시간 이력자료의 패턴에 랜덤난수를 포함한 경우 실측 통행시간과의 오차율이
0.0046%로 높은 정확도를 보였다. 또한 산점도 분석결과 R2이 1로 높은 상관관계를 보였다.
Table 1. Statistics of DSRC
|
Classification
|
Historical data
|
Actual data
|
Average
|
7.97
|
8.07
|
Standard deviation
|
3.46
|
3.31
|
Min.
|
5.62
|
5.29
|
Max.
|
35.89
|
20.76
|
|
|
Fig. 10. Optimum Input and Hidden Layer (Random Number)
|
|
|
Fig. 11. Actual Predicted Result (Perfect Matching)
|
|
Fig. 12. Actual Predicted Scatter Diagram (Perfect Matching)
|
|
|
Fig. 13. Actual Predicted Result (Random Number)
|
|
|
Fig. 14. Actual Predicted Scatter Diagram (Random Number)
|
반대로 랜덤난수가 이력자료의 패턴에 포함되지 않은 경우를 살펴보면, 통행시간 예측결과 오차율이 18.98%로 높게 도출되었다. 이는 인공신경망을 이용한
통행시간 예측시 패턴DB가 예측의 정확도에 주요하게 작용한 결과로 판단된다. 다시말해, 통행시간 이력자료의 패턴에 랜덤난수가 포함되지 못해 부정확한
결과를 도출하였다. 또한 산점도 분석결과 R2이 0.51로 낮은 상관관계를 보였다.
5. 결 론
5.1 결 론
본 연구에서는 실제 통행시간을 기반으로한 DSRC 자료를 바탕으로 한국고속도로에 적절한 예측방법론을 도출하였다. 경부고속도로 안성JC~오산IC 구간의
24시간 DSRC 자료를 이용하며 단주기 통행시간 예측 및 비선형 관계에서 높은 정확도를 보이는 인공신경망 기법을 적용하였다. 또한 랜덤난수를 이용한
통행시간 예측결과의 정확도 검증을 통해 유용성 검증을 실시하였다. 실시간 DSRC 기반 통행시간 예측결과 오차율이 3.95%로 우수한 예측력을 보였다.
이는 패턴기반의 인공신경망 예측시 이력자료의 전처리 과정과 최적의 입력층 및 은닉층의 선정으로 인한 결과로 판단된다. 통행시간 예측결과의 검증을 위해서
랜덤난수를 발생하여 비교・분석을 실시하였다. 분석결과 실측치와의 오차율이 18.98%로 높게 도출되었으며, 이는 인공신경망을 이용한 통행시간 예측시
패턴DB가 예측의 정확도에 주요하게 작용한 결과로 판단된다.
선행연구검토에서 확인할 수 있듯이 한국고속도로 특성에 맞는 예측방법 및 시간간격에 대한실증연구는 부족한 실정이다. 하지만 본 연구의 실증분석 결과를
이용하여 한국고속도로 특성에 맞는 예측단위 및 정보제공 주기에 대한 선정이 가능할 것으로 판단된다. 또한 실제 교통자료를 이용한 통행시간 예측에 있어
임의성을 배제할 수 있어 안정적인 연구결과라 평가할 수 있을 것이다.
5.2 향후 연구과제
본 연구의 한계점으로는 단주기 통행시간 예측 및 비선형 관계에서 높은 정확도를 보이는 인공신경망 기법을 활용하였다. 통계적 모형의 경우 통행시간 예측의
정확도는 우수할 수 있지만, 예측결과에 대한 인과관계 분석에 있어 시뮬레이션 모형에 비해 어려움이 있다. 이에 향후 연구과제로 시뮬레이션 모형을 이용한
예측결과를 바탕으로 통계적 모형과의 정확도 및 인과관계 분석이 필요하다.