(1.Research Center of Tibet Information Technology,Tibet University,2.College of Engineering,Tibet University,Lhasa 850000,China)
traffic engineering; bus operation; arrival time; chaos characteristics; Lyapunov exponent
DOI: 10.6043/j.issn.0438-0479.201710001
备注
为分析公交到站数据的混沌特征及可预测性,选用运行在非公交专用道上连续6日的单线公交到站实测数据,利用能够应用于工程实践的混沌判别手段和预测方法对数据进行分析.结果表明:公交单日到站数据均具有混沌特性,且在工作日和休息日均具有该特性,同时公交多日到站数据同样具有一定的混沌特性证实了混沌特征在公交到站数据中的存在.可见基于混沌理论的预测方法能够对公交到站延误和站点停靠时间的多日数据进行有效预测.
To analyze chaotic characteristics and the predictability of bus arriving data at a single station,we choose measured data of six consecutive days and use the chaotic discriminant analysis and forecasting method that can be applied in engineering practice.Results show that the single day's data of these vehicles exhibit chaotic characteristics.Furthermore,data on both weekdays and weekends as well as on multi-days all exhibit certain chaotic behaviors.The prediction method based on chaos theory can effectively predict the multi-day data of bus arriving delay and dwell times.These results confirm the existence of chaotic characteristics in the bus arrival data,and the chaos theory can be used to predict bus arrival data with better results.
引言
公共交通的运行与社会福利关系紧密,尤其是公交都市.公交准点能够吸引更多的出行者选择公共出行工具,同时对乘客的吸引力也是公交企业收益的保障[1].静态的发车计划表适应于以往路网流量较小时的公交需求,随着城市汽车保有量和城市人口的不断增长,不稳定因素的增多导致公交运营不准点,影响着乘客的乘车感知[2-3].因此,有必要根据运行环境调整公交发车间隔及其运营速度,以稳定公交系统运行状态[4].到站时间作为公交运营调整与乘客出行诱导的重要参考[5],因受到交通流混沌特性[6]及其他诸多因素的影响,其预测工作较为困难,所采用的方法也趋于复杂,尤其对于运营在非公交专用道上的公交.
已有研究中,公交到站时间被划分为多种形式.如:胡华等[7]提出的站点停靠时间、区段全程运行时间和区段部分运行时间; 季彦婕等[5]提出的路段运行时间和站点停靠时间.同时,在公交到站时间预测方面,也呈现出输入参数与预测模型的多样性.如:马书红等[8]提出的公交GPS历史数据和即时数据,及模糊隶属度预测模型; 于滨等[4]提出的时间段、天气和路段,及支持向量机模型和Kalman滤波方法; 季彦婕等[5]提出的工作日和周末的公交到站数据,及粒子群小波神经网络; 胡继华等[9]提出的公交GPS数据,及改进的马尔科夫链模型; 李大铭等[10]提出的公交GPS和电子收费数据等实时信息,及模糊神经网络; 杨敏等[11]提出的停站时间和其相关数据,及差分自回归移动平均模型和支持向量机; 王旭等[12]提出的上下车人数、车内拥挤度和车门数,及回归分析方法; 王建等[13]提出的上下车人数和车内拥挤度,及贝叶斯网络组合模型; Lin等[14]提出的公交调度时间表,及历史平均法; Meng等[15]提出的公交、乘客、社会车辆,及概率预测模型.
以上研究方法在预测结果上较为理想,但计算过程的复杂度和实际应用效果在实际应用中难以得到验证[7-15].而混沌理论作为分析非线性序列的有力工具[6],已运用于诸多领域,并有着可观效果.同时,未见相关文献阐述混沌理论在公交到站预测中的应用.为此,本文就该理论在公交到站数据中的应用展开分析,拓宽公交到站数据的预测渠道,验证混沌理论在公交到站预测中的适用性.
1 混沌理论
混沌理论旨在揭示随机系统中可能蕴含的简单规律及确定性系统中所存在的随机现象,是一种逐步丰富且较为新兴的工具和手段,可用于系统混沌状态的识别、预测及控制等.其输出的序列介于明显的规律序列和完全随机序列之间.本研究对该理论的应用集中在研究分析对象的混沌特性以及可预测性.
1.1 混沌理论的最大Lyapunov指数混沌特性的判别常基于最大Lyapunov指数,它沿某一方向的取值体现着相空间中相邻轨道间平均收敛或发散的快慢程度[16],指数为正预示着系统具有混沌特征,指数为0值说明系统中有周期现象,指数为负说明系统内部存在不动点(以不动点为初始点,当时间趋于无穷,系统轨迹点的极限仍是其本身[17])或数据输出完全无序.本研究基于C-C法[18]、重构相空间及小数据量法[16]等计算最大Lyapunov指数.
直接分析系统中大量数据的规律十分困难,但可通过时间序列重构将繁琐的数据转变为低阶形式,进而寻找其演变规律是混沌理论重构相空间的基本思路和混沌时间序列分析的基础,即寻找长度为n的观测数据固定时间延迟(τ),进而重构“等价”的n-(m-1)τ行m列状态空间.此时,第i行数据,即点X(i)为
X(i)=[xi,xi+τ,xi+2τ,…,xi+(m-1)τ],(1)
其中,n-(m-1)τ为相空间中点的个数,m为相空间的嵌入维.常基于C-C法[18-20]求取m和τ及嵌入窗口.
在得到重构相空间后,可采用定义法、wolf法、正交法及小数据量法等求取最大Lyapunov指数.张海龙等[18]在对比多种计算方法的优缺点后认为:实际应用中所获取的数据包含较多的噪声且数据量有限,应优先考虑小数据量法计算Lyapunov指数.因此,本研究采用小数据量法求取最大Lyapunov指数:
1)根据欧氏距离寻找所构建相空间中每个数据点X(j)的最近邻点X((^overj)),并根据数据的平均周期P限制短暂分离,即
dj(0)=min‖X(j)-X((^overj))‖,|j-(^overj)|>P,(2)
其中,dj(0)是第j个点X(j)到其最近邻点X((^overj))的初始距离,P值以功率加权[21]计算得到.
2)对相空间中每一个点计算其邻点的j个离散时间步长后的欧氏距离dj(i),即
dj(i)=min‖X(j+i)-X((^overj)+i)‖,i=1,2,…,min[n-(m-1)τ-j,n-(m-1)τ-(^overj)].(3)
3)对每个xi所有的距离数据筛选出非零数据求其自然对数的均值y(i),即
y(i)=1/(qΔt)∑qi=1ln dj(i),dj(i)>0,(4)
其中,q是非零dj(i)的个数.
4)根据最小二乘法求取均值序列稳定区间的斜率[16],即为由小数据量法得到的最大Lyapunov指数λL.
1.2 基于混沌理论的数据预测由于Lyapunov指数表征着相空间中相体积收缩和膨胀的几何特性,因此可用于预测系统的演化趋势[22-23].其核心思想在于从历史数据中寻找相似点,根据相似点的演化规律、最大Lyapunov指数的物理意义及范数的计算来获取一维或多维序列的预测值.本研究对单个数据的预测过程阐述如下:
令d为中心点X(i)与其最近邻点X((^overi))的欧氏距离,X(i+1)与X((^overi)+1)分别为X(i)与X((^overi))的演化值,则根据相似点的演化规律与λL的物理意义,有:
‖X(i+1)-X((^overi)+1)‖=‖X(i)-X((^overi))‖eλL=deλL.(5)
其中,点X(i+1)中只有一个分量(记为X(i+1)(m))是未知的,其他均为已知值,且分量与所需预测值等价.则可由式(6)得到待预测量,并按照所设定的约束(本研究取和值)保留预测值,即
X(i+1)(m)=X((^overi)+1)(m)±
(∑m-1j=1(X(i+1)(i)-X((^overi)+1)(i))2-(deλL)2)1/2.(6)
1.3 混沌理论的应用在数据对象方面,由于混沌特性分析常基于一维或多维时间序列数据,时间序列数据常由一定时间尺度下对应的观测值组成; 而本研究所获取的公交数据以观测序列为轴线,以时间特征数据为观测值.因此,本研究将公交到站次数作为观测轴线,相应的到站数据作为序列数据用于分析.
在混沌特征的判别与混沌数据的预测方面,本研究首先针对公交到站数据采用C-C法[18]得到重构相空间所需参数并重构相空间; 进一步基于小数据量法求取最大Lyapunov指数,判别所输入的数据是否具有混沌特性.在筛选得到具有混沌特性的数据后,将该数据作为基于最大Lyapunov指数预测方法的输入,输出得到预测数据.同时,留取部分原始数据来验证基于最大Lyapunov指数的到站数据预测精度与预测的可行性.
2 到站数据的混沌特性分析
2.1 数据描述本文中数据为2015年9月21—26日(21—25日为工作日,26日为休息日))某市运行在普通车道上单条常规公交线路中段单一站点的连续6 d的公交数据.该线路在工作日期间的平峰时和高峰时分别以10和8 min为发车间隔,在周末则采用9 min为发车间隔,数据的采集依托GPS车载设备及GPRS无线传输技术.用于分析的数据为经预处理后的公交站点停靠时间、公交到站间隔、到站延误及其绝对值的数据.其中,公交到站间隔为公交依次到站的时间间隔; 到站延误为按照公交发车时间表得到的公交到站时间点和实际到站时间点的差值; 由于数据采集设备在站点50 m范围内对公交到站和驶离时间点进行记录,故本文中公交站点停靠时间是指公交在驶入和使出站点50 m范围内这一进程中所用的时间.数据总量为534条.其中,为将6 d的分散数据串联为一维序列,将5条间隙数据选为理想条件下应会出现的数据,如0 s的到站延误和600 s的到站间隔数据.所收集到公交到站数据的统计量如表1所示,数据的波动曲线如图1所示.可以看出,数据整体上并不存在明显的周期,所观测到的数据可能是无序的随机数据.同时,结合均方差的大小可知,到站延误、到站延误绝对值以及到站间隔的波动相对较大,站点停靠时间波动相对较小.
2.2 公交到站数据的混沌特性为判别公交到站数据的混沌特性,将数据序列分割为单日数据和多日数据(2,3和6 d)分别分析,进而将数据分别进行快速傅里叶变换(fast Fourier transformation,FFT)获取各数据序列的平均周期,并对功率加权[21].然后,采用C-C法[18]得到嵌入维数和时间延迟并重构相空间.最后,采用小数据量法计算最大Lyapunov指数.得到的各指标最大Lyapunov指数如表2所示.结果表明:本研究方法能够判别数据的混沌信息,由最大Lyapunov指数的正负性可见,单日的公交到站延误、站点停靠时间和到站间隔时间均是混沌数据,而公交到站延误绝对值数据仅有1 d为非混沌数据.因此,可认为对混沌数据取绝对值降低了数据的混沌特性,即混沌数据由混沌序列转变为内部具有
不动点的序列或完全随机的序列[16-17].
对于多日数据的计算结果,表2显示公交到站延误方面,全6 d数据的最大Lyapunov指数大于0,即公交到站延误数据序列在整体上是混沌的.同时,该全6 d数据内部存在着有收敛或者无序的数据区间,如24—25日和24—26日的数据序列的最大Lyapunov指数小于0.在对公交到站延误数据取绝对值之后发现,原先多个混沌区间变为具有非混沌特性的数据,全6 d的最大Lyapunov指数(-0.000 1)很小,即该数据在一定程度上趋于周期数据或混沌数据.公交到站间隔方面,本研究数据整体上是非混沌的.但连续3 d数据却均具有混沌特性,连续2 d的数据中也存在着混沌的数据区间.车辆站点停靠方面,全6 d数据在整体上是混沌的.但其内部有可能存在不动点的数据区间(例如,21—23日和22—24日),但随着数据量的增大,其数据特性又趋于混沌.
具有足够数据量的混沌数据具备预测的可能性[22],非混沌数据区间并不能采用混沌理论进行数据预测.非混沌数据序列区间的叠加可能会使得数据具有混沌特性.同时,混沌数据序列区间的叠加同样有可能导致其混沌特性的丢失.
3 到站混沌数据的可预测性
对于时间数据序列的混沌特性识别,其数据量在100左右是足够的,进行混沌预测则需要400左右的数据量[22].由于本文中单日数据均不足100条,故采用全6 d数据为例进行预测分析.同时,因为最大Lyapunov指数在一定程度上代表了系统的整体发散程度,故可将其倒数作为可预测尺度[22-23].本文中全6 d数据中的公交到站延误时间绝对值序列及公交到站间隔时间序列不具有混沌特性,故仅将公交到站延误时间及车辆站点停靠时间这两组序列作为预测对象进行分析.此外,由于预测步长越大,则所得到的预测数据偏差越大,因此考虑到城市居民公交出行需要,将预测步长设置为15,即根据前519条到站数据,预测公交正常运转情形下短时的15次到站情况,并与实际到站数据进行对比.按照第1节的预测方法,基于配备有酷睿i5处理器、4 GB运行内存和Windows10专业版系统的笔记本电脑,采用Matlab2012平台进行仿真预测,并进一步得到了BP神经网络模型[24]与GM(1,1)模型[25]的预测结果,得到的预测曲线如图2和3所示.
图2和3表明,混沌理论预测结果在曲线走势上与实测数据较为一致,BP神经网络模型的预测结果存在较大的数据波动,而GM(1,1)模型预测结果较为平稳.所预测的到站延误是实际到站时间点与计划到站时间点的差值,其与公交站点停靠时间均很容易受到交通环境的影响,表1和图1均显示了两者数据的波动性和不稳定性,而基于混沌理论的预测方法能够较为准确的预测到站延误的走势,这也与数据的混沌特征相符.同时,由于站点停靠时间同样具有混沌特性,其预测效果也较为理想.
4 预测结果分析
在实际过程中,公交到站延误较大程度受到交通环境的影响,尤其是站间车流量的影响.公交站点停靠时间受上下车人流量显著影响,也受到公交站点周边交通量的影响.同时,由于研究对象是常规公交,两者的混沌特征可能较高程度受到车流量及乘车人流量的混沌特征的影响.已有研究表明车流量本身具有一定的混沌特性[6].综合可知,分析所得公交运营数据的混沌特征与实际相符,同时图2与3也说明了混沌数据的预测具有可行性.
为了进一步分析基于最大Lyapunov指数的预测效果,用式(7)计算公交到站延误时间和公交站点停靠时间预测数据的均方误差(mean square error,MSE)和平均相对百分比误差(mean absolute prcentage error,MAPE)来分析预测的精确度[11],两者的数值越小代表精确度越高.
{ MSE=1/n∑ni=1|yi-yi'|2,
MAPE=∑ni=1(|yi-yi'|)/(yi)×(100)/n,(7)
其中:yi为实际值; yi'为预测值; n为预测的数据量,即15.
表3显示了基于MSE和MAPE的混沌理论预测效果评价,以及结合BP神经网络模型、GM(1,1)模型以及前人研究成果[5,7,11]所进行的对比.其中,采用BP神经网络模型和GM(1,1)模型对上文相同数据进行预测.从本研究预测结果评价指标来看,基于混沌理论的预测精度较为理想.对比发现,混沌理论在公交到站延误(即到站时间)上的预测较为理想,且明显优于BP神经网络模型和GM(1,1)模型.在公交站点停靠时间的预测上,其预测精度及预测数据量低于前人研究[11],但文献[11]中所分析的对象为快速公交(bus rapid transit,BRT)数据,这是由于BRT具有专用道,其运营过程受到较小的外界因素影响,这与本研究所分析的常规公交存在明显差异,但预测效果同样显著优于BP神经网络模型和GM(1,1)模型.
在计算过程上,混沌理论、GM(1,1)模型、BP神经网络模型、支持向量机、回归分析以及贝叶斯网络等均涉及参数的求取,再由输入数据和参数得到预测数据所需的仿真时间.本文中,基于所采用平台和混沌理论的预测方法,在公交到站延误时间的计算及公交站点停靠时间的计算中所消耗的仿真时间分别为0.917 s与0.924 s,能够满足实际应用的需求.基于此,可认为混沌理论在分析公交运营所输出非线性公交到站时间序列中具有较高的适用性.
5 结 论
依据混沌理论对实测的非公交专用道上公交到站数据进行数据特性分析,讨论了公交到站数据的混沌特征、可预测性及预测精度.分析过程与结果可总结如下:
1)采用混沌理论分析公交运营数据具有较高可行性.该理论能够通过构造相空间将繁琐数据降阶以简化分析过程,同时也考虑了数据的整体特征.本研究基于该理论判别得到了公交到站时间数据的混沌特性,并将混沌数据用于预测分析,得到较好的预测精度和较少的仿真时间消耗,丰富了公交运营预测分析的理论实践.
2)受到运行环境的影响,本文中公交单日单点到站数据不仅在工作日上具有一定的混沌特性,而且在休息日同样具有一定的混沌特性.将到站延误数据绝对值化,部分区间的混沌特性被削弱,甚至有存在不动点的可能.若能发现并求解不动点,则可发现精确的数据变动规律.多日的数据序列组合可能具有混沌特性,如本文中的到站延误和站点停靠时间.也有部分不具有混沌特性的数据序列区间,如到站间隔和到站延误的绝对值数据.
3)为探究基于混沌理论的数据序列的可预测性分析,采集运行在非公交专用道上的连续6 d的单线公交到站实测数据,将最大Lyapunov指数大于0的公交到站延误和停靠时间的全6 d数据进行预测分析.虽然普通车道上的公交运营过程相比BRT运营过程受到更大的外界因素影响,预测更加困难.但结果表明:基于混沌理论的预测分析能够较大程度地识别数据演化趋势,得到较为理想的预测精度,在公交到站延误和公交站点停靠预测上显著优于BP神经网络模型和GM(1,1)模型,并且在公交到站延误预测方面,得到了较为精确的预测结果,在公交站点停靠方面的预测略低于前人[5,7]的研究成果.
4)数据序列的混沌特性判定和预测分析需要计算出精确的时间延迟、嵌入维及平均周期等参数,由于当前计算方法繁多,本研究中仅选用了近年来研究中所推荐的参数计算方法.若采用混沌理论进行更多的尝试,或许能够发现更好的计算方法.
- [1] 楚彭子,杨京帅,李青霞,等.公交车发车频率的博弈分析[J].武汉理工大学学报(交通科学与工程版),2017,41(4):708-712.
- [2] 金宁,隽志才.基于顾客满意度的城市公交服务水平[J].吉林大学学报(工学版),2008,38(1):63-66.
- [3] 武荣桢,翟栋栋,郗恩崇,等.城市公共交通服务满意度评价模型[J].交通运输工程学报,2009,9(4):65-70.
- [4] 于滨,杨忠振,曾庆成.基于SVM和Kalman滤波的公交车到站时间预测模型[J].中国公路学报,2008,21(2):89-93.
- [5] 季彦婕,陆佳炜,陈晓实,等.基于粒子群小波神经网络的公交到站时间预测[J].交通运输系统工程与信息,2016,16(3):60-66.
- [6] 董超俊,刘智勇,邱祖廉.基于混沌理论的交通量实时预测[J].信息与控制,2004,33(5):518-522.
- [7] 胡华,高云峰,刘志钢.基于AVL数据的公交到站时间实时预测模型[J].重庆交通大学学报(自然科学版),2012,31(5):1014-1017,1041.
- [8] 马书红,张勐豪.镇村公交下一种新型智能公交到站时间预测算法[J].计算机应用研究,2016,33(4):1044-1046,1061.
- [9] 胡继华,李国源,程智锋.基于马尔科夫链的公交站间行程时间预测算法[J].交通信息与安全,2014,32(2):17-22.
- [10] 李大铭,赵新,林永杰,等.基于模糊神经网络的短时公交到站时间预测[J].东北大学学报(自然科学版),2011,32(3):443-446.
- [11] 杨敏,丁剑,王炜.基于ARIMA-SVM模型的快速公交停站时间组合预测方法[J].东南大学学报(自然科学版),2016,46(3):651-656.
- [12] 王旭,陈旭梅,寇伟彬,等.公交站点停靠时间预测模型研究[J].交通信息与安全,2016,34(2):55-61.
- [13] 王建,邓卫.基于贝叶斯网络组合模型的公交驻站时间预测[J].城市交通,2012,10(5):78-83,5.
- [14] LIN Y,YANG X,ZOU N,et al.Real-time bus arrival time prediction:case study for Jinan,China[J].Journal of Transportation Engineering,2013,139(11):1133-1140.
- [15] MENG Q,QU X.Bus dwell time estimation at bus bays:a probabilistic approach[J].Transportation Research Part C:Emerging Technologies,2013,36:61-71.
- [16] 杨永锋,仵敏娟,高喆,等.小数据量法计算最大Lyapunov指数的参数选择[J].振动、测试与诊断,2012,32(3):371-374.
- [17] 王文霞,梁展东.一类非线性算子的不动点定理及其应用[J].数学学报,2005,48(4):789-800.
- [18] 张海龙,闵富红,王恩荣.关于 Lyapunov 指数计算方法的比较[J].南京师范大学学报(工程技术版),2012,12(1):5-9.
- [19] KIM H S,EYKHOLT R,SALAS J D.Nonlinear dynamics,delay times,and embedding windows[J].Physica D:Nonlinear Phenomena,1999,127(112):48-60.
- [20] 陶诏灵,陈国华.基于C-C方法的Lyapunov指数计算[J].南京气象学院学报,2002,25(4):555-559.
- [21] 龚祝平.混沌时间序列的平均周期计算方法[J].系统工程,2010,28(12):111-113.
- [22] 朱子虎,翁振松.基于混沌理论的铁路客货运量预测研究[J].铁道学报,2011,33(6):1-7.
- [23] 陈继光.基于Lyapunov指数的观测数据短期预测[J].水利学报,2001,32(9):64-67.
- [24] 叶青,王全凤.基于BP神经网络的工程估价模型及其应用[J].厦门大学学报(自然科学版),2008,47(6):828-831.
- [25] 张永杰.灰色系统理论在道路货运量、货运周转量预测中的应用[J].交通运输系统工程与信息,2003,3(1):75-79.