一种山区高速公路事故多发路段识别方法

专利检索2022-05-11  14



1.本发明涉及交通安全管理技术领域,尤其是涉及一种山区高速公路事故多发路段识别方法。


背景技术:

2.高速公路具有交通设施完善、交通流量大、运行速度高等优点,而山区高速公路以其复杂的地理特征和特殊的自然环境,较高的运行速度导致其交通事故多发且严重程度处于较高的水平。山区高速公路交通安全已越来越受到管理者的重视,其中,事故多发路段判别是山区高速公路交通安全管理的重要内容之一。
3.事故多发路段判别就是基于路段安全性确定高速公路危险路段。主要可以分成三类:基于观测数据直接判别法、事故预测模型法和空间分析判别法。基于观测数据的直接判别法,包括事故数法、事故率法等,我国交通部门在开展事故多发路段排查工作时常常采用此类方法,但是该方法忽略了事故的空间集聚性和随机波动性,易导致判别结果出现偏差。事故预测模型法通过构建交通安全模型分析事故的影响因素,并进行事故预测,基于事故预测值或构造其他指标如安全可提高空间,最终判别事故多发路段,考虑了影响事故的道路几何、交通运行和控制特征。空间分析法利用空间分析技术识别点的集聚特征,从而判断事故的多发路。
4.高斯混合聚类模型(gaussian mixture model,gmm)在聚类中引入了概率的概念。和传统的k-means聚类法通过计算每个对象与各个种子聚类中心之间的距离,再把每个对象分配给距离它最近的聚类中心不同,高斯混合聚类模型给出每一个数据点被指定到每个簇类中概率。通常而言,事故数据分布离散程度较大,事故多发道路相比普通道路事故数离差较多,使用传统聚类模型不能很好捕捉事故多发道路特质。因而,相比传统的k-means或hierarchical clustering采用欧式距离进行相似度度量,高斯混合聚类模型更适用于存在极端值或过度离散分布的数据聚类,通过对每一个路段赋以相应分布,计算得到该路段是事故多发路段的概率。
5.现有事故多发路段判别工作多采用事故数法或安全可提高空间法进行判别,判别结果是离散的,不适用于实际道路改善治理工作。实际工作中往往根据经验对高危路段进行链接,缺乏客观性,难以量化。故应在此基础上,考虑空间特征,采用机器学习算法代替人工进行聚类,得到最终的事故多发路段判别结果。


技术实现要素:

6.本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种可靠性高、更加合理的山区高速公路事故多发路段识别方法。
7.本发明的目的可以通过以下技术方案来实现:
8.一种山区高速公路事故多发路段识别方法,所述的事故多发路段识别方法包括:
9.步骤1:获取山区高速公路相关数据;
10.步骤2:根据步骤1采集的数据,将山区高速公路划分为同质路段;
11.步骤3:构建样本数据集;
12.步骤4:针对山区高速公路事故总数构建负二项安全分析模型;
13.步骤5:计算安全可提高空间psi;
14.步骤6:利用高斯混合聚类模型gmm对psi高危路段进行聚类,获得事故多发路段识别结果。
15.优选地,所述的步骤1中山区高速公路相关数据包括:山区高速公路道路几何数据、交通运行数据、天气数据、路面抗滑性能数据及交通事故数据。
16.更加优选地,所述的道路几何数据包括道路横断面、纵断面及平面几何数据。
17.更加优选地,所述的步骤2具体为:
18.根据步骤1获取的道路横断面、纵断面及平面几何数据,将山区高速公路划分为若干个同质路段,每个同质路段内道路横断面、纵断面及平面几何数据一致。
19.优选地,所述的步骤3具体为:
20.提取各同质路段的道路几何设计变量、交通运行变量、天气变量、路面抗滑性能变量及事故总数,构建交通安全分析的样本数据集。
21.优选地,所述的步骤4具体为:
22.假设路段交通事故数服从负二项分布,即
[0023][0024]
模型方程为:
[0025]
log(θ)=β0 β1x1

βnxn[0026]
其中i为该山区高速公路上从1开始的同质路段编号;为路段i的事故预测值;变量xi为影响交通事故的因素;βn为变量对应的系数;α为负二项模型的离散系数。
[0027]
优选地,所述的步骤5具体为:
[0028]
安全可提高空间以事故预测期望值与同类路段平均期望值的差值作为安全指标,判定路段安全性,计算方法为:
[0029]
psi=e[r|x]-e[r]
[0030]
其中,e[r|x]为预测的路段事故数;e[r]为同类型路段的事故期望值,通过负二项安全分析模型得到;
[0031]
将样本数据集中的数据代入计算公式,计算安全可提高空间,并进行降序排列,获得高危路段。
[0032]
优选地,所述的步骤6具体为:
[0033]
高斯混合聚类模型gmm由k个gaussian分布组成,将每个gaussian视为一个component,高斯混合聚类模型gmm的概率密度函数为:
[0034][0035]
其中,πk为每个component被选中的概率;μk为均值向量;∑k为协方差矩阵。
[0036]
更加优选地,所述的步骤6采用期望-最大化方法求解。
[0037]
更加优选地,所述的步骤6中使用期望-最大化方法求解的方法具体为:
[0038]
步骤6-1:估计数据由component生成的概率;
[0039]
对于每个数据xi,它由第k个component生成的概率为:
[0040][0041]
步骤6-2:根据概率值和最大似然估计找到参数;
[0042]
假设步骤6-1中得到的γ(i,k)xi是由componentk生成的,集中考虑所有的数据点,即由component生成了γ(i,k)xi…
γ(n,k)xn;
[0043]
由于每个component都是一个标准的gaussian分布,可求出最大似然所对应的参数值:
[0044][0045][0046]
其中,并且πk可估计为nk/n;
[0047]
步骤6-3:重复迭代步骤6-1和步骤6-2,直到似然函数的值收敛为止;
[0048]
步骤6-4:采用aic准则判别聚类个数的合理性;
[0049]
aic=2k-2ln(l)
[0050]
其中,k是模型参数个数,l是似然函数,最后选择aic最小的模型。
[0051]
与现有技术相比,本发明具有以下有益效果:
[0052]
一、可靠性高:本发明中的山区高速公路事故多发路段识别方法利用高斯混合聚类模型对基于安全可提高空间法识别的高危路段进行聚类,将空间特征相似的点位合并形成事故多发路段,相较于主观链接,结果更加可靠和实用。
[0053]
二、更加合理:本发明中的山区高速公路事故多发路段识别方法采用安全可提高空间识别危险路段,考虑了相似路段的事故均值,相较于传统方法,识别结果更加合理。
附图说明
[0054]
图1为本发明中山区高速公路事故多发路段识别方法的流程示意图。
具体实施方式
[0055]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
[0056]
通过采集道路几何数据、交通运行数据、天气数据、路面抗滑性能数据和交通事故数据,基于道路几何参数划分高速公路同质路段,并统计各路段的事故总数,以构建交通安全分析的样本数据集,建立负二项交通安全分析模型,将样本数据代入交通安全模型计算
安全可提高空间并据此进行路段排序,利用高斯混合聚类模型对离散的高危路段进行聚类,从而识别事故多发路段。所发明的方法考虑危险路段的空间关联性,相对于基础的事故多发路段识别方法,具有更高的实用性和可靠性。
[0057]
一种山区高速公路事故多发路段识别方法,其流程如图1所示,包括:
[0058]
步骤1:获取山区高速公路相关数据,包括山区高速公路道路几何数据、交通运行数据、天气数据、路面抗滑性能数据及交通事故数据;
[0059]
道路几何数据包括道路横断面、纵断面及平面几何数据;
[0060]
步骤2:根据步骤1获取的道路横断面、纵断面及平面几何数据,将山区高速公路划分为若干个同质路段,每个同质路段内道路横断面、纵断面及平面几何数据一致;
[0061]
步骤3:提取各同质路段的道路几何设计变量、交通运行变量、天气变量、路面抗滑性能变量及事故总数,构建交通安全分析的样本数据集;
[0062]
步骤4:针对山区高速公路事故总数构建负二项安全分析模型;
[0063]
假设路段交通事故数服从负二项分布,即
[0064][0065]
模型方程为:
[0066]
log(θ)=β0 β1x1

βnxn[0067]
其中,i为该山区高速公路上从1开始的同质路段编号;为路段i的事故预测值;变量xi为影响交通事故的因素;βn为变量对应的系数;α为负二项模型的离散系数;
[0068]
步骤5:计算安全可提高空间psi;
[0069]
安全可提高空间以事故预测期望值与同类路段平均期望值的差值作为安全指标,判定路段安全性,计算方法为:
[0070]
psi=e[r|x]-e[r]
[0071]
其中,e[r|x]为预测的路段事故数;e[r]为同类型路段的事故期望值,通过负二项安全分析模型得到;
[0072]
将样本数据集中的数据代入计算公式,计算安全可提高空间,并进行降序排列,获得高危路段;
[0073]
若psi》0表示路段i的事故超出了类似地点,并且由该路段相关特征所引起,可采取适合的改善措施将超出的事故降低到平均值;
[0074]
步骤6:利用高斯混合聚类模型gmm对psi高危路段进行聚类,获得事故多发路段识别结果;
[0075]
高斯混合聚类模型(gaussian mixture model,gmm)由k个gaussian分布组成,将每个gaussian视为一个component,高斯混合聚类模型gmm的概率密度函数为:
[0076][0077]
其中,πk为每个component被选中的概率;μk为均值向量;∑k为协方差矩阵;
[0078]
采用期望-最大化(expectation-maximization,em)方法求解,具体方法为:
[0079]
步骤6-1:估计数据由component生成的概率;
[0080]
对于每个数据xi,它由第k个component生成的概率为:
[0081][0082]
步骤6-2:根据概率值和最大似然估计找到参数;
[0083]
假设步骤6-1中得到的γ(i,k)xi是由componentk生成的,集中考虑所有的数据点,即由component生成了γ(i,k)xi…
γ(n,k)xn;
[0084]
由于每个component都是一个标准的gaussian分布,可求出最大似然所对应的参数值:
[0085][0086][0087]
其中,并且πk可估计为nk/n;
[0088]
步骤6-3:重复迭代步骤6-1和步骤6-2,直到似然函数的值收敛为止;
[0089]
步骤6-4:采用aic准则判别聚类个数的合理性;
[0090]
aic=2k-2ln(l)
[0091]
其中,k是模型参数个数,l是似然函数,最后选择aic最小的模型。
[0092]
实施例
[0093]
利用某地高速公路的真实道路几何数据、交通运行数据、天气数据、路面抗滑性能数据及交通事故数据,测试本发明。
[0094]
采集该地高速公路的道路几何数据、交通运行数据、天气数据、路面抗滑性能数据及交通事故数据。为保证同一路段内的平面线形、纵断面线形和横断面参数相同,将该地高速公路双向划分为489个同质路段,并为路段编号,提取各路段的道路几何特征变量、交通运行特征变量、天气变量、路面抗滑性能变量,并与各路段的事故总数对应,构建交通安全分析的样本数据集。
[0095]
样本数据集中,道路几何变量包括路段类型、平曲线类型、平均曲率、曲率最大最小差值、竖曲线类型、平均坡度、纵坡变化率、纵坡坡长、路段长度、路面抗滑性能。交通运行变量包括交通流量、左车道流量占比、日均货车占比、限速、平均速度、大小型车速均差。天气变量包括晴天占比、阴天占比、雨天占比、雪天占比、雾天占比。路面抗滑性能变量为路面抗滑性能指数。
[0096]
基于样本数据集,依照本发明的步骤1到步骤6,建立基于事故总数的交通安全模型,将样本数据代入交通安全模型计算各路段的事故总数的安全可提高空间,按照安全可提高空间对路段进行降序排列,并利用高斯混合聚类模型对高危险路段进行聚类,得到事故多发路段。
[0097]
表1各路段的psi计算结果
[0098]
桩号侧向安全可提高空间psi排名k1331.657-k1332.333a方向116.71
k1332.333-k1331.657b方向62.62k1338.270-k1338.025b方向45.43k1338.660-k1338.461b方向30.34k1398.091-k1399.507a方向26.55k1338.461-k1338.270b方向19.36k1381.837-k1382.891a方向19.17k1367.180-k1366.681b方向18.38k1400.589-k1399.857b方向14.59k1385.520-k1385.720a方向12.610k1397.694-k1396.540b方向12.411k1410.886-k1411.180a方向12.112k1366.681-k1367.125a方向11.413k1371.154-k1370.541b方向10.914k1352.152-k1352.619a方向10.815k1399.507-k1399.039b方向10.716k1410.043-k1410.403a方向9.517k1389.203-k1388.502b方向9.418k1396.080-k1395.860b方向9.219k1379.208-k1378.983b方向8.820
[0099]
基于安全可提高空间结果得到危险路段的排序,其中psi越大,说明事故高发风险越高。根据表1的结果,安全可提高空间排名前20的路段中,有8处来自a方向,12处来自b方向。使用psi排名的危险路段分布较为分散,离散的危险路段组合通常取决于工程师的经验,难以量化。
[0100]
表2事故多发路段识别结果
[0101]
事故多发路段侧向事故黑点k1331-k1333b方向k1332k1337-k1338b方向k1338k1364-k1367b方向k1367k1397-k1400b方向k1400k1371-k1372b方向k1371k1331-k1335a方向k1331k1398-k1400a方向k1398k1378-k1381a方向k1381k1382-k1385a方向k1385k1407-k1410a方向k1410
[0102]
表2为利用高斯混合聚类模型对psi高危路段进行聚类,通过机器学习算法,量化得到的psi离散的危险路段聚合结果。高斯混合聚类模型将离散的psi事故多发点段进行了链接形成2-3km长度的事故多发路段。高斯混合聚类模型代替人对psi点段的主观链接,通过给每个数据点分配概率,从而将特征相似的点位合并形成事故多发路段。
[0103]
因此,本发明的识别结果更加可靠和实用,有利用山区高速公路交通安全管理工作的开展。
[0104]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
转载请注明原文地址:https://win.8miu.com/read-1056244.html

最新回复(0)