北京中交兴路信息科技有限公司:基于车联网大数据的保险风控AI云平台建设与实施
北京中交兴路信息科技有限公司(简称“中交兴路”)是一家以数据为核心,为公路货运行业提供多元化产品与服务的科技创新企业,致力于打造中国领先的公路货运综合服务平台。数据积累覆盖全国96%以上重载货车的车辆,累计数据量超10pb,是行业唯一全量数据平台。
中交兴路一直坚持数据驱动、创新引领、开放合作三大发展原则,以数据平台为基础,围绕货运场景,提供数据开放、保险风控、定位服务等数据服务,油品、ETC、运力等场景的交易服务和授信用油、ETC记账卡、经营贷款等创新金融服务, 推动新物流在降本增效提质方面飞速发展。在北京、重庆两地建有国家级车联网产业基地,拥有省级分支机构三十余家,业务范围覆盖全国。2018年12月,中交兴路获蚂蚁金服领投、北京车联网产业发展基金跟投的7亿元A轮融资.
中交兴路经过多年的深入实施创新发展战略,自主创新和自主发展能力显著增强。目前企业共申请专利133项,已授权专利46项,荣获国家货运物流行业相关的奖项逾140项,这些科技创新成果为公司发展提供了强劲动力,推动公司经营质量和效益稳步提升。
二、实施背景及内涵
(一)实施背景1、政策引导与技术创新下的商业车险费率改革必然要求
2015年6月,原保监会发布《中国保监会关于深化商业车险条款费率管理制度改革的意见》,骤然打开了我国商业车险费率改革的大门,施行多年的全国商业车险费率全行业统一的模式终于开始松动。基于车联网大数据技术的新一代车险定价模型呼之欲出。
2、保险市场主体对一个涵盖全国范围车辆的风险管理云平台的迫切需要
一方面,重大事故频发,重载货车车险经营亏损;另一方面,货车行业“骗赔”、“诈赔”以及人为扩大损失等欺诈行为频频发生。所以对于车险行业经营情况的整体改善需要一个覆盖全量市场的车联网平台,作为数据来源和管控基础,建立统一的风险识别与量化标准。通过技术手段的引入和业务模式的创新,扭转车险长期亏损的局面。
3、防灾减损、提高道路安全管理水平的多赢选择
针对整个行业的风险水平改善方面,中交兴路积极拓展货运平台功能,为驾驶员和车主提供相关服务,确保平台长期、安全、稳定运行。与此同时,开发出重大交通事故实时侦测预警功能,对于重大交通事故第一时间通知保险公司、救援机构,迅速采取救援措施,从而实现有效降低财产损失、人员伤亡的社会效益。
(二)成果内涵
三、主要做法(一)系统总体设计
基于丰富、海量的多种数据来源,本项目以“AI安全大脑”为导向构建了保险风控AI云平台,主要实现风险智能评测、智能引擎提醒以及智能事故预警等保险科技服务,系统业务架构图如下图所示:
图4-1 系统业务架构图
保险风控大数据具有数据类型多样异构、数据体量大、实时性要求高等特性,为其采集、整合、存储管理以及相应的分析挖掘均带来巨大的挑战,首先,要求能够高效地支持各种海量、异构(包括非结构化和半结构化数据)数据地高效采集、清洗与全面整合;其次,巨大的数据量给数据的存储管理和处理等系统等都提出了新的要求,传统数据存储和处理基础设施难以满足大数据要求;第三,面对海量的数据,需要深度挖掘其潜在价值,从其中提炼出有用信息,并借助神经网路、机器学习等构建算法模型建立智能系统使平台不断迭代演进。
基于以上原因平台系统架构设计了感知、认知、预知的大数据智能云平台架构体系。大数据感知平台,实时采集、实时计算。大数据智能认知平台,智能分析工具,完成数据画像、风控因子、数据模型。大数据AI运算平台,提供完整的运算分析,涵盖AI事故侦测预警、理赔智能反欺诈、风险智能评价、车辆智能预警,从而实现针对货运车辆的保险风险控制。
(二)应用平台功能设计
应用平台主要分为业务支撑层、产品服务层和表示层,分别面向车主、司机、保险公司和大型运输企业提供线上及线下服务。系统架构图如下图所示:
图4-2 AI应用平台系统架构示意图
应用平台主要功能及其特点描述如下:
1、风险评测功能
提供业务、运营、道路、驾驶等四大类22项动态风控因子的实时查询服务,图表化展现查询结果。支持按单车、多车和车队维度输出评测结果, 为单车和团车业务的风险水平提供科学、准确、快速的评测。
2、实时安全提醒功能
对车辆的违规状态跟踪查看,并针对超速、疲劳等状况可发送车机、短信、人工电话提醒。
3、行驶轨迹查询功能
车辆行驶过程中,系统对车辆的行驶情况进行定位,从车速、里程、时间三个维度反映车辆行驶路线实时查询。
4、车辆驾驶行为汇总报告
对车辆进行驾驶数据信息汇总,生成报告,数据包括:车辆行驶总时长、总里程、报警总数、超速和疲劳车辆的数据等。
5、违规统计报告
将一天按每两小时进行划分,直观展现所有监控车辆在各个时间段的疲劳违规行驶时间、超速违规行驶时间占比情况。
6、车辆地域分布
对车辆运营地域分布情况进行统计,按照运营省份/城市分布车辆数、分布车辆数所占比例进行展示。可以反映出团车整体地域运营情况。
7、保险理赔评估
可以查询车辆在指定时间点前、后12小时的运行轨迹,车所处经纬度。一方面可以观察车辆在出险地点是否匹配,排查套牌可能;一方面对查询区间车辆历史各经停点详情、疑似事故点进行自动识别和判断,提供理赔欺诈以及道德风险排查。
(三)云平台资源配置方案
本项目单位已建立了初步的云IT硬件基础设施,建立了企业级的云平台,拥有处理大数据的能力和技术储备。本平台在现有基础IT资源上进行了合理的规划,利用项目单位已有的云计算节点,结合本项目云计算和大数据基础设施建设需求,进行了针对性的优化和扩容,最大化提高了设备的利用率。
保险风控AI云平台基础资源主要三个部分:大数据存储群组、大数据感知群组和AI分析群组。该资源配置方案基于虚拟化、分布式集群等技术构建的私有云服务,支持弹性扩容、防DDOS,容灾,满足高并发、高性能,高可用,为用户提供稳定高效的服务。
(四)关键技术
1、基于GAM算法的保险风险成本预测模型
GAM在自变量x(即车联网驾驶行为数据因子)与因变量y(即保险风险)之间的关系不确定时,采用非参数拟合算法,使拟合后的曲线连续且至少具有二阶导数,并通过对惩罚系数的调节,调整曲线的平滑度,减缓过度拟合。
2、基于循环神经网络(RNN)算法的交通事故实时预警模型
应用该模型算法,可将每一次车机上传的原始报点数据所包含的时间、位置、速度、方向等信息作为一层输入神经元,将前后连续的多个报点数据相连,形成循环神经网络结构,通过使用大量样本数据训练模型,使模型能够准确识别出车辆在发生交通事故时的独有特征。
3、基于马尔科夫模型的车辆位置点道路匹配算法
道路匹配是一种基于软件技术的定位修正方法,其基本思想是将车辆定位轨迹与数字地图中的道路网信息联系起来,将行车轨迹的经纬度采样序列与数字地图路网匹配的过程,其本质上是平面线段序列的模式匹配问题,目的就是有效地提高车辆定位目标的精度,并保持定位结果的稳定性。
4、基于Mapreduce的并行计算模型
本课题基于4PB的货运车辆相关历史行驶数据建立了MapReduce大数据在线与离线协同处理框架,涉及500多万辆货车和800多个数据字段,包括车辆类型、道路级别、交通状态、周边设施、车辆状态、车辆位置、速度等属性,建立目标导向的多维精准挖掘分析技术,实现个体到群体、过程到全程的实时预警分析能力,大大提升了平台实时分析效率。
5、具有道路货运行业特色的专用地理信息系统引擎
本项目使用了项目单位自主研发的具有道路货运行业特色的专用地理信息系统引擎,该引擎有效的解决了海量基础地理数据、行业深度数据、货车行驶数据的融合问题,并在此基础上研发了一系列满足道路货运行业应用需求的特色功能。
该引擎具备高性能的海量移动目标可视化能力,支持二次开发;为道路货运行业应用开发、道路货运行业开放平台提供强大的空间数据管理能力。同时也为本课题的轨迹补齐、道路匹配、空间运算等技术提供必要的基础支撑。
(五)主要创新点1、国内首创运用车联网大数据建立重载货车保险风险预测模型
根据重载货车的日常行驶特征,将车联网大数据整理、加工成运营数据、道路数据、驾驶数据、业务数据4大类,具体包括运营率、日均行驶里程、高速公路行驶里程占比、夜间行驶里程占比、超速行驶时长占比、日均疲劳驾驶里程、常跑路线运营次数占比等数十项驾驶行为数据因子,结合中国保信所提供的商业车险承保、理赔数据,采用行业领先的GAM算法建立了保险风险预测模型,通过分析车辆过去的日常行驶特征,准确预测其未来的保险风险成本。
模型有效地提高了保险公司对重载货车商业车险的核保能力,得到了保险行业主流大公司的一致认可,并被中国保信相关负责人评价为“是保险行业首次引入车联网从用动态数据因子,对整个保险行业具有重要的战略性、创新性意义!”。
图4-3 保险风险预测模型示意图
2、国内首个基于RNN和Hadoop技术的交通事故侦测云平台
在海量车联网大数据基础上,本项目有效融合权威第三方的交通事故历史记录、车旺大卡APP(注册用户为450多万车主、司机用户,日活用户超过200万)位置信息乃至天气、路况等数据,形成多维度的车联网大数据,并根据车联网数据的动态性、时序性、复杂性等特征,我们创造性地将循环神经网络(Recurrent Neural Networks)算法应用于多源数据融合后的车联网大数据,开发出基于车联网大数据的交通事故识别模型。同时采用流式计算等实时数据分析处理技术搭建了国内首个交通事故实时侦测云平台,实现对500多万辆货车驾驶行为的动态监测与实时分析运算,第一时间准确地侦测出交通事故的发生,还原事故现场并及时通知救护人员,从而降低人身伤亡比率,形成积极地社会效益。
3、基于多源数据融合技术首创商用车理赔反欺诈智能引擎
为了防范和识别保险欺诈行为,本项目创新性的引入车联网大数据和用户手机数据,着重进行多源数据融合研究和建模,从而在用户出险报警后,云平台及时分析出车辆是否有欺诈嫌疑。
本算法引擎的创新意义在于,所述根据匹配结果对所述用户上报的数据信息进行评分,并根据评分结果确定所述用户是否存在欺诈行为,包括:分别对所述第一数据信息的每个信息进行评分,并将总的评分结果和预设评分规则进行对应,根据对应的结果确定所述用户是否存在欺诈行为;或者,分别对所述第一数据信息的每个信息进行评分,并将每个信息的评分结果和所述预设评分规则进行对应,根据对应结果确定所述用户是否存在欺诈行为。
4、首创基于道路匹配算法评估商用车运营安全系数
当前现有的核保政策主要针对车辆的车价、车型、车龄等自然属性以及上一年的出险次数,忽略了客户/司机的驾驶习惯、理赔成本等特征信息,基本没有综合考虑风险因素,因而不是对客户风险的全面评估,特别是对商用车的运营安全相关风险没有具体的评估方法和管控手段。
本项目创新性的将道路匹配算法和空间数据运算进行有效整合,通过确定每种道路的危险类型并对每种危险道路进行编号,然后综合保险公司出险记录以及全国货运平台的路段安全隐患统计结果确定危险道路的危险类型和危险程度,从而确定权重系数,然后根据货车途经危险道路编号的次数统计出货车途经每种道路类型危险的频次,最后通过对所频次求加权平均值的方式得出货车危险程度评分。
五、实施效果(一)保前风险评测模型准确可靠,受到行业一致认可
相比于传统定价因子,车联网数据因子具有复杂性、连续性、动态性等诸多新特点,行业内普遍采用的GLM模型显然并不适用。为此,本项目研发团队与中国保信合作,结合美国斯坦福大学等名校的知名教授们所提出的全新理论,根据车联网数据独有的特征,创造性地建立了基于车联网数据的保险风险预测模型。该模型在技术水平上大大领先于行业,并且经过了人保财险、平安财险、大地财险等十余家大型保险公司总部的实际校验,模型评测结果相比传统车险定价模型有本质的提升。
图5-4 保险风险预测模型效果展示图
如图所示,模型预测结果与实际承保结果非常吻合,充分体现了模型的准确可靠性,并且每组之间的出险频率上升趋势明显,这也体现了模型的灵敏度。一般来说,传统保险定价模型的预测结果,风险最高组与风险最低组的差异(提升度)不会超过3倍,而加入了车联网数据因子后,本模型的提升度达到了4.3倍,效果远超传统模型。
经过了前期充分的准备工作后,2018年8月10日,项目组成功向全行业发布了首个面向保险行业风险管理应用的重载货车车联网数据服务产品。借助该服务,保险公司可以获取多维度的车辆动态从用数据因子和风险评分,精准识别车险运营风险,实现重载货车车险精准定价,并有效实施风险管控措施。
(二)保中风险管控有效降低了车辆的行驶风险,实现了司机、车队、保险主体多方共赢的局面
本平台结合大数据技术、智能分析、实时计算技术,对车辆行驶行为、驾驶员行为进行分析,并实时提醒,可有效纠正驾驶者的不良驾驶习惯,提高驾驶安全系数。
根据占全国货车保险市场份额40%以上的国内第一大财产保险公司人保财险的数据分析报告显示,货运车辆出险率自2013年本平台提供危险驾驶行为实时提醒服务后持续降低,载重10吨以上的货车降幅显著。2016年,货运车辆总体出险率为24.9%,较2013年下降1.1个百分点。载重吨位10吨以上货车出险率为33.4%,较2013年降低6.1个百分点;10吨以下出险率为16.8%,较2013年下降0.9个百分点可见,随着本平台保中提醒功能的完善和覆盖车辆范围的不断扩大,其出险率有了显著地改善。
图5-5 人保财险报告
(三)智能理赔评估体系,有效协助保险公司进行赔案反欺诈排查。1、理赔支持-轨迹查询功能。
以国内某知名险企为例:2018年4月-8月末,5个月内有效查询次数2339次,直接减损数额515.74万元,次均查询反欺诈减损0.22万元,案均赔付成本降低5%-10%。结合实际使用情况发现,对车辆套牌、小案大作、虚假拼凑、换驾逃逸等典型类型事故能做到快速识别和排查指引,得到业内使用单位的一致认可。
2、理赔支持-事故真实性回溯模型。
对照险企历史车辆出险信息,通过模型算法自动对车辆特定时段在停靠区域、停靠时长、停运时长等事故特征因素进行数据调取、匹配校验后给予综合真实度评定。简化了原有人工核对、经办人现场核查的原始排查手段,将简易事故回溯定性排查时效缩短至分钟级,让险企在赔案审核上增加了AI手段,助力保险行业缩短赔付时效和提升客户服务感受。项目开发至今不足1个月的时间内,已帮助险企完成赔案回溯1400余笔,发现问题案件20余笔,反欺诈减损170余万元,成效斐然。
通过后台实时车辆运营数据的分析,对重大交通事故产生所具备的常规特征,例如:非常规减速度值、特定速度下的非常规制动距离值等核心数值进行实时抓取,再结合实时路段情况(拥堵与否、连续下坡、危险路段等)对比路过车辆的速度变化情况,采集点预警提示、驾驶员制动措施等一系列辅助手段综合进行事故实时判定,尤其重点关注高速公路恶性事故的实时发现。
目前日均发现并通过验证确认的事故数30余笔。事故实时发现的初衷是最快的时间准确发现事故,为人员抢救、车辆施救、恢复交通尽可能地争取时间。验证过程中,很大一部分是早于车主知悉事故,该功能的实现和初衷,得到当事人的普遍认可。
六、总结与展望
保险风控AI云平台的建设和实施是中交兴路针对货运大数据的一次完整的价值应用旅程。在如今货运行业持续升级的时代,大数据已经成为助推行业向更高效、更便捷、更安全方向发展的有力武器。在人、车、企、货方面的风险预测、业务效率的提高、成本的降低、安全监管、事故发现、事故救援方面,以数据为基础、技术为核心的数据应用实现了实实在在的效果。不仅改善了保险行业的服务环境,提高保险公司业务提升,降低投保人员成本负担。同时在公共道路安全监管和服务方面,能够为政府单位、物流、货主、融资租赁等企业提供货运车辆、驾驶员等信息验证,实时可视化车辆在途监测,规范驾驶员不良驾驶行为,成功降低货车事故的发生比率,为中国道路运输管理工作加注更智能的安全防线。
在未来,中交兴路依然会在货运大数据的应用上,进行更加深入的开发和应用。围绕货运场景,包括用油、过路、保险、金融、运力、管车、找货等方面提供更加便捷、优惠、安全的一站式服务。为中国1400万营运车辆,3000万公路货运从业者及家庭提供生产、生活服务于保障。
最新案例