网站首页 > 新闻中心 > 杜勇:打破“信息孤岛”,促进交通融合发展”

杜勇:打破“信息孤岛”,促进交通融合发展”

来源:智能交通网     发布时间:2017-02-16     人气:2921

 1月13日,“2017 ITS CHINA年度盛典”在北京盛大开幕。本届盛典以“打造新时代智能交通引擎”为主题,举办年度评选颁奖典礼、行业发展趋势分析会、互动交流、行业新春联谊会等活动,以前瞻性的视角探讨人工智能、大数据、互联网+、智能汽车等诸多热点在智能交通中的运用。

 北京交通信息中心书记、副主任杜勇出席了盛典,并做了“打破‘信息孤岛’,促进交通融合发展”的主题发言。

blob.png

 杜勇

 北京交通信息中心书记、副主任。长期从事北京市智能交通关键技术研发和应用推广工作,先后主持和参与完成了“十五”、“十一五”科技支撑计划、863、CNGI等国家及省部级重大科研项目及重点工程20余项。所承担的项目先后被交通运输部评为“十一五交通运输行业信息化优秀项目”、被国家发改委授予“国家高技术产业化十年成就奖”。科研成果获省部级科学技术一等奖2项、二等奖4项。发表科研论文10余篇。编制国家标准1项、北京市地方标准3项、交通运输部交通行业标准4项。

 如下为全文内容:

 大家下午好!我今天向大家报告的题目是:打破“信息孤岛”,促进交通融合发展。

 内容包括:

 第一,交通大数据困局,这个主要结合我们前期工作,谈谈我们一些体会;

 第二,针对这种困局思考我们怎么应对,把我们的一些实践和想法向大家做报告。

 大数据的困局

 大数据基本有三个特点:

 第一,传统的存储模式与能力,还有传统计算模式和能力都不能满足的数据,比如视频、图片,网页等等。

 第二,容量大、类型多,要求存取速度快、应用价值高。

 第三,它是一种发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态,这和传统数据处理、存储计算是有明显区别的。

 大家感到我们已经在大数据时代了,大数据已经来了。比如2014年美国全球大数据白皮书指出,全球每天大概有5亿张照片上传和分享,每分钟还有超过两百小时的视频上传分享。2006年全球产生了180亿EB的数据,2011年1.8ZB,2013年4ZB,麦肯锡预测到2020年整个世界数据总量将会增长44倍,IDC监测统计全球数据总量在于两年翻一番数据增长,到2020年世界数据总量将会达到40ZB,中国数据将会达到8600EB规模。

 交通大数据

 交通大数据由两部分组成,首先是信息化基础设施,这里面包括营运车辆卫星定位、车辆传感器、道路视频监控等等。随着移动互联网的发展,我们还利用智能手机指导出行。这些数据拿来以后,我们感觉就和一个人做体检似的,它可以反应交通运行状态。当然,光有这些原始数据的话还做不到交通大数据这个层面。有了这些数据还要靠我们真正面向交通的实际需求,利用我们交通的理论、方法,还要采纳比如深度学习、数据挖掘等新的大数据技术,才能够实现我们交通大数据新的服务。

 交通大数据有四个方面特点:

 第一个特点,交通大数据比较全面。一个城市的交通运行是和一个社会的能源消耗、大气污染、公众卫生紧密相关的。

 第二个特点,很混杂。交通行业数据的质量,包括它的价值高低是并存的,注定了这些数据混杂的状态。

 第三个特点,关联性很强。不同的运输方式、交通行业之间的数据汇聚是关联的。

 第四个特点,结构多样。结构化、非结构化,数据结构呈现多样的特点。

 交通大数据不是空中楼阁,它离不开基础的信息。以北京为例,随着公交还有出租车的发展,监控调度的推广,目前每天能够接收到的车辆的定位数据大致两亿条,还有市政一卡通系统,每天我们收到的刷卡量大概四千万次左右。还有ETC推广使用量越来越大,以及我们的轨道交通等等。不同的交通行业,不同的领域,随着基础信息化的工作积累了宝贵的数据,这些数据除了能用于企业运营,还能够关联到统一分析、加工处理,能够更好地服务与政府角色、行业监管和老百姓出行。这些数据如果不做整合的话,它的价值应用就不能发挥出来,还是散落在交通运输的各个领域。

 应同步做数据中心建设

 以北京为例,从2009年开始到现在,我们分了三个阶段开展数据整合工作。2009年到2010年我们刚开始做行业数据整合工作,我们做交通行业数据建设工作。当时与这种关系性数据库为主,通过数据接入我们做了数据目录以及共享平台。当时接入数据还是以政府投资信息化系统数据为主,数据存储量不到2T规模。2011年到2014年我们把数据中心数据整合,由原来的工程建设,转化为我们常态化运维工作。而且我们在规范运维这一块通过了ISO20000国际认证,建立了线上线下结合的规范运营体系。这个运维期间是一个常态化的,我们接入了很多业务数据。在这个期间,北京市交通行业数据中心数据层面枢纽作用越来越明显,也越来越被行业各个部门认可。2015年到2016年我们对数据做了升级,主要是引入了开放式的,开源的分布式的数据存储和计算平台。部分采用虚拟化管理技术,基于开放开源大数据平台,根据北京特点需求,我们自主研发了数据立方管理引擎。另外还有探索数据可视化分析工作。

 到目前为止,我们的数据中心有55台服务器构成,数据存储空间达到了PB级,目前存储数据达到了200TB,接入行业内外41个业务系统,8800多项数据,我们的数据达到三千多万个,我们对26家单位实时提供数据共享交换服务。另外每天数据增量大致有三亿条行业动态运营数据,还有10T左右视频数据。通过前期工作我们认为,我们交通行业数据和大数据面临很多困局或者是问题的,我们总结有三个方面:

 一是信息孤岛,二是质量差,三是分析弱。

 首先,信息孤这个层面,应该是两个层面的信息孤岛。我们在做数据整合的时候发现。北京、天津,不同的地区的交通行业之间数据并没有互联互通,也就是我们有所谓区域性的孤岛,这是一个信息孤岛的一个方面。第二方面,即使我们行业数据做的比较全面整合,但是我们对于用户,包括政府、研究机构、企业公众还缺少一个开放的中介或者是一个通道,这里有技术问题,更多是体制、机制、政策问题。这些数据没有很好地开放出去,降低了它的使用价值,从这个层面看也是信息孤岛现象,存在着问题。

 二是数据质量。交通大数据使用三个环节:第一个环节是精细化数据质量环节,第二是精准化交通特征计算,第三是我们智慧化交通决策分析,第一个环节最容易被忽视,但这是最基础性的分析。

 我们的数据,说实话不是那么完美,为什么?第一,标准不统一,比如北京有5家出租汽车监控标准,他们都同样采用车辆卫星定位数据,但各家采用的标准不一样。

 第二,数据还是不完整的,比如公交刷卡数据、出租车计价器交易数据、时间、位置缺失等等。

 第三,精细化程度不够。比如我们坐的北京实时公交,全市层面没有相对统一的站点监管。

 数据传输过程中我们也会发现它有准确性、稳定性,包括数据中断的问题。

 三是困局。目前对数据的使用深度或者是广度还不够。一个是浅,一个是虚,一个是乱。

 第一浅,现在数据还是统计分析,真正产生新的数据价值分析很少。

 第二虚,纯实数,纯研究层面成果多一些,真正要解决识别应用,解决实际问题的研究成果还是少。

 第三乱,大家都在做,更多站在自己的角度,自己的本位上得出的思考结论多,但是真正客观严谨的少。专车加剧了城市拥堵,造成了媒体报道不靠谱的交通大数据乱象。

 针对以上这些困局我们应该怎么去做,谈谈我们的做法和体会。

 首先应该有一个聚焦,方向性。我们觉得以后交通行业大数据应该是在方向上聚焦于支撑综合交通网联化连接,面向老百姓一体化的出行服务的业务方向。

 具体来说,我们针对这个业务方向要做哪些工作,主要从三个方面抓起:第一,继续加大数据整合与质量提升;第二,面向行业进行行业应用和分析;第三,偏政策类的数据开放与发展问题。

 整合数据质量提升问题,我们应该发挥主导作用,你不干别人更不干了。强化数据整合层面我们应该更关注原始数据、实时数据,我们应该更关注特殊时段的、重点领域的特别是面向大交通数据整合。另外还有一个我们的互联网企业,还有运营商,他们掌握大量的关于出行者的数据,下一步强化数据整合应该在这三个层面下工夫。提升数据质量层面,因为大家知道数据肉眼看不着,我们可以利用可视化技术,数据出问题了我们应该第一时间知道。出了问题应该有人解决,数据预处理层面梳理标准化,校正等等方面还有大量工作要做。

 另外我们觉得还有一个很重要的数据规划层面,首先在我们信息系统设计和建设过程中,同步就要把数据单独做规划,另外数据采集管理方面的方案更要遵守,我们后期的数据运维和保障要加强投入。

 在引导行业应用和分析层面,作为我们信息化部门更多是引导,很多事情不是我们自己做的,我们要做服务,传统的数据共享平台升级加强它的服务领域,升级数据共享服务平台,就是利用我们大数据高效的大容量存储和高效计算能力和实际业务需求对接。我们不是说把所有指标算进来,所有结构算进来,我们会全样本量把中间结构算出来,通过各种开放接口,可视化接口工具接目录形式,对外提供服务,服务用户既可以是我们的管理人员,业务人员,也可以是上层的业务系统。对于我们的交通规划、组织管理、出行服务、应急保障,交通行业大数据可以给他们提供一个处理好的数据,更高效支撑他们工作。

 最后,我们觉得应该积极探索数据开放这么一个生态模式。这一块我们想通过联盟形式,根据共同目标形成联盟。大家原来都是单打独斗,包括数据资源、人才队伍,技术成果。现在没有一个机制,所以这个成果和它的收益是不挂钩的,没有取得新的收益。我们是想通过一种商业化的合作模式去把这个平台向社会企业开放,向互联网企业开放,把我们行业数据价值更好发挥出来,包括社会价值和经济价值,能够帮助我们企业获取他们对应的成果收益,形成一个可持续的,相对完善发展途径。

 以上是我的报告。谢谢大家!

 (本文内容根据会议速记整理)

更多内容请访问智能交通网www.21its.com

智能交通网(www.21its.com)版权所有

© Copyright By 21 Intelligent Transportation System Net

京公网安备 11010802014835号 京ICP备08100921号