您好,欢迎您来到智博会!
用户名: 密码: 验证码 看不清楚吗?点击更换一张
工业物联网高层论坛  
行业资讯  
努力缩小区域、城乡、群体、基...
数字经济将向何处去
为数字经济夯实人才支撑
筑牢网络安全屏障 护航数字经...
新质生产力发展有了路线图
数字经济:浪潮之下的“破”与...
预先注册智博会4大理由,1:获取现场参观绿色通道服务;2:电子邮件定期传送商迅,展品信息等;3:免费获得智博会刊1本(数量有限)
行业资讯

须成忠:大数据开启智能新时代

来源:智博会   作者:   更新时间:2016-07-27   浏览次数:5139 次

须成忠:大数据开启智能新时代

中国科技网7月15日讯 今日,由中华人民共和国工业和信息化部、深圳市人民政府主办的“2016国际物联网产业发展趋势论坛”在深圳会展中心隆重举行。论坛作为第九届APEC中小企业技术交流暨展览会重要分论坛,受到物联网业内及社会各界的广泛关注。

中国科学院深圳先进技术研究院首席科学家、先进计算与数字工程研究所所长,兼云计算研究中心主任须成忠受邀出席并发表题为《从AlphaGo看大数据智能》主题演讲。

以下为主题演讲全文:

接下来我跟大家分享一下最近在大数据智能领域的工作以及和一些看法,我的主题是“从AlphaGO看大数据智能”,我来自于中科院信息技术研究院。

2016年最热门的事件在计算机领域就是AlphaGO,我们知道如果说你会下围棋,大家知道每一步应对方案千差万别,它的复杂度超过人的想象,所以传统的人工智能的方法,这里提到了感觉是无能为力。就在这样子的一个困惑的时候,AlphaGO来了。而且它以4:1的比分赢了人类的冠军,那是一个很了不起的成就。有的人感觉好像人类好像不如机器了,但是更多人感觉欢欣鼓舞,这是机器智能新的飞跃。我们从技术层面来说,它有什么特点?

首先它是一个深度DeepMind方法,它的核心关键就在于深度学习。因为我们13层的人工智能网络,用了3000万的棋局做训练做初始化,然后再加上用增强学习来左右互补,这其中还有一个核心关键,就是用了平台,用了1200多个CPU以及280个GPU的降解方法,才赢了。这个事件实际上早期已经有,早在1997年的时候,也是轰动世界的一个人类智慧跟机器的挑战就是IBM的深蓝计划,深蓝当时跟Kasparow比赛,用到的棋局是7000万个棋局比赛,跑在当时295块最快速度的机器上,当时是1997年的时候,那是第一次比赛,Kasparow输了以后还感觉很丢面子,不认输,因为这是代表人类第一次应对机器的挑战,结果还输了。这个就是1997年的时候。

然后再看,2011年的时候,还有一次同样的轰动世界的事件,就是IBM Watson比赛,他在百科知识竞赛挑战两个人,一个是年度冠军,一个挣钱最多的冠军,它的是五花八门的知识竞赛,里边的核心关键是什么?它是一个领域知识的数据驱动的锯齿支持,它当时用到的机器就是用了有90个服务器的集群,当时的速度大概是80TeraFlops,但是大家注意,它收集了很多知识来自于2亿的文档,它的处理速度可以到每秒百万以上。

我们知道人工智能,刚才有嘉宾也介绍过,我们实际上人工智能并不是今天才有的,并不是1997年以后,并不是2011年,并不是说我们到了今天突然冒出来了,从人工智能最早提出这样一个概念,到现在整整有60年的发展历史。60年发展历史有起有伏,第一波非常热潮的就是在60年代着重于符号可以计算,最后发现愿景很好,理想很好,但是实现方法不容易。后来到70、80年代的时候提出来用神经元网络为代表的联结主义的方法。又过了很长一段时间,这个领域又沉寂下去了,又没有声音了,然后大家关注点又到互联网上,这个主要是90年代到新世纪,我们为什么从技术层面来说,是什么样子一个技术突破使得我们今天谈人工智能成为可能?

智能技术新突破,我个人的理解,从三个层次。1、算法,计算方法层面上有一些新的进展,包括像深度机器学习,实际上深度机器学习也是80年代初的神经元网络的一种变种,是一种方法和突破。2、数据;3、平台。计算平台,包括云服务平台。

我看到这一次演讲中就我一个人讲大数据,我用一张PPT介绍一下什么是大数据。大数据就是目前的能力没办法来处理,它有四个基本特征,第一是数据体量巨大,第二个是数据类型众多,第三个是数据产生速度比较快,第四个是它的价值密度低,但是商业价值高。

有了这样子一个大数据的管理的生命周期,我们说从大数据的采集,记录、管理到清洗到存储管理,到数据分析再到数据服务。这样一个全生命的周期。我们说除了下棋除了百科知识竞赛,还有没有其他的大数据知识技能?这里给大家介绍一下其他的,包括刚才有嘉宾介绍的,比如说无人驾驶,这其中一个点。然后还有比较热门的现在的增强现实,还有虚拟增强现实,还有精准医疗、语音设备以及翻译,还有人脸识别以及跟踪,包括我们的邮件系统,大家可以想像,现在你如果自己要维护一个邮件系统,没有人工智能方法在后台做过滤,你每天都收到成千上万的垃圾邮件,实际上垃圾邮件的过滤本身也是很强的智能,当然还有其他的商业智能、在线游戏,还有包括就是进交易等等。

我们再看一下无人驾驶,刚才我们介绍过谷歌,谷歌的无人驾驶从2009年开始这个计划,到现在他在真实的路况测试超过了2亿公里,每天在可受限的范围内、环境内做测试,每天跑500万公里。我们最近报道事件比较多的特斯拉,因为特斯拉最近接二连三出事件,他6个月就跑了7500万公里。每天用100万公里的速度在递增,所以他这样子跑,为他背后凝聚了大量的数据,有这样的数据,我们才可以在数据上面增加附加值服务,增加安全性的保障。

这个是AlphaGO以及人工智能的一些新的进展,以及大数据开展智能时代。

接下来我介绍一下,我们在中科院深圳先进技术研究院在城市大数据智能方面做的一些工作。我们整个是做数据科学与技术,包括从高性能计算、摇杆、云计算、可视计算、实时检测等等,核心关键是数据采集与通讯、存储与管理、分析与挖掘到建模与展示,以及在上面我们构造了若干的应用,包括了智慧城市、健康医药、公共安全还有电子商务等等。

下边简单举个例子,是关于智慧城市方面的例子。我们在后台搭了这样一个云服务平台,云服务平台管理了过滤资源、虚拟资源以及数据资源,数据资源要清洗融合的数据资源才有用。然后在云服务平台上面,包括了资源的管理,还有车辆调度,还有系统的监控、管理等等。还有在上面构筑了大数据的引擎,包括了存储管理、分析挖掘、模式融合,以此来支撑图的计算,还有流程计算、批处理。然后在上面支撑若干个示范应用,包括了智慧交通,还有智慧城市,还有是跨层次的统一的安全可靠体系,包括了从系统的层面安全保障,还有数据层面安全保障,还有应用层,还有服务接入层的安全保障。

在这个基础上面,我们提供了若干的数据服务生态,在云服务平台上面,包括实时在线监控、实时调动、数据分析以及推荐等等。这是大数据服务的一个点,我们现在的数据来自于五花八门,来自于批处理的数据,来自于实时数据,还有来自于在线报表的数据,这些数据首先需要接入,首先需要数据的规范标准需要有定义,然后接入这个数据,在上面做清洗,然后整合关联,就是我们统称为多元多模数据的荣格。在此基础上,我们做分析、挖掘,这样提供了数据共享的交换平台,以及数据适应服务,以此支撑应用,城市管理应用、还有一些信息服务等等。这些是一个点,关键是多元数据的融合,除了交通、运输环节之外,我们还融合了像地图数据、视频监控数据、气象数据、社交网络数据,以及在移动终端上的信息,整个数据融合来实现我刚才所说的支撑这些功能。

核心思想是什么?我们怎么做这个事?这又回到AlphaGO,AlphaGO是下棋,我现在把整个城市路网当作一盘棋来管理,这样能够体现整个城市规划的最优化,怎么来做呢?就像我们布一个公交站,它有一个市,我们布一个电动车充电桩,它也有一个市,市与市连接,就构成了我们的核心。

我们现在有了深圳市所有核心关键的交通数据,包括公交车数据、地铁数据还有部分物流车数据,还有深圳一卡通的交易数据。而且这些数据并不是说离线数据,并不是说做备份数据,而是做实时在线,真正提供了在线服务。这些是数据服务其中几个点,包括基本的原操作部分,数据的顾虑,还有地图匹配、交通感知、路况聚类、时空数据存储等等,高层包括动态OD分析、实时路径推荐还有电子站牌等等,下面我简单举个例子介绍一下。

首先说一下GPS的数据质量,数据质量是物联网数据中间的核心关键,我们说提取来的数据并不是说完全马上能用,比如就像GPS数据,GPS精度影响受很大程度影响,在GPS上面产生的数据,很大程度上会带来GPS的漂移,原因是速度过快,以至于GPS响应时间短,还有高大建筑,以及天气等等因素,经过多次折射、反射也会影响,造成数据信号的误差。

这里举个例子,这张图是GPS漂移的图,我们看24号点,这个是GPS漂移数据,这个时候你就不知道这个数据是漂移,还是真正跑到那个地方,那个时候就需要有一个阀则处理,这个时候阀则定义不好,就会对后面决策影响起到很大影响作用。

还有数据过滤,也包括了如何保证数据的可靠性,包括数据的冗余、数据格式、数据延迟、稀疏数据、GPS精度同样还有异样数据检测过滤等等的工作。

这个是压缩感知,因为我们说用出租车作为样本推测深圳市道路情况,但是甚至是出租车有限,所以我们用压缩感知来推测,包括还有数据融合,包括时间、空间还有纬度、多目标、数据的多元、多模融合等等。我们在整体层面做了几个市场应用包括客流分析,我们发现客流特征知道了区间车开设、进行了疏导。人的聚类后进行行政区域划分,但是单一数据包括用手机的数据,用地铁的数据,用出租车的数据都有偏颇,都不完整,都需要有一个比较客观的,通过多元多模数据融合,才能进行客观分析。

这里我们做的另外一个,城市黑洞,是如何避免人群拥挤的情况,这是通过历史数据、实时数据融合、实时数据与模型预测相结合得出来的。

我们做了公交在手,现在的电子站牌,大家常用的称公交车的交通在手,就是我们这边开发的。

还有实时在线路径推荐,比如从某一个点到哪一个点,这个是根据实时路况推荐。还有充电桩的推荐,这些都是实时数据,这两个车可以到距离最近的充电站,但是两个车都往这边走,这个时候他就会主动推荐你到另外一个充电站。

最后,总结一下,我的感觉,我们说谈数据智能,首先云计算、大数据,我的体会云计算是设备生命在应用,数据是生命之源,大数据为云计算创新应用注入新的活力,核心关键是大数据开启了智能新时代,谢谢大家!

分享到:
咨询及招商热线:0574-87052113   
Copyright © 2011 www.cnsce.net All Rights Reserved
智博会  宁波国际会议展览中心有限公司 版权所有   浙ICP备2022036104号    访问人数:
在线客服
工作时间:
09:00-17:00
周一至周五