2018~2:自动驾驶中的人工智能

栏目:心理 来源:中国旅游网 时间:2019-05-15

基于深度学习架构的人工智能(AI),例如深度神经网络(DNN),正在全球范围内应用于计算机视觉,自然语言处理,传感器融合,对象识别和自动驾驶项目等领域。自动驾驶初创公司,互联网公司和成熟的OEM正在探索使用图形处理单元(GPU)进行神经网络,以最终使汽车自动驾驶。

行业中最先进的驾驶辅助系统(ADAS)的开发应基于集成和开放平台。开发,仿真,原型设计和实施需要一个完整的解决方案,以实现更智能,更复杂的ADAS,并为自动驾驶汽车铺平道路。本文总结了基于DNN的深度学习架构的现状,该架构建立在车轮上的超级计算机之上,这些超级计算机集成在平台中以推动自动驾驶汽车的未来。

什么是深度学习?

深度学习是开发人工智能最流行的方法。它是一种使机器能够识别和理解它们要运行的世界的方法。神经网络是一组简单,可训练的数学单元,它们共同学习驾驶等复杂功能。[3]

深度学习是将数据转换为计算机程序决策的过程。基于算法的系统的显着差异在于,一旦建立了基本模型,深度学习系统就会自己学习如何完成预期的任务。[4]这些任务包括标记图像和理解口语,以及使无人机能够执行独立任务并使汽车能够自行驾驶。深度学习模仿人类大脑学习世界的方式,识别模式和关系,理解语言和应对模糊性。[5]

神经网络本质上是并行模型。因此,它们非常适合多核GPU,可以在PC,机器人和汽车等行业中找到。 GPU充分利用了这种并行性,非常适合深度学习系统的定义,培训,优化和部署。根据Popular Science,“GPU是现代A.I的主力。”[6]

ImageNet

深度学习进展的一个简单例子是ImageNet大规模视觉识别挑战。这一挑战评估了大规模数千幅图像和视频中物体检测和图像或场景分类的算法。[7]直到2012年,基于传统的计算机视觉(CV)算法,识别对象的速度缓慢提高(识别率低于70%)。 2012年,深度学习的引入导致80%的低位大幅上升,现已超过95%。深度学习现在取代了CV在这次比赛中的使用(见图1)。


图1:ImageNet基准测试中传统CV和深度学习的进展。如需更高分辨率,请点击此

 

高科技产业的深度学习

Facebook是首批采用GPU加速器来培训DNN的公司之一。 DNN和GPU在新的“Big Sur”计算平台和Facebook AI Research(FAIR)专用系统中发挥着关键作用,该系统专为神经网络培训而设计。 Facebook描述了其目标,即推进机器智能领域和开发技术,为人们提供更好的沟通方式。[8]

谷歌也在大力投资深度学习流程。 TensorFlow是谷歌第二代机器学习系统,旨在了解大量数据和模型。它的架构非常灵活,并且已经应用于各种感知和语言理解任务,例如在许多应用程序(电子邮件,机器人,自然语言处理,地图等)中识别和分类图像,语音和文本。谷歌使用数千个GPU,与CPU等价物相比,性能提升了十倍。[9]

根据谷歌从事简历和机器学习的研究科学家Anelia Angelova的说法,她的公司也在其用于行人检测的自动驾驶汽车项目中探索基于级联DNN的深度学习。[10]

 

自驱动循环

图2:自驱动循环。

 

图2显示了自驱动环的主要构建块。目标是通过相机,激光雷达,雷达和超声波传感器感知车辆周围360度。这允许算法准确地理解汽车周围的完整360度环境,以产生稳健的表示,包括静态和动态
对象。使用DNN进行物体的检测和分类可以显着提高传感器数据融合的准确性。然后将该数据用于车辆轨迹的感知,定位,计划和决策的步骤中。

第一步,称为“感知”,涵盖传感器融合(组合各种传感器数据),物体检测(“有一个物体”),分类(“它是行人”)和分割(“向右侧”)用于检测和跟踪(“X向左移动”)。

第二步,称为“本地化”,包括地图融合(不同的地图源),地标和GPS三边测量。要知道自动驾驶汽车的确切位置对于车辆系统能够安全地沿着道路行驶来说非常重要。集成高清地图数据(例如地图领导者HERE)的能力对于计算车辆的确切位置至关重要。

最后,“路径规划”步骤包括车辆的轨迹和行为。无人驾驶汽车需要能够在高度动态的环境中安全地驾驶任何潜在的危险。采用复杂的算法来计算自由空间(车辆可以安全驾驶的地方)以及预测环境如何变化。此外,车辆必须以平稳的方式移动,以避免干扰乘客以及其他车辆及其驾驶员。复杂路径规划将所有这些因素考虑在内,最终提供安全和愉快的体验。

但智能相机还不够。每个步骤还需要DNN进行感知,本地化和规划。需要检测和分类物体,需要识别地标,需要调整驾驶行为并且需要做出决定。此外,DNN代表了一个开放式平台,可由不同的汽车原始设备制造商和一级供应商进行扩展和维护,以构建自己的解决方案,并与竞争对手区分开来。


网络。在物体识别中,第一层中的神经元检测边缘,而第二层中的神经元识别更复杂的形状,如从边缘构建的三角形或矩形。在第三层中,区分更复杂的形状,等等。因此,必须选择正确数量的神经元层和特征(称为神经网络框架)来解决特定问题。

自驾车项目具有挑战性,因为拥挤城市的驾驶情况非常复杂且难以预测。因此,需要组合许多不同的传感器和数据以便定位车辆,感知行驶状况,规划行驶路径并控制车辆。

这种情况非常适合深度学习。现在,可以选择像Caffe这样的神经网络框架模型进行训练。 Caffe是由伯克利视觉和学习中心以及社区贡献者开发的深度学习框架。它是专门针对表达,速度和模块化而开发的,因此非常适合自驾车挑战。[11]

图3:DNN对象识别。如需更高分辨率,请点击此

 

作为下一步,所选框架需要接受任务训练,例如,对象识别和分类。像体育训练一样,训练DNN需要教练,指导神经网络如何响应触发器的人。评分函数确定所需响应与实际响应之间的差异,称为预测误差(图4)。在网络中的每个神经元处,误差用于调整模型中神经元之间的连接的权重(或偏差)值。因此,对于相同输入的触发器,网络响应中的错误将更少。[12]这种权重的调整响应于外部刺激(例如,驾驶场景)而发生,而无需程序员的直接干预。

图4:DNN训练循环

 

有能力去
 

深度学习流程

DNN代表神经的多个处理层执行培训时,开发人员首先必须通过驾驶场景图像创建数据库,并通过使用正确的对象类型(例如,奥迪A7)标记它们或正确的驾驶决策来为训练做好准备。一旦开发了数据库,就可以配置框架模型并执行培训。

接下来,基于记录或模拟的驾驶场景在离线驾驶测试中验证训练的网络。经过验证,它可以部署在自动驾驶ECU中并进行道路测试。对于自动驾驶系统的其他基于DNN的部件(例如,轨迹规划)必须遵循相同的步骤。因此,需要端到端系统来训练,测试然后部署神经网络。

图5:驾驶场景

 

图5显示了一个逼真的驾驶场景。以上视图是美国高速公路上实际记录的驾驶情况。数据被输入基于DNN的自动驾驶系统。下面的窗口显示结果。实际驾驶中心的白色车辆识别左侧的两辆车(灰色)和右侧的车辆。基于它们的相对速度,位置和其他数据,路径规划系统计算可能的轨迹(绿色车道)并最终决定在哪里开车(停留在当前车道上)。

NVIDIA DRIVE™解决方案

图6:端到端深度学习平台

 

NVIDIA提供了一个集成平台(图6),用于自动驾驶车辆的培训,测试和部署。 NVIDIA DRIVE解决方案为汽车制造商,一级供应商和汽车研究机构提供动力和灵活性,以开发能够让汽车看到,思考和学习的系统。解决方案平台以NVIDIA DGX-1开始,这是一款深度学习的超级计算机,可用于通过将DNN暴露于车辆行驶时收集的数据来训练DNN。另一方面,是NVIDIA DRIVE PX 2(自动驾驶汽车电脑),它利用这种培训做出推断,以实现汽车在路上安全地前进。这两者之间的联系是NVIDIA DriveWorks,这是一套软件工具,库和模块,可加速自动驾驶车辆的开发,仿真和测试,包括高清映射的集成。

DriveWorks通过在车轮上的DRIVE PX 2超级计算机上运行的复杂算法管道,实现传感器校准,环绕数据采集,同步和记录,以处理传感器数据流。

KITTI基准

NVIDIA使用NVIDIA DRIVE解决方案开发了自己的物体检测系统,该系统采用名为DRIVENet的神经网络框架。在五个月的时间里,该解决方案在KITTI基准测试中取得了第一名,而DRIVENet则实时执行。前五个分数也在NVIDIA GPU上执行。 KITTI视觉基准套件由卡尔斯鲁厄理工学院和芝加哥丰田技术研究所共同开发,并对不同的物体识别实施进行了比较。[13]

图7:KITTI基准测试结果。如需更高分辨率,请点击此

 

许多汽车公司已经在使用NVIDIA的深度学习技术来推动他们自主驾驶的努力,并且与传统技术的使用相比,他们在培训网络时的速度提升了30-40倍。其中包括宝马,戴姆勒和福特以及Preferred Networks和ZMP等创新型日本初创公司。奥迪能够在四小时内训练DNN,以超越智能相机,该相机花了两年的时间与第三方共同开发。沃尔沃汽车公司正在驾驶真实汽车使用DRIVE PX 2,这款汽车将在其Drive Me项目中驾驶瑞典哥德堡。

 

外表

据BI Intelligence称,到2020年,估计将有1000万辆汽车开着自动驾驶功能。[12]其中很大一部分将包括人工智能来感知环境,定位他们的位置并驾驭最复杂的交通情况。

图9:具有自动驾驶功能的预期汽车增长[3]

竞争掌握自动驾驶挑战刚刚开始,越来越多的新公司正在加入竞争。像Future Mobility,Atieva,Faraday Futures这样的初创公司的一个共同主题是创建一个自动电动汽车,与现有原始设备制造商的100多个ECU和大量资金相比,集中ECU更少。最终,我们将在车辆中看到越来越多的计算马力,并将分布式ECU整合到集中式汽车计算机中,从而在车轮上创建自动超级计算机。

    深度学习简介,GTC 2015网络研讨会,NVIDIA,2015年7月http://on-demand.gputechconf.com/gtc/2015/webinar/deep-learning-course/intro-to-deep-learning.pdf
    2016年2月17日,资本市场实验室Ophir Gottlieb,技术的皇冠宝石粉碎了收益,http://ophirgottlieb.tumblr.com/post/139506538909/the-crown-jewel-of-technology-just-crushed
    谷歌发布的TensorFlow可能会改变人工智能的未来,David Tuffley,2015年11月13日,PHYS.ORG http://phys.org/news/2015-11-google-tensorflow-game-changer-future -ai.html
    Facebook开源人工智能背后的计算机,Dave Gershgorn,2015年12月10日,热门科学http://www.popsci.com/facebook-open-source-hardware-behind-artificial-intelligence
    IMAGENET大规模视觉识别挑战赛(ILSVRC),http://www.image-net.org/challenges/LSVRC/
    Facebook AI Research(FAIR),https://research.facebook.com/ai
    谷歌的开源机器学习系统:TensorFlow,迈克舒斯特,谷歌,2016年1月15日,NVIDIA会议,东京,
     深度学习使无人驾驶汽车更好地发现行人,Jeremy Hsu,2016年2月9日,IEEE Spectrum http://spectrum.ieee.org/cars-that-think/transportation/advanced-cars/deep-learning-makes-driverless-cars - 更好的-AT-点滴行人
    CAFFE,Yangqing Jia,http://caffe.berkeleyvision.org/
    神经网络的基本概念,柴郡工程公司,http://www.cheshireeng.com/Neuralyst/nnbg.htm
    KITTI Vision Benchmark Suite,http://www.cvlibs.net/datasets/kitti/
    Chris Dixon,Andreessen Horowitz,博客https://medium.com/@cdixon/comma-ai-e62eea5fa8d2#.3a9n5fd2u




相关文章
评论
新版评论功能开发中
头条推荐
最新资讯