百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 编程网 > 正文

特斯拉“行为克隆”技术曝光:无需写代码,实现全自动驾驶?

yuyutoo 2024-10-22 18:43 7 浏览 0 评论


【新智元导读】特斯拉最近曝光“行为克隆”技术,系统研究人类在各种场景中的驾驶动作并加以模仿。巧合的是,自动驾驶第一大厂Waymo不久前也在公布了模仿学习中的技术细节。模仿学习会成为全自动驾驶的一条捷径吗?

全自动驾驶的“捷径”来了?

知情人士表示,特斯拉汽车收集了大量的来自摄像头和其他传感器的数据,即使Autopilot系统没有开启,开发团队也可以研究传统的人类在各种场景中的驾驶动作并加以模仿。

这种技术被称为“行为克隆”,实际上是一种模仿学习(imitation learning)。

系统使用模仿的信息作为车辆在特定情况下决定驾驶方式,比如,行驶弯道或避开前方目标等。

无独有偶,为了模仿专家驾驶,自动驾驶大厂Waymo不久前也创建了一个名为ChauffeurNet的深度RNN,该网络通过观察场景的中层表示作为输入,训练它发出驾驶轨迹,最终的结果能超越纯粹的模仿。

此外值得注意的是,上周AlphaStar战胜人类选手之,就涉及到模仿学习。AlphaStar只通过观察人类如何玩游戏,就能模仿学习策略,最后将信息用于训练各种智能体。

现在,自动驾驶界的两只领头羊都在尝试做模仿学习,这会成为全自动驾驶的一条捷径吗?

特斯拉行为克隆:未来人们不需要写代码了

特斯拉的自动驾驶系统Autopilot的核心功能与其他半自动驾驶系统和全自动驾驶系统类似:在Autopilot可以运行之前,特斯拉从汽车的传感器(如前置摄像头)收集数据。

之后公司雇人对图像中的汽车和其他物体进行数字标记,然后将一些图像输入神经网络计算系统,该系统会对其他车辆及其行进方式进行模式识别,并且随着时间的推移提高车速。

通过神经网络提供足够的真人驾驶数据,网络就可以学习如何在大多数情况下直接预测正确的转向、制动和加速行为。

但特斯拉不同的地方在于,“行为克隆”让Autopilot开发团队也可以研究传统的人类驾驶在各种场景中的动作,从而加以模仿。

这样做的结果是,你不需要任何其他东西来教系统如何自主驾驶,在未来,人们不需要编写代码来告诉汽车在遇到特定情况时该怎么做,因为汽车自会知道该怎么做。

这个概念被特斯拉的一些工程师称为“软件2.0”。

深度理解模仿学习:未来或能交叉预测其他智能体的反应

“软件2.0”可能是一种产品概念,“行为克隆”的背后是技(学)术概念——模仿学习。

目前,特斯拉对于模仿学习的详细介绍资料比较少,但是Waymo去年11月发的一篇论文,可以窥见模仿学习的部分技术原理。

Waymo创建的ChauffeurNet的深度递归神经网络(RNN),通过观察场景的中级表示作为输入来训练该网络生成驾驶路线的轨迹。中级表示不直接使用来自传感器的原始数据,从而可以将感知任务分解出来,能够将真实数据和模拟数据相结合,更容易地进行迁移学习。

如下图所示,输入表示包括一个自上而下(鸟瞰)环境视图,其中包括地图、周围物体、交通信号灯状态、车辆过往的运动等信息。该网络还能够给出谷歌地图风格的路线,引导车辆前往目的地。

为驾驶模型渲染输入和输出。上排从左至右:路线图、红绿灯,限速和路线。下排从左至右:当前智能体框、动态框、过往智能体姿势,未来智能体姿势输出。

ChauffeurNet在每次迭代期间会沿着未来的驾驶轨迹输出一个点,同时将预测点写入在下一次迭代期间使用的存储器中。从这个意义上讲,这个RNN并不是传统式的,因为存储模型是定制化的。

接着,ChauffeurNet将由十个未来的点组成的轨迹输出到一个低级控制器,该控制器将这个轨迹转换为对车辆的控制命令,比如转向和加速,来驱动汽车。

此外,Waymo还采用了一个单独的“感知RNN”头,能够迭代式地预测环境中其他移动物体的未来轨迹,并且这个网络与预测车辆驾驶的RNN共享特征。

ChauffeurNet内部分为两个部分,FeatureNet和AgentRNN。 AgentRNN使用过去智能体姿势的渲染图像、由渲染输入的卷积网络“FeatureNet”计算出的一组特征、具有最后一个智能体框渲染的图像,以及具有预测渲染的显式存储器,来预测下一个智能体姿势和自上而下视图中的下一个智能体框。这些预测用于更新AgentRNN的输入,以预测下一个时间步长。

未来的一种可能是,车辆可以在选择自己的驾驶轨迹的同时,更深入地交叉预测其他智能体的反应过程。

模仿学习是“捷径”还是“普通路径”?

“行为克隆”也好,“软件2.0也好”,利用神经网络编写代码来自动驾驶,从而取代人类编写的代码,看上去可能是未来全自动驾驶的捷径之一。

不过,特斯拉“行为克隆”的也有其局限性:这种方法不能教Autopilot系统处理无法轻易预测的危险情景。比如,老司机看到飘在前方的塑料袋时不会转向,但自动驾驶系统可能就会。

这也是自动驾驶存在的识别训练数据相关性问题,它不能通过纯粹观察相关性来构建因果模型,并且无法在模拟中主动测试反事实。

另外,传统方法实现完全自动驾驶系统,需要能够处理现实世界中发生的长尾事件。

长尾事件的解决需要深度学习训练尽可能多的数据,但现实情况往往是缺少有效训练数据。

一位长期从事自动驾驶的业内人士告诉新智元,“行为克隆”是快速收集大量数据的捷径,但网络传输速度和计算量都太大了。“至于是不是实现无人驾驶的捷径,要看能不能搞出真正能用的系统。

驭势科技CEO吴甘沙告诉新智元,模仿学习的主要局限是数据的可获得性和有效性,比如影子模式可能解决了可获得性,但也包括了不值得提倡的司机行为。另一方面,它还是端到端的,在可解释性上才刚刚有些进展。同时,因为是端到端,比较难在中间过程中接受其他的信息或指令。

吴甘沙认为,模仿学习“肯定是路径之一,或者是决策的一个来源,但目前来看还不能作为唯一决策方法。”

One more thing:特斯拉AI芯片专利曝光

据Hot Hardware报道,特斯拉向美国专利商标局提交的专利中提到,传统处理器可以快速执行单个数学运算,但它有一个限制:这样的处理器一次只能处理少量数据。

虽然GPU可以使用更大的数据集执行多个任务,但它们最初并不是为机器学习和AI开发的。

特斯拉的AI芯片专利内容如下:

“用于机器学习和人工智能的处理通常需要对大量数据集执行数学运算,并且通常涉及求解多个卷积层和汇集层。”

为了解决这个问题,特斯拉必须开发一种新的神经AI,可以进行“机器学习和人工智能特定的处理操作”。

因此,特斯拉提交了一些专利:

  • 加速的数学引擎
  • 具有可变延迟存储器访问的计算阵列微处理器系统
  • 使用非连续数据格式的计算阵列微处理器系统
  • 矢量计算单位。

目前,Autopilot 2.0的计算机组件由英伟达GPU提供支持。

同时,即将推出的升级版本将取代特斯拉目前使用的Autopilot 2.0平台,使用AI芯片的Autopilot 3.0能够在汽车中实现全自动驾驶功能。

参考资料:

https://medium.com/waymo/learning-to-drive-beyond-pure-imitation-465499f8bcb2

https://www.theinformation.com/articles/what-makes-teslas-autopilot-different

https://www.reddit.com/r/MachineLearning/comments/aklwv8/n_report_tesla_is_using_behavior_cloning_ie/

相关推荐

Docker部署 chatgpt-web-midjourney-proxy:开启一站式AI与绘图

ChatGPT和Midjourney的结合无疑是创新性的突破。ChatGPT作为强大的语言模型,能够为用户提供智能的对话和文本生成服务。而Midjourney则以其出色的绘画能力,能够根据...

Cacti监控服务器配置教程(基于CentOS+Nginx+MySQL+PHP环境搭建)

具体案例:局域网内有两台主机,一台Linux、一台Windows,现在需要配置一台Cacti监控服务器对这两台主机进行监控...

那些少为人知却非常有意思好用的 Chrome 扩展

ChromeWebStoreSessionManager要睡觉了,还有网页没看完怎么办?等明天点开歷史记录重新加载?No!有这个保存当前打开的链接,下回直接打开一串网址,好顶赞有木有!!!chr...

分享一款轻量级 HTTP(S) 代理 TinyProxy

概述众所周知,我们常用的Web服务器Nginx/Apache都可以很方便的用来做为正向或反向代理服务器使用。但是它们都并不支持HTTPS的正向代理。Nginx做为正向代理不支持HT...

深入理解 WebSecurityConfigurerAdapter「源码篇」

我们继续来撸SpringSecurity源码,今天来撸一个非常重要的WebSecurityConfigurerAdapter。我们的自定义都是继承自WebSecurityConfigurer...

RPC、Web Service等几种远程监控通信方式对比

几种远程监控通信方式的介绍一.RPCRPC使用C/S方式,采用http协议,发送请求到服务器,等待服务器返回结果。这个请求包括一个参数集和一个文本集,通常形成“classname.meth...

老酒好喝,5G时代数据中心柴油发电机组以GPRS方式接入动环监控

背景:随着手机的普及,电信运营商基站越建越多,网络覆盖范围也越来越广,基本上随时随地都能通过运营商的网络上网冲浪,这给我们传统的通过有线方式实现的动环监控也提带来了新的启发:对于不具备有线传输条件的的...

为了春节红包大战,微信做了一次成功的预热!

经过上午的预告,微信在今天下午17:00正式推出了微信红包新玩法——红包照片。微信用户在朋友圈点击照片发送按钮,会看到“红包照片”选项,用户在选择发布照片之后,这张照片将被模糊处理后,再发送到朋友...

Proxy-Lite实战:3步部署+2个案例,轻松掌握轻量级网页自动化

大家好,我是何三,80后老猿,独立开发者一、Proxy-Lite模型概述...

会Python?那么你一定要试一试mitmproxy

mitmproxy是一款工具,也可以说是python的一个包,使用这个工具可以在命令行上进行抓包(现在也可以在web页面上查看上抓的数据包了),还可以对所抓到的包进行脚本处理,非常有用。和...

十大Web安全扫描工具,你知道哪些?

初入门时,喜欢将目标站点直接丢扫描器,慢慢等扫描结果,极度依赖Web扫描器;而有一些漏洞高手,善于运用运用各种工具但并不依赖工具,经常可以找到扫描工具发现不了的漏洞。一款好用的Web扫描器对于白帽子来...

鸿蒙5网页开发神器 ArkWeb:让 Web 和原生手拉手跳舞

你有没有想过,在鸿蒙应用里既能用原生代码写高性能界面,又能直接塞进一个网页?这听起来有点像把汉堡和披萨拼在一起,但ArkWeb(方舟Web)真的做到了!今天咱们就聊聊这个神奇的工具,看看它如何让...

MapReduce过程详解及其性能优化(详细)

从JVM的角度看Map和ReduceMap阶段包括:第一读数据:从HDFS读取数据1、问题:读取数据产生多少个Mapper??Mapper数据过大的话,会产生大量的小文件,由于Mapper是基于虚拟...

大数据平台建设需要掌握的14个知识

Q1、大数据分析中的实时推荐是如何实现的?@rein07某证券系统架构师:实时推荐需要使用实时处理框架结合推荐算法,从而做到对数据的实时处理和推荐。实时处理框架有Storm、Flink、Spark...

HDFS可视化管理系统设计与实现(hdfs的可靠性设计,主要依靠哪些机制来实现)

摘要:Hadoop工具核心模块包括分布式文件系统(HadoopDistributedFileSystem,HDFS)和分布式编程模型MapReduce,其中HDFS是Hadoop数据存储处理的...

取消回复欢迎 发表评论: