特斯拉FSD 12直播首秀!45分钟仅一次干预 视频“喂”出AI“代驾” 特斯拉FSD 12直播首秀!45分钟仅一次干预 视频“喂”出AI“代驾”
admin
2023-08-28 17:29:26
0

《科创板日报》8月28日讯(编辑 郑远方)正如之前承诺的一样,马斯克上周末用一辆搭载HW3的Model S,向外界直播展示了特斯拉FSD 12测试版。

在这场45分钟的直播中,坐在方向盘后、举着手机的马斯克仅干预了一次车辆行为,车辆在非预设道路上,便能自行礼让行人、避开路障、路口转向、在两条直行道中选择一条车少的。


马斯克表示,FSD 12可以在不熟悉的环境中离线使用;若有干预行为发生,系统会记录并发回特斯拉分析。

而在直播开始后约20分钟时,马斯克进行了全程唯一一次干预接管。当时,这辆Model S需要直行,因此停下等待红灯。但当左转信号灯转绿时,车辆竟然也紧跟启动,好在马斯克与一旁的工程师及时制止。


在这之后,马斯克表示,要给FSD“投喂”更多左转红绿灯的视频。

投喂视频就能“喂”出“AI代驾”?

实际上,在这场直播中,当车辆自行在减速带减速、避开滑板车骑行者时,马斯克多次强调,FSD 12中没有任何一行相应代码,人为设定车辆作出这些动作——其没有被训练过如何读取路标,也不知道什么是滑板车,FSD 12完成这些行为完全是大量视频训练的结果。通过视频训练数据,AI可以自己学习驾驶,“像人类一样做事”。

如果FSD在特定场景下没有作出正确决策,特斯拉便会向其神经网络训练投入更多数据(主要是视频)。

当然,平庸随意的数据是不够的,供给神经网络的数据需要精心挑选。马斯克也特别强调,来自优秀驾驶员的高质量数据,才是训练特斯拉自动驾驶的关键

“大量平庸的数据并不能改善驾驶,数据管理相当困难。我们有很多软件,可以控制系统选择什么数据、训练什么数据。”

而对特斯拉而言,其数据的一大主要来源便是来自全球各地的车队。马斯克还透露,特斯拉在世界各地拥有多名FSD测试驾驶员,包括新西兰、泰国、挪威、日本等。

从2020年起,特斯拉便开始将Autopilot决策从编程逻辑转向神经网络与AI。经过3年的发展,从本次马斯克的FSD 12直播也能看到,几乎整个决策与场景处理已转移至特斯拉神经网络与AI上。

FSD 11独占控制堆栈中有超过30万行C++代码,而12中代码寥寥。之前马斯克也曾指出,车辆控制(vehicle control)是“特斯拉FSD AI拼图”上的最后一块拼图,其将使得这30万行以上的C++代码减少约2个数量级。

▌全AI端到端驾驶控制

特斯拉FSD 12是其最重要的一次升级,实现了全AI端到端的驾驶控制

至于为何选择端到端方案?马斯克直播之前与WholeMars连线时,给出了更多细节。

“人类就是这么做的,”他表示,“光子输入,手脚动作(控制)输出。”——人类依靠眼睛和生物神经网络开车,对于自动驾驶而言,摄像头与神经网络AI便是正确的通用决策方案

虽说AI神经网络难以解释具体细节,但相应地,人类乘客在打车时,也无法准确地知道司机在想什么,只能看到司机的评价。

券商指出,端到端方案与之前的关键区别之一就在于,传统的模块化架构是将智能驾驶拆分称单独任务,交由专门的AI模型或模块来处理,例如感知、预测、规划等;而端到端AI则是“感知决策一体化”,即将“感知”与“决策”融合到一个模型中。

目前,特斯拉绝大多数训练还是需要依靠英伟达的GPU,特斯拉自家的Dojo超算则是作为辅助。今年以来,特斯拉已为训练花费了20亿美元

特斯拉还正在加班加点,筹备一个新算力集群,其中包含1万颗英伟达H100,有望在本周一(8月28日)上线。值得一提的是,该集群使用的是Infiniband进行连接传输,马斯克更坦言,如今Infiniband比GPU更缺

相关内容

热门资讯

linux入门---制作进度条 了解缓冲区 我们首先来看看下面的操作: 我们首先创建了一个文件并在这个文件里面添加了...
C++ 机房预约系统(六):学... 8、 学生模块 8.1 学生子菜单、登录和注销 实现步骤: 在Student.cpp的...
JAVA多线程知识整理 Java多线程基础 线程的创建和启动 继承Thread类来创建并启动 自定义Thread类的子类&#...
【洛谷 P1090】[NOIP... [NOIP2004 提高组] 合并果子 / [USACO06NOV] Fence Repair G ...
国民技术LPUART介绍 低功耗通用异步接收器(LPUART) 简介 低功耗通用异步收发器...
城乡供水一体化平台-助力乡村振... 城乡供水一体化管理系统建设方案 城乡供水一体化管理系统是运用云计算、大数据等信息化手段࿰...
程序的循环结构和random库...   第三个参数就是步长     引入文件时记得指明字符格式,否则读入不了 ...
中国版ChatGPT在哪些方面... 目录 一、中国巨大的市场需求 二、中国企业加速创新 三、中国的人工智能发展 四、企业愿景的推进 五、...
报名开启 | 共赴一场 Flu... 2023 年 1 月 25 日,Flutter Forward 大会在肯尼亚首都内罗毕...
汇编00-MASM 和 Vis... Qt源码解析 索引 汇编逆向--- MASM 和 Visual Studio入门 前提知识ÿ...
【简陋Web应用3】实现人脸比... 文章目录🍉 前情提要🌷 效果演示🥝 实现过程1. u...
前缀和与对数器与二分法 1. 前缀和 假设有一个数组,我们想大量频繁的去访问L到R这个区间的和,...
windows安装JDK步骤 一、 下载JDK安装包 下载地址:https://www.oracle.com/jav...
分治法实现合并排序(归并排序)... 🎊【数据结构与算法】专题正在持续更新中,各种数据结构的创建原理与运用✨...
在linux上安装配置node... 目录前言1,关于nodejs2,配置环境变量3,总结 前言...
Linux学习之端口、网络协议... 端口:设备与外界通讯交流的出口 网络协议:   网络协议是指计算机通信网...
Linux内核进程管理并发同步... 并发同步并发 是指在某一时间段内能够处理多个任务的能力,而 并行 是指同一时间能够处理...
opencv学习-HOG LO... 目录1. HOG(Histogram of Oriented Gradients,方向梯度直方图)1...
EEG微状态的功能意义 导读大脑的瞬时全局功能状态反映在其电场结构上。聚类分析方法一致地提取了四种头表面脑电场结构ÿ...
【Unity 手写PBR】Bu... 写在前面 前期积累: GAMES101作业7提高-实现微表面模型你需要了解的知识 【技...