11 月 27 日消息,多年来,针对特斯拉 FSD 技术路径的一个核心批评在于:其缺乏“常识性推理能力”。FSD 在驾驶的基本操作层面,如车道保持、制动与转向,表现出色;尤其是 FSD v13 与 v14 版本取得了显著进步,但在应对复杂场景所需的高阶推理任务上仍显力不从心。
例如:当一名施工人员手持“慢行”(Slow)标识牌时,车辆能够及时停车;但它能否进一步理解:该工人此时正背对车流、与旁人交谈,并一边挥手示意车辆通行?又或者,它能否意识到:尽管右侧车道当下车流更快,但由于前方即将出现车道封闭,此刻驶入该车道实属不当选择?
上述正是 FSD 当前在真实世界中仍难以妥善处理的典型场景。为此,特斯拉已开始积极招聘一名人工智能工程师,专门攻关这一问题。该新职位名为“人工智能工程师 —— 强化学习与知识蒸馏”(AI Engineer, Reinforcement Learning and Distillation),其核心职责即是研发更智能、更紧凑的模型架构。
直觉 vs 推理
为理解此项工作的战略意义,我们可回顾特斯拉前人工智能主管 Andrej Karpathy 曾提出的“系统 1”(快速、直觉型)与“系统 2”(缓慢、推理型)双系统认知框架(见下方视频)。这一理论原用于描述人类思维机制。简言之,特斯拉正试图将该框架迁移至其 AI 模型的设计之中。
其中,“系统 1”思维快速、凭直觉、情绪化,适用于驾驶熟悉路线等常规任务;而“系统 2”思维则更为审慎、逻辑严密,常见于应对施工区绕行或复杂高速公路匝道转换等需深度判断的场景。
当前端到端架构下的 FSD,本质上是一个高度精准的“系统 1”:它能以极快反应速度将像素输入直接映射为控制输出,却始终缺失一个专用的“系统 2”,即一个可于行动前对问题展开独立推理的并行认知模块。
事实上,特斯拉此次招聘启事亦坦承了这一局限:“此类模型在真实物理世界的推理任务中仍显不足,甚至常难以准确区分左右方向。”
知识蒸馏:推理能力落地的关键
据IT之家了解,职位名称后半部分的“蒸馏”(Distillation),正是使“系统 2”推理能力得以在量产车辆上部署的核心技术路径。原因在于:高阶推理模型体量庞大,其计算开销与推理时延远超行驶中车辆所能承受的极限,用户不可能容忍汽车为决定“该走还是该停”而思考长达 10 秒。
解决方案即“知识蒸馏”:特斯拉计划在其数据中心内训练巨型“系统 2”推理模型,使其扮演“教师”角色,针对数百万复杂驾驶边缘案例生成高度精准的推理结果。随后,这些“教师”输出的优质决策可被用于训练体积更小、推理更迅捷的“学生”模型,使其能与 FSD 并行运行于车载本地推理芯片(如 HW3)之上。
最终成果,将是一台兼具“推理天才”般判断力与“像素 → 控制”毫秒级响应能力的智能汽车。
值得注意的是,知识蒸馏不仅是一种性能优化手段,对于搭载 HW3 硬件的用户而言,它更是进入 FSD v14 时代的唯一技术桥梁。
HW3 的出路何在?
从宏观视角看,知识蒸馏正是特斯拉构建 FSD v12.6.4 的技术路径:该版本实为 FSD v13.2.9 的“蒸馏简化版”。一旦物理推理能力取得突破,这批工程师或将转向开发此前在 2025 年第三季度财报电话会上提及的“FSD v14-Lite”简化版本。
推理能力:从监督迈向无监督的关键跃迁
此次人才招募信号清晰表明:特斯拉正超越“堆数据训练”的既有范式,转向重塑车辆的前瞻思考机制,即从单纯的“行为模仿”,迈向对周遭物理世界建立真正意义上的理解。
对于当前导致 FSD 频繁犹豫、触发“红色双手”警示的各类边缘案例,该推理层极有可能成为其从“监督学习”迈向“无监督自主决策”的最后一座桥梁。
值得期待的是:尽管特斯拉尚未实质性涉足推理领域,但该方向有望带来比 v13 至 v14 版本间那些细粒度迭代更为显著、更易被用户感知的技术跃升。