---
title: "特斯拉的 “纯视觉” 路线，不是所有人都学得来"
type: "Topics"
locale: "en"
url: "https://longbridge.com/en/topics/10465548.md"
description: "BEV+Transformer+ 占用网络技术路线的大热，再次将激光雷达推向风口浪尖。激光雷达该不该被抛弃？对车企来说，这是一个艰难的抉择：是坚定不移跟随特斯拉走具有「性价比」的纯视觉路线，还是采用看起来「成本稍高」的激光雷达融合方案？要回答这个问题并不难——尤其是当你洞悉事情的真相是反常识的时候。比如，去除激光雷达，看起来减掉的是智能驾驶系统的 BOM 成本，整车成本也随之下降了..."
datetime: "2023-11-09T10:14:28.000Z"
locales:
  - [en](https://longbridge.com/en/topics/10465548.md)
  - [zh-CN](https://longbridge.com/zh-CN/topics/10465548.md)
  - [zh-HK](https://longbridge.com/zh-HK/topics/10465548.md)
author: "[汽车之心](https://longbridge.com/en/profiles/3726156.md)"
---

> Supported Languages: [简体中文](https://longbridge.com/zh-CN/topics/10465548.md) | [繁體中文](https://longbridge.com/zh-HK/topics/10465548.md)


# 特斯拉的 “纯视觉” 路线，不是所有人都学得来

BEV+Transformer+ 占用网络技术路线的大热，再次将激光雷达推向风口浪尖。

激光雷达该不该被抛弃？

对车企来说，这是一个艰难的抉择：是坚定不移跟随特斯拉走具有「性价比」的纯视觉路线，还是采用看起来「成本稍高」的激光雷达融合方案？

要回答这个问题并不难——尤其是当你洞悉事情的真相是反常识的时候。

比如，去除激光雷达，看起来减掉的是智能驾驶系统的 BOM 成本，整车成本也随之下降了，但冰山之下的隐性成本增加了多少，你计算过吗？

再比如，占用网络的白名单可以覆盖包括机动车、行人、两轮车、锥桶、水马、路面、树木等十几个常见的「道路物体」，但白名单之外的物体，它能看见吗？

在城市 NOA 大规模落地前夕，整个智能驾驶行业需要重新审视纯视觉方案背后的成本和技术难易程度，以及激光雷达的核心价值。

「抄特斯拉作业」是否是最佳选择？在城市 NOA 落地浪潮下，车企如何集中优势发挥所长？

这些都是需要被优先考虑的问题。

_**01**_ **模仿特斯拉，不该忽略纯视觉路线背后的「隐性成本」**

「4 颗以下，请别说话。」这可能是此前汽车行业「卷」激光雷达最出圈的表达。

到今天，激光雷达仍然是绝大部分头部车企新车的标配。从蔚小理，再到华为（问界、阿维塔）、极氪、零跑，激光雷达在国内能够快速量产上车，很大程度上是由他们直接或间接推动的。

激光雷达的风靡，来自其带给消费者的科技感和安全感。

而当「降本」的旋风刮来，在特斯拉跑通纯视觉方案之后，「去激光雷达」的声音又此起彼伏。

短期看，拿掉激光雷达，「降本效果」立现。

然而从长期看，车企需要为这一选择投入更多的研发资源。

禾赛科技战略负责人施叶舟认为，「在考虑成本的时候，不能够只看到硬件成本，实际上更要考虑背后所需要各种研发服务和资源投入，也就是『全成本』——除了冰山上面的显性成本（硬件、BOM 成本），还有大量被忽视的隐性成本。」

这里所称的纯视觉技术路线中的「隐性成本」，包括算法、路测、云计算、数据标注、仿真训练和系统软件等。

特斯拉前 AI 高级总监 Andrej Karpathy 曾在公开演讲时说到：「纯视觉能够精准感知深度、速度、加速度信息，实现纯视觉是一件困难的事情，还需要大量数据。」

换句话说，特斯拉作业并不好抄，门槛和壁垒极高。

这主要体现在三个方面：

一是海量数据。

特斯拉的自动驾驶算法是业内公认能力最强、投入最大、研发最早的。截至目前，特斯拉 FSD 累积行驶里程已超 5 亿英里，Autopilot 使用里程已经超过 90 亿英里。

特斯拉的自动驾驶系统每天可以接收到车队回传的 1600 亿帧视频数据，支持神经网络训练。众所周知，数据积累取决于累计交付量和行驶里程，如此大的数据体量，也意味着需要投入大量的时间成本。

其次是自研芯片。

特斯拉自 2014 年开始自研芯片之路，2019 年发布了 FSD 自研芯片。

为了提升数据处理能力，为进一步的深度学习量身定制，2021 年 8 月，特斯拉发布了用于神经网络训练的自研芯片 D1，D1 芯片基于 7nm 工艺打造，算力可达 362TFLOPS。

D1 芯片具备较强的可扩展性，25 个芯片可组成一个计算模块，而 120 个计算模块可以组成外界熟知的「Dojo ExaPOD」超级计算机。

第三是围绕算法训练搭建的超算中心。

在特斯拉自建的大数据中心中，使用了 14,000 片 GPU 芯片，其中 10000 片用于 AI 训练的 H100，4000 片用于数据标注。

据了解，一片 H100 芯片官方售价 3.5 万美元，尽管在黑市被炒到 30~40 万元人民币，依然是「一片难求」。

特斯拉上线 H100 GPU 集群的同时，还激活了自研的超级计算机群组 Dojo ExaPOD，开启云端算力竞赛，以支持自动驾驶技术的更新迭代。

Dojo 于 2023 年 7 月开始生产部署，马斯克曾表示，到 2024 年，特斯拉还将向 Dojo 再投资 10 亿美元。预计到 2024 年 10 月，Dojo 算力会达到 100Exa-Flops。

从这个角度看，光是算法训练的芯片投入就十分惊人，达到数十亿元。

基于这样的数据，我们可以做一个简单的数学推算：

假设要开发一个特斯拉式纯视觉路线的高阶智能驾驶系统，这个方案总投入大约在 200 亿元。

试想一下，要压低这个成本需要多大规模的销量？

——当汽车销量到 2000 万辆时，每辆车的自动驾驶成本可以降到 1000 元。

——而当汽车销量只有几十万、上百万辆时，这笔投入该如何摊销？

当前，特斯拉累计销量超过 400 万辆，其所释放的规模效应让友商们难以企及。因此，特斯拉选择视觉路线，不只是「算法能力强」，更是建立在巨大的保有量、车载芯片自研、数据回环和自动化标注、自建超算中心训练模型等一系列能力之上的综合实力。

_**02**_ **占用网络不是「万能钥匙」，激光雷达仍是「最佳助攻」**

2016 年 1 月 20 日，在辅助驾驶状态下，一辆特斯拉撞上了一堵静止的水泥隔离墙上。这是特斯拉首起「自动驾驶」事故。

当时，对特斯拉的唱衰之声不绝于耳。但经过 7 年探索，特斯拉如今在自动驾驶领域一骑绝尘。当特斯拉跑通自动驾驶之后，其他车企开始转向了「大模型」路线，沿着特斯拉从 BEV 向占用网络迭代之路进化。

不过，即便不惜成本投入堆起来的「占用网络」，对于通用障碍物的识别仍然无法做到「天衣无缝」。

占用网络，是一套基于神经网络的算法，是在时序对齐、多帧数据融合下构建的 4D 网络。

「因为拼接了很多算法，涉及到多帧融合。不可避免就会有一定程度的延时。」对于国内车企来说，在车端有限的算力之下，如何兼顾「高精度」和「低延时」存在诸多考验。

更重要的是，占用网络技术会因视觉缺失 3D 信息而导致漏检、误检。

为了视觉算法输出结果比较准确，需要源源不断的数据输入和迭代以提高精准度。

在车辆覆盖没有到一定规模前，尚且无法获得更多数据——这正是不少车企现阶段对「去掉激光雷达」保持谨慎，而选择「摄像头 + 激光雷达」融合感知路线的原因。

相比于算法，激光雷达具备「硬件本能」，不需要经过大量复杂的计算和假设，以及数据训练就可以得到纯视觉方案需要的某些数值。

相比纯视觉方案，激光雷达能够应对不易处理的 corner case（边缘场景），弥补摄像头可能出现的误判。

在融合方案中，激光雷达存在多个公认的核心优势：

一是「抗干扰」，不惧夜间环境。

据 MIT 团队 2022 年的研究结果表明，配备了激光雷达的融合方法将夜间的感知精度提高 3 倍。

二是「真三维」，精度更高。

激光雷达基于三维坐标，能精确到厘米级别为算法提供地面和物体的相对位置。地面上的高低不平的路况，一些低矮物体，激光雷达也能够捕捉到。

三是「高置信度」，识别物体数量更多。

纯视觉方案会建立覆盖常见「道路物体」（机动车、行人、两轮车、锥桶、水马、路面、树木等）的白名单。白名单之外，可能「视而不见」。

通过激光雷达直接获取实时 3D 数据后，车辆可以直接判断障碍物是否存在，为占用网络提供真值输入，在融合方案里作有力补充，提升系统安全性。

此外，激光雷达的反应速度更快。在中国城市内存在复杂路况，比如闹市区里车辆突然的加塞、变道等，激光雷达相比摄像头的反应速度更快，能够准确判断对方移动速度。

值得一提的是，在最近行业大热的话题「如何降低 AEB 的误触发率」上，激光雷达也可以帮助避免一些常见的安全隐患。

施叶舟表示，「AEB 的误触发，背后的本质原因是感知精度不够高。在激光雷达加持下，周围感知精度的提升，误触发可以大大减少」。以搭载激光雷达的理想 L9 Max 为例，采用多传感器融合方案之后，每 10 万公里的误触发次数远远低于行业均值。

综合来看，占用网络技术不是一个解锁通用障碍物识别的万能钥匙，而激光雷达在提升安全性的过程中，有着举足轻重的作用。

_**03**_ **激光雷达融合方案，高阶智能驾驶落地的「助跑器」**

城市 NOA 正在迎来一个高光时刻——问界新 M7 累计大定已超过 8 万台，其中超过 60% 用户选择了智驾版（激光雷达版）；小鹏新 G9 激光雷达版本选配比例高达 80%。

在此之前，一款车的智能驾驶搭载率只能达到 20%~30% 左右。问界和小鹏新车的智能驾驶选配率，远远超过了行业预期。

城市 NOA 迅速落地的背后，给广大的消费者体验带来根本变化是最主要的驱动力。

要实现更大范围的自动驾驶的覆盖，要切入真正的高频和刚需场景，先走到距离用户最近的地方。

数据显示，汽车平均有 71% 的里程是在城市道路行驶，对应时间占车主总驾车时长的 90%。而华为和小鹏得以更快落地城市 NOA，激光雷达功不可没。

智能驾驶权威测评机构 nuScences 的数据显示：

截止 2023 年上半年，纯视觉方案（摄像头）和融合方案（激光雷达 + 摄像头）对目标物追踪准确度（AMOTA）上仍有较大差距：二者相差接近 20 个百分点（56% VS. 75%）。

预计到 2025 年，纯视觉方案准确度的均值会达到 70%~71%。这一数字相比配备激光雷达的融合方案在 22 年的准确度落后了 3 年时间。

换个角度来看，激光雷达融合方案可以让高阶智能驾驶落地时间缩短 3 年。

轻舟智航产品负责人许诺直言，现阶段单纯依靠视觉方案，很难应对中国城市道路中的各类 Corner Case。「激光雷达，是以投入换时间，加速城市 NOA 落地的捷径。」

「当你做视觉方案时，系统遇到未知或者通用障碍物识别时，激光雷达方案的优势是突出的。像路上突然掉下来的物体，例如纸箱、木箱等，通过激光雷达能够感应到。而且激光雷达可以告诉你，前面有障碍物，也会告诉你做分类处理。」许诺说道。

由此看来，激光雷达不仅是智能汽车里的「隐形安全气囊」，更是辅助车企量产落地城市 NOA 的捷径。

在国内市场，蔚来、理想、小鹏、仰望、智己、极氪、问界、阿维塔等汽品牌，在已经量产或即将上市的车型中，都配备了激光雷达。

在海外，布局 L3 智能驾驶功能的头部车企也都配备了激光雷达，包括已经获得 L3 监管批准的奔驰，以及正在布局的宝马、沃尔沃等。

下一步，高阶辅助驾驶若要向大众市场持续渗透，系统成本有望继续下探。

施叶舟表示，禾赛正在通过核心零部件芯片化等技术降本手段，以及放大规模效应的优势，为城市 NOA 持续落地服务。目前，禾赛已将激光雷达的价格从几年前的几十万元，降到了现在的几千元，做到了十倍以下。

到那时，激光雷达的高成本，或许也不再是阻碍其大规模上车的门槛。

车企是否都要走特斯拉的纯视觉方案，最终要量力而为。而从现阶段来看，激光雷达不仅可以成为城市 NOA 落地的「助跑器」，在未来也能够继续发挥其独特价值，做自动驾驶领域的「最强助攻」。

$Tesla(TSLA.US) $Tesla(TSLA.US)

### Related Stocks

- [Tesla, Inc. (TSLA.US)](https://longbridge.com/en/quote/TSLA.US.md)