朱玉龙-YL
2023.09.12 00:43

【芝能智芯—— Dojo 的内核】

Dojo 的实际部署形式是 ExaPOD,一个由 3000 片 D1 芯片构成的 Dojo 集群,其单精度算力高达 1.1EFlops。

预计在 2023 财年,将会出货 4-5 万片 D1 芯片,而在 2023 年 7 月,第一个 ExaPOD 已经投入运营,预计在不久的将来将向 Palo Alto 数据中心投放 6 个 ExaPOD,总算力达到 7.7EFlops。

而对于 2024 年第四季度,Dojo 的目标是实现 100EFlops 的算力,相当于约 91 个集群。

图片 1

●为什么要使用 Dojo 呢?

D1 芯片专门为 FSD 的视觉神经网络设计了特殊架构,特斯拉还构建了完整的软件生态系统,包括底层软件和编译器等。

这些努力带来了多个重要好处:

Dojo 的训练效率高于 DGX A100,每个由 25 块 D1 芯片组成的"tile"的推理速度是 30 块 A100 的 30 倍,FSD 的训练时间可以从一个月缩短到一周以内。相较于 A100,Dojo 在同等成本下性能提升了 4 倍,功耗降低了 1.3 倍,体积减小了 5 倍,同时网络训练速度提高了 4.4 倍,自动标注速度提高了 3.2 倍。

从成本角度来看,Dojo 的建设成本仅为 A100 的六分之一。例如,实现 100EFlops 的算力需要 30 万块 A100 芯片,而使用 91 个 ExaPOD 的 Dojo 仅需大约 12.5 亿美元,节省了约 50 亿美元。

Dojo 的部署将对特斯拉产生深远的影响。借助更强大的计算能力和处理速度,训练效率将显著提高,算法也将更快地成熟。与 A100 相比,Dojo 将大大加速特斯拉实现完全自动驾驶的时间表,从而提高了软件业务(包括 FSD 授权等)和共享出行业务(例如 Robotaxi)的付费率和每用户平均收入(ARPU)。

The copyright of this article belongs to the original author/organization.

The views expressed herein are solely those of the author and do not reflect the stance of the platform. The content is intended for investment reference purposes only and shall not be considered as investment advice. Please contact us if you have any questions or suggestions regarding the content services provided by the platform.