朱玉龙-YL
2023.09.12 00:43

【芝能智芯—— Dojo 的内核】

Dojo 的实际部署形式是 ExaPOD,一个由 3000 片 D1 芯片构成的 Dojo 集群,其单精度算力高达 1.1EFlops。

预计在 2023 财年,将会出货 4-5 万片 D1 芯片,而在 2023 年 7 月,第一个 ExaPOD 已经投入运营,预计在不久的将来将向 Palo Alto 数据中心投放 6 个 ExaPOD,总算力达到 7.7EFlops。

而对于 2024 年第四季度,Dojo 的目标是实现 100EFlops 的算力,相当于约 91 个集群。

图片 1

●为什么要使用 Dojo 呢?

D1 芯片专门为 FSD 的视觉神经网络设计了特殊架构,特斯拉还构建了完整的软件生态系统,包括底层软件和编译器等。

这些努力带来了多个重要好处:

Dojo 的训练效率高于 DGX A100,每个由 25 块 D1 芯片组成的"tile"的推理速度是 30 块 A100 的 30 倍,FSD 的训练时间可以从一个月缩短到一周以内。相较于 A100,Dojo 在同等成本下性能提升了 4 倍,功耗降低了 1.3 倍,体积减小了 5 倍,同时网络训练速度提高了 4.4 倍,自动标注速度提高了 3.2 倍。

从成本角度来看,Dojo 的建设成本仅为 A100 的六分之一。例如,实现 100EFlops 的算力需要 30 万块 A100 芯片,而使用 91 个 ExaPOD 的 Dojo 仅需大约 12.5 亿美元,节省了约 50 亿美元。

Dojo 的部署将对特斯拉产生深远的影响。借助更强大的计算能力和处理速度,训练效率将显著提高,算法也将更快地成熟。与 A100 相比,Dojo 将大大加速特斯拉实现完全自动驾驶的时间表,从而提高了软件业务(包括 FSD 授权等)和共享出行业务(例如 Robotaxi)的付费率和每用户平均收入(ARPU)。

本文版权归属原作者/机构所有。

当前内容仅代表作者观点,与本平台立场无关。内容仅供投资者参考,亦不构成任何投资建议。如对本平台提供的内容服务有任何疑问或建议,请联系我们。