物理 AI 大时代,一场 “视觉数据争夺赛” 将上演

华尔街见闻
2025.01.23 06:57
portai
我是 PortAI,我可以总结文章信息。

大摩认为,正如聊天机器人需要文本数据来训练大语言模型(LLM)一样,物理机器人需要数据来训练其视觉 - 语言 - 动作模型(VLA),预计随着算力规模不断扩展且效率提升,AI 公司需要大量的视觉数据来创建物理世界的 “数字孪生”,视觉数据将成为 AI 巨头们的竞争焦点。

随着人工智能从数字世界走向物理世界,竞争焦点将转向视觉数据。

在 21 日发布的研报中,摩根士丹利分析师 Adam Jonas、Daniela M Haigian 等指出,正如聊天机器人需要文本数据来训练大语言模型(LLM)一样,物理机器人需要数据来训练其视觉 - 语言 - 动作模型(VLA)。摩根士丹利认为,AI 正在从纯数字领域向物理世界扩展,例如自动驾驶、人形机器人和电动垂直起降飞行器(eVTOLs)等领域。

报告引用了马斯克在今年早些时候发表的观点,即 “三到四年内,AI 将可以解决任何不涉及物理世界的认知任务”。大摩预计,随着算力规模不断扩展且效率提升,AI 公司需要大量的视觉数据来创建物理世界的 “数字孪生”,即通过高精度的视觉数据构建一个虚拟的物理世界模型,全球范围内将展开一场争夺光学数据的 “光子竞赛”。

报告还将光子数据比作 “Fat tuna”(肥金枪鱼),认为如果无法捕捉或利用数据,那么这些数据就像海中的金枪鱼一样毫无价值;而一旦具备捕捉和处理这些数据的能力,其价值将大幅提升。这意味着,当 AI 技术成熟后,视觉数据将成为极其宝贵的资源。

大摩认为,这种数据需求将涵盖生活的各个方面,包括仓库、工厂、医院、学校、商店、车辆、机场、矿山、家庭和森林等,甚至生物体的视觉数据也将成为重要的资源。

报告还特别提及特斯拉在这个进程中起到的关键作用,认为该公司处于 “技术寒武纪大爆发的中心地带”,其投资故事已经远远超出了电动汽车的范畴,马斯克旗下 “DREAMS”(数据、机器人、能源、AI、制造和太空)的庞大商业帝国将推动特斯拉价值的进一步释放。

报告表示,随着马斯克在构建推理群(汽车、机器人)和 AI 基础设施方面取得进一步进展,通用 AI 和 LLM 可能成为解锁特斯拉作为 AI 巨头价值的 “关键钥匙”。