英伟达两篇论文,带来了 VLA 之后具身智能的新范式

华尔街见闻
2026.02.11 06:21
portai
我是 PortAI,我可以总结文章信息。

2025 年,VLA(视觉 - 语言 - 动作模型)成为具身智能领域的热门话题,但其在物理动作执行和泛化能力上存在严重缺陷。英伟达(NVIDIA)于 2026 年初发布的两篇论文《DreamZero》和《DreamDojo》提出了一种新范式,强调从视频中学习,能够实现零样本泛化,打破了数据不足的局限,指出 VLA 缺乏世界模型是其根本问题。