--- title: "机器人转折点来了?这家美国公司称其新模型能 “让机器人执行从未训练过的任务”" type: "News" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/283085529.md" description: "机器人 AI 或迎” ChatGPT 时刻”:旧金山初创公司 Physical Intelligence 发布新模型π0.7,展现出从未训练过任务的自主执行能力,令研究人员自身都感到意外。这一” 组合泛化” 突破,有望彻底颠覆机器人商业化路径,该公司估值也随之从 56 亿美元飙向 110 亿美元。" datetime: "2026-04-17T03:29:43.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/283085529.md) - [en](https://longbridge.com/en/news/283085529.md) - [zh-HK](https://longbridge.com/zh-HK/news/283085529.md) --- # 机器人转折点来了?这家美国公司称其新模型能 “让机器人执行从未训练过的任务” 机器人 AI 领域或正迎来类似大语言模型的能力跃迁时刻。 总部位于旧金山的机器人初创公司 Physical Intelligence 周四发布最新研究,**称其新模型π0.7 能够指挥机器人完成从未经过专项训练的任务**——这一能力甚至令公司自身研究人员感到意外。 该公司联合创始人、加州大学伯克利分校教授 Sergey Levine 表示,这标志着机器人 AI 正在从"死记硬背"走向"举一反三",其能力提升速度将超越训练数据规模的线性增长。 这一突破若得到外部验证,将对机器人行业的商业化路径产生深远影响——机器人有望在无需额外数据采集或模型重训练的前提下,被部署至全新环境并实时优化。与此同时,**据报道 Physical Intelligence 正就新一轮融资进行洽谈,估值或从 56 亿美元接近翻倍至 110 亿美元。** ## 核心突破:从"专项记忆"到"组合泛化" Physical Intelligence 成立仅两年,此次发布的π0.7 模型所展示的核心能力被研究人员称为 “组合泛化”(compositional generalization)——**即将在不同场景下习得的技能加以组合,从而解决模型从未遇到过的新问题。** 这与此前机器人训练的主流范式截然不同。过去的标准做法本质上是 “死记硬背”:针对每一项具体任务收集数据、训练专项模型,再对下一项任务重复这一流程。π0.7 打破了这一模式。 Levine 将这一转变类比于大语言模型领域曾出现的能力跃迁:"一旦跨越那个临界点,从只能完成有数据支撑的任务,转变为能够以新方式重新组合技能,能力提升的速度就会超过数据量增长的线性比例。这种更有利的扩展特性,我们此前已在语言和视觉领域观察到过。" ## 关键演示:空气炸锅实验揭示"知识涌现" 此次研究中最具说服力的演示,来自一台模型几乎从未在训练中见过的空气炸锅。研究团队事后排查发现,整个训练数据集中仅有两条相关记录:一条是另一台机器人将空气炸锅推关,另一条来自开源数据集,记录了一台机器人按指令将塑料瓶放入其中。 然而,π0.7 将这两段碎片化信息与更广泛的网络预训练数据加以整合,形成了对该设备运作方式的功能性理解。在零提示的情况下,模型尝试用空气炸锅烹饪红薯,取得了基本可接受的结果;在获得逐步语言指引后,任务执行成功。 Physical Intelligence 研究员、斯坦福大学计算机科学博士生 Lucy Shi 描述了一个早期实验的戏剧性转变:**初始成功率仅为 5%,但在花费约半小时优化对任务的描述方式后,成功率跃升至 95%。"有时候失败不在机器人,也不在模型,而在于我们自己——提示词工程做得不够好,**"她说。 研究科学家 Ashwin Balakrishna 则表示,过去他总能根据训练数据预判模型的能力边界,"但过去几个月是我第一次真正感到惊讶。我随手买了一套齿轮,问机器人能不能转动它,它就直接做到了。" ## 局限性:研究人员主动划定边界 研究团队对模型的局限性保持坦诚。π0.7 目前尚无法从单一高层指令出发,自主完成复杂的多步骤任务。"你不能对它说'去给我做片吐司',"Levine 说,"但如果你一步步引导它——'对于烤面包机,打开这个部分,按那个按钮,做这个'——它通常能做得很好。" 此外,机器人领域目前缺乏标准化基准测试,使得外部验证存在相当难度。Physical Intelligence 选择将π0.7 与自家此前的专项模型进行对比,结果显示这一通用模型在制作咖啡、折叠衣物、组装箱子等复杂任务上达到了专项模型的水准。 论文本身在措辞上也保持审慎,将π0.7 描述为展现出泛化能力的"早期迹象"和"初步演示"。当被直接追问基于上述研究的系统何时能够实际部署时,Levine 拒绝给出预测:**“我认为有充分理由保持乐观,进展速度也比我两年前预期的要快。但这个问题我很难回答。”** ## 资本押注:估值或翻倍至 110 亿美元 Physical Intelligence 迄今已累计融资逾 10 亿美元,最新估值为 56 亿美元。据报道,该公司目前正就新一轮融资进行洽谈,估值或接近翻倍至 110 亿美元。 投资者对这家公司的热情,在相当程度上源于联合创始人 Lachy Groom 的背书。Groom 此前是硅谷最受认可的天使投资人之一,曾投资 Figma、Notion 和 Ramp 等知名公司,在决定联合创立 Physical Intelligence 之前,他将其视为自己一直在寻找的那家公司。这一背景帮助这家初创公司吸引到了机构资金,尽管公司始终拒绝向投资者提供商业化时间表。 Levine 在谈及外界可能的质疑时,主动预判了批评方向:"针对任何机器人泛化演示,永远可以提出的批评是——任务太无聊了,机器人又没在做后空翻。"他对此提出反驳:真正能够泛化的机器人系统,看起来永远不如精心编排的特技演示那般震撼,但其实用价值要高得多。 ### 相关股票 - [TSLA.US](https://longbridge.com/zh-CN/quote/TSLA.US.md) - [AIO.US](https://longbridge.com/zh-CN/quote/AIO.US.md) ## 相关资讯与研究 - [对话智元 CTO 彭志辉:宇树 “值得学习”,我们更 “全栈”,特斯拉 “没法评”](https://longbridge.com/zh-CN/news/283106204.md) - [特斯拉拟在上海生产人形机器人](https://longbridge.com/zh-CN/news/282988455.md) - [π0.7 发布,VLA 押出了机器人的 GPT-3 时刻](https://longbridge.com/zh-CN/news/283102353.md) - [“每天都有人找我买自变量的老股” | Frontline](https://longbridge.com/zh-CN/news/282482206.md) - [Fathom 推出无机器人转录功能,解决在线会议拥挤难题](https://longbridge.com/zh-CN/news/283077383.md)