能折纸,还会灌篮!谷歌发布机器人基座大模型,大幅强化机器人通用性

华尔街见闻
2025.03.13 03:39
portai
我是 PortAI,我可以总结文章信息。

3 月 12 日,谷歌旗下的 DeepMind 公司发布了全新的 AI 模型,利用其 Gemini 2.0 语言模型,专门训练了用于控制机器人的模型。 环境适应能力、指令理解能力、操作灵活性都大大提升。

通用型机器人发展史上的又一个 “里程碑” 来了。

3 月 12 日,谷歌旗下的 DeepMind 公司发布了全新的 AI 模型,名为 Gemini Robotics 和 Gemini Robotics-ER。 这套模型号称能让机器人更好地适应复杂环境,完成各种高难度任务。

截至昨日,谷歌母公司 Alphabet Class C 股价收盘小幅上涨 1.82%,收于 169.00 美元。

机器人也能折纸、整理桌面、灌篮? 谷歌 DeepMind 展示不俗实力!

DeepMind 这次发布的 AI 模型进一步升级,经过新模型训练的机器人,不仅能流畅地折叠纸狐狸。

还能按照语音指令整理桌面。

甚至还能熟练地拉开拉链。

最后还能来个迷你篮球灌篮!

DeepMind 还和初创公司 Apptronik 合作,计划用这项技术打造人形机器人。

X 网友表示未来机器人管家真的不是梦了,想喝咖啡让机器人帮忙做一杯。

以往,机器人的动作都需要科学家手动编程,费时费力。现在,得益于新的 AI 技术,机器人能更好地适应环境,学习新技能的速度也大大加快。Google DeepMind 的首席软件工程师 Kanishka Rao 表示:

Gemini Robotics 的通用性是之前最好模型的两倍,真正实现了向通用型机器人的重大飞跃。

Gemini Robotics:让机器人更聪明、更灵活

据悉,Google 利用其 Gemini 2.0 语言模型,专门训练了用于控制机器人的模型。这使得机器人拥有了三大 “超能力”:

  • 环境适应能力: 能快速适应各种新情况。
  • 指令理解能力: 能迅速响应口头指令或环境变化。
  • 操作灵活性: 拥有足够的手部灵巧性来操作物体。

这种能力对于机器人技术的发展至关重要,因为机器人之前在实验室表现出色,但在非受控环境下往往 “水土不服”。

X 网友评论 Gemini 让机器人变得更酷更有趣了。

加州大学伯克利分校的机器人学教授 Ken Goldberg 表示:

这项技术无疑是机器人领域令人兴奋的进展,似乎建立在谷歌在大规模数据和计算方面的优势之上。

他还提到,这些新机器人模型最独特的地方在于它们可以在云端流畅运行,这大概是因为它们能够利用谷歌对需要大量计算能力的超大型语言模型的访问。麻省理工学院教授,同时也是丰田研究院机器人研究副总裁的 Russ Tedrake 认为:

Gemini 是重要的一步。

但他也表示:

通用型机器人要做好投入使用,还有很多工作要做。

科技巨头争相布局,万亿市场蓄势待发

这次 DeepMind 的动作,也预示着一场机器人领域的 “军备竞赛” 正在加速。

美银分析师 Ming Hsun Lee 团队大胆预测,人形机器人即将告别概念验证阶段,在十年内迎来多行业应用爆发期。预计到 2030 年,全球人形机器人年销量将达到 100 万台,到 2060 年,人形机器人总保有量将达到 30 亿台,相当于届时人均拥有 0.3 台机器人。

包括特斯拉、OpenAI 在内的科技巨头,以及众多初创公司,都在争先恐后地研发 AI“大脑”,希望赋予机器人自主操作的能力。

英伟达的 CEO 黄老板更是直言,这项技术将带来一个价值数万亿美元的巨大市场,甚至可能 “开创有史以来最大的科技产业”。