芝能-烟烟
2026.03.13 07:12

调侃微软,瞄准白领:马斯克的 “巨硬” 公司如何替你上班?

portai
I'm LongbridgeAI, I can summarize articles.

​​

芝能科技出品


2026 年 3 月 11 日,马斯克在 X 上发了一条帖子,宣布 Tesla 和 xAI 正在联合开发一个新项目,内部代号叫 Macrohard。


这个名字是在调侃微软。Microsoft,微型软件;Macrohard,宏大硬核。


玩笑归玩笑,但马斯克给这个项目的定义只有一句话:一个可以模拟整家公司运作的 AI 系统。


这句话值得停下来想一想。不是更聪明的聊天机器人,不是更好用的代码助手,马斯克想干的是模拟整家公司运作。AI 是要替代那些坐在办公室里操作电脑的人,马斯克在瞄准白领!



● AI 干活,难在哪里


过去两年,大模型改变了很多人写东西的方式。但有一件事几乎没有改变:人仍然要亲自操作电脑。


AI 写完文案,你还是要自己打开邮件发出去;AI 生成了报告,你还是要自己上传到系统里。这个 AI 界的"最后一公里"的问题,催生了一类叫 AI Agent 的技术。


OpenAI 的 Operator、Anthropic 的 Computer Use,都在尝试让 AI 直接操作电脑——自动填表、发邮件、操作网页,真正完成任务而不只是回答问题。


但真正用过的人都知道:慢,而且不稳定。


原因在于架构。目前主流 AI Agent 的工作方式是截屏→分析→操作→再截屏,每一步之间都要等大模型反应。就像一个人每点一次鼠标都要停下来思考三秒。演示视频里看起来很流畅,真实场景里用起来让人抓狂。


这是一个还没被解决的工程问题,不是营销问题。


● 特斯拉式解法


Digital Optimus 的架构设计,和现有 AI Agent 有一个本质区别。


现有方案把电脑屏幕当成一张张截图来处理;Digital Optimus 把屏幕当成连续视频来处理,实时读取最近 5 秒的画面,直接驱动鼠标和键盘。


这套逻辑直接来自特斯拉自动驾驶——汽车在路上面对的是连续的世界,不能每隔一秒截图分析一次,否则早就撞车了。



系统分两层:执行层负责实时操作,决策层是 xAI 的 Grok 模型,负责理解任务、规划步骤、在出错时介入纠正。


心理学里把这叫系统 1 和系统 2——直觉和理性的分工。人用电脑时,看到熟悉按钮会本能点击,遇到复杂判断才会停下来思考。Digital Optimus 试图复制的,正是这套人类操作电脑的底层逻辑。


这个设计思路比现有方案聪明。但聪明的设计和能跑通的产品之间,还有相当长的距离。


● 为什么先做软件,不做机器人


特斯拉的 Optimus 机器人已经宣传了三年,但进展比预期慢。原因不复杂:现实世界太难了。


一个搬箱子的动作,背后涉及视觉识别、路径规划、抓取控制、机械结构和电池续航,任何一个环节出问题任务就失败。


业内有句话:机器人最贵的一半是手。这也是为什么几乎所有机器人展示视频里,动作都出奇地慢——那不是在展示能力,那是在掩盖局限。


相比之下,电脑世界是一个极其友好的环境。没有摩擦力,没有重力,不需要电池,失败了可以立刻重试。而企业里恰好堆满了这类工作:录数据、填表单、处理客服、跑 ERP 流程。


这些工作过去由 RPA(机器人流程自动化)处理。RPA 的问题是不会思考,规则一变它就失效,每次业务调整都要重新编程。Digital Optimus 的目标是用真正能理解上下文的 AI 来替代它——不只是执行流程,而是理解意图。


先去软件世界打工,积累数据和经验,再慢慢走进物理世界。


● 底牌:几百万辆车的算力


Digital Optimus 最容易被忽视的部分,是它的算力来源。


特斯拉目前有几百万辆搭载 AI 芯片的车在路上跑,每辆车的芯片在行驶之外的时间大量闲置。马斯克几年前就提出过一个设想:把这些闲置算力组织起来,形成分布式 AI 推理网络。


如果 Digital Optimus 的推理架构足够轻量,这个网络就可以成为它的算力底座——成本极低,规模极大,而且随着特斯拉车队扩张自动增长。


这是纯软件 AI 公司在结构上很难复制的优势。OpenAI 需要租用数据中心,成本随用量线性增长;特斯拉的边缘算力网络一旦激活,边际成本趋近于零。


当然,这个设想离落地还很远,解释了为什么这个项目的天花板,比表面看起来高得多。


● 最大的风险不是技术


马斯克正式宣布之前,媒体已经爆出项目内部的一些问题:团队负责人频繁更换,工程师流失,一个涉及 600 名数据标注人员的训练项目被临时叫停。这些是执行层面的摩擦,大项目里并不罕见。


真正麻烦的是公司结构。特斯拉是上市公司,xAI 是马斯克的私人公司,Digital Optimus 同时依赖两边的核心资产——特斯拉的芯片和车队,xAI 的模型。


项目一旦产生商业价值,利益怎么切、技术归谁所有,这些问题在股东和投资人面前都会变得非常现实。


马斯克同时掌控两家公司,可以强行推进;但这种结构也意味着,任何一边的压力都可能打断项目节奏。特斯拉股东已经多次对马斯克的精力分散表达不满。技术路线可以迭代,公司治理的矛盾更难化解。

​​​​

The copyright of this article belongs to the original author/organization.

The views expressed herein are solely those of the author and do not reflect the stance of the platform. The content is intended for investment reference purposes only and shall not be considered as investment advice. Please contact us if you have any questions or suggestions regarding the content services provided by the platform.