芝能-烟烟
2026.03.13 07:12

调侃微软,瞄准白领:马斯克的 “巨硬” 公司如何替你上班?

portai
我是 LongbridgeAI,我可以总结文章信息。

​​

芝能科技出品


2026 年 3 月 11 日,马斯克在 X 上发了一条帖子,宣布 Tesla 和 xAI 正在联合开发一个新项目,内部代号叫 Macrohard。


这个名字是在调侃微软。Microsoft,微型软件;Macrohard,宏大硬核。


玩笑归玩笑,但马斯克给这个项目的定义只有一句话:一个可以模拟整家公司运作的 AI 系统。


这句话值得停下来想一想。不是更聪明的聊天机器人,不是更好用的代码助手,马斯克想干的是模拟整家公司运作。AI 是要替代那些坐在办公室里操作电脑的人,马斯克在瞄准白领!



● AI 干活,难在哪里


过去两年,大模型改变了很多人写东西的方式。但有一件事几乎没有改变:人仍然要亲自操作电脑。


AI 写完文案,你还是要自己打开邮件发出去;AI 生成了报告,你还是要自己上传到系统里。这个 AI 界的"最后一公里"的问题,催生了一类叫 AI Agent 的技术。


OpenAI 的 Operator、Anthropic 的 Computer Use,都在尝试让 AI 直接操作电脑——自动填表、发邮件、操作网页,真正完成任务而不只是回答问题。


但真正用过的人都知道:慢,而且不稳定。


原因在于架构。目前主流 AI Agent 的工作方式是截屏→分析→操作→再截屏,每一步之间都要等大模型反应。就像一个人每点一次鼠标都要停下来思考三秒。演示视频里看起来很流畅,真实场景里用起来让人抓狂。


这是一个还没被解决的工程问题,不是营销问题。


● 特斯拉式解法


Digital Optimus 的架构设计,和现有 AI Agent 有一个本质区别。


现有方案把电脑屏幕当成一张张截图来处理;Digital Optimus 把屏幕当成连续视频来处理,实时读取最近 5 秒的画面,直接驱动鼠标和键盘。


这套逻辑直接来自特斯拉自动驾驶——汽车在路上面对的是连续的世界,不能每隔一秒截图分析一次,否则早就撞车了。



系统分两层:执行层负责实时操作,决策层是 xAI 的 Grok 模型,负责理解任务、规划步骤、在出错时介入纠正。


心理学里把这叫系统 1 和系统 2——直觉和理性的分工。人用电脑时,看到熟悉按钮会本能点击,遇到复杂判断才会停下来思考。Digital Optimus 试图复制的,正是这套人类操作电脑的底层逻辑。


这个设计思路比现有方案聪明。但聪明的设计和能跑通的产品之间,还有相当长的距离。


● 为什么先做软件,不做机器人


特斯拉的 Optimus 机器人已经宣传了三年,但进展比预期慢。原因不复杂:现实世界太难了。


一个搬箱子的动作,背后涉及视觉识别、路径规划、抓取控制、机械结构和电池续航,任何一个环节出问题任务就失败。


业内有句话:机器人最贵的一半是手。这也是为什么几乎所有机器人展示视频里,动作都出奇地慢——那不是在展示能力,那是在掩盖局限。


相比之下,电脑世界是一个极其友好的环境。没有摩擦力,没有重力,不需要电池,失败了可以立刻重试。而企业里恰好堆满了这类工作:录数据、填表单、处理客服、跑 ERP 流程。


这些工作过去由 RPA(机器人流程自动化)处理。RPA 的问题是不会思考,规则一变它就失效,每次业务调整都要重新编程。Digital Optimus 的目标是用真正能理解上下文的 AI 来替代它——不只是执行流程,而是理解意图。


先去软件世界打工,积累数据和经验,再慢慢走进物理世界。


● 底牌:几百万辆车的算力


Digital Optimus 最容易被忽视的部分,是它的算力来源。


特斯拉目前有几百万辆搭载 AI 芯片的车在路上跑,每辆车的芯片在行驶之外的时间大量闲置。马斯克几年前就提出过一个设想:把这些闲置算力组织起来,形成分布式 AI 推理网络。


如果 Digital Optimus 的推理架构足够轻量,这个网络就可以成为它的算力底座——成本极低,规模极大,而且随着特斯拉车队扩张自动增长。


这是纯软件 AI 公司在结构上很难复制的优势。OpenAI 需要租用数据中心,成本随用量线性增长;特斯拉的边缘算力网络一旦激活,边际成本趋近于零。


当然,这个设想离落地还很远,解释了为什么这个项目的天花板,比表面看起来高得多。


● 最大的风险不是技术


马斯克正式宣布之前,媒体已经爆出项目内部的一些问题:团队负责人频繁更换,工程师流失,一个涉及 600 名数据标注人员的训练项目被临时叫停。这些是执行层面的摩擦,大项目里并不罕见。


真正麻烦的是公司结构。特斯拉是上市公司,xAI 是马斯克的私人公司,Digital Optimus 同时依赖两边的核心资产——特斯拉的芯片和车队,xAI 的模型。


项目一旦产生商业价值,利益怎么切、技术归谁所有,这些问题在股东和投资人面前都会变得非常现实。


马斯克同时掌控两家公司,可以强行推进;但这种结构也意味着,任何一边的压力都可能打断项目节奏。特斯拉股东已经多次对马斯克的精力分散表达不满。技术路线可以迭代,公司治理的矛盾更难化解。

​​​​

本文版权归属原作者/机构所有。

当前内容仅代表作者观点,与本平台立场无关。内容仅供投资者参考,亦不构成任何投资建议。如对本平台提供的内容服务有任何疑问或建议,请联系我们。