
最先赚钱的具身智能机器人,没有长成「人形」

2026 年,所有具身智能企业都面临着同一个严峻的问题:机器人该如何真正跑通商业化?
各方不断为通用机器人寻找落地场景,但主流路径普遍受限。
文娱应用难以维持长期的付费意愿;工业场景在成本与精度的极致要求下,技术适配仍显吃力;商业服务与家庭场景则长期受制于碎片化需求与安全门槛。
在这些路径尚未形成稳定闭环的同时,一条并不典型的商业化路线被跑通了。
城市服务,作为一个被不少人忽视的领域,却对机器人有着高频、持续运营的需求。
城市中存在大量环境维护、公共空间运转等工作,需要长期稳定完成,天然适合机器人进行常态化部署与规模化运营。
在城市服务场景中,已经有公司率先跑通了商业化,走到了规模化的节点上——酷哇科技。
并且,酷哇的技术能力也开始突破单一应用领域,随着 Coowa WAM 2.0 通用世界模型底座的发布,其智能体系正从环卫场景延展至物流、巡检、新零售等更多城市空间,能力逐步沉淀为可跨场景复用的通用底座。
作为城市通用 AI 机器人服务商,酷哇提供了一个具身智能融入人类生活的现实样本。
1、手握 50 亿订单,从城市服务场景跑通商业化
酷哇科技成立于 2015 年,团队从创立之初便将目标指向通用机器人方向,核心成员具备机器人与 AI 的复合技术背景。
创始人兼 CEO 何弢博士与 CTO 廖文龙博士都毕业于上海交通大学。前者在东京工业大学完成机械与工程方向硕博研究,师从机器人大师 Hirose Shigeo,后者长期从事移动机器人定位导航与无人驾驶技术研究。
但彼时,通用算法体系尚不成熟,机器人的能力边界十分有限。酷哇早期曾在 Robotaxi、港口、物流等方向进行过尝试,最终将目光投向城市服务场景。
这源于酷哇对「通用」的执着追求。相比只解决移动问题的自动驾驶,城市服务机器人面对的是「移动 + 作业」的复合挑战,对感知、决策与系统稳定性的要求更高。
城市空间的真实多变也远高于结构化道路环境,更适合作为具身智能能力的现实验证场。
随着运营经验积累,酷哇逐步形成覆盖智慧出行、智慧物业与智慧城市管家三大板块的业务布局,构建起围绕城市运行体系展开的通用 AI 机器人网络。
其中,城市管家服务,是酷哇科技商业化进展最快、规模最大的方向。
酷哇推出的「麒麟」X3 与「独角兽」X1 环卫机器人,已在城市街道、公园、商业区与社区中承担清扫、冲洗等高频作业任务。
这一场景之所以能率先跑通商业闭环,是因为存在长期刚性需求。城市环境维护始终是必须持续投入的基础服务,行业也面临环卫工人老龄化与用工短缺的问题。
酷哇科技联合创始人兼 COO 李柯宏称,目前环卫行业劳动力缺口约 50%。一台环卫机器人可承担约 5 名工人的工作量。
市场规模的变化同样印证了这一需求。2025 年智慧环卫需求突破 74 亿元/年,相较 2023 年提升了约 4 倍,规模化项目占比接近三成。
在单项目十台以上的批量部署中,酷哇已占据约八成市场份额,交付能力处于行业领先水平。
在此基础上,酷哇的能力开始向更多城市空间延伸。
智慧出行领域的 L4 级自动驾驶小巴 CooBus 服务于园区、社区与城市微循环场景,解决「最后三公里」的交通需求,累计安全运营里程已超过 500 万公里。
在楼宇与园区场景中,酷哇将机器人的能力延伸到实际操作层面,让轮足机器人 R0 装上了机械臂,与四足机器人 D0 协同工作,承担搬运、清洁、巡检等任务。
这些场景共同交织成一张覆盖城市空间的机器人服务网。不同形态机器人是通用 AI 能力在不同物理载体上的自然延伸。
酷哇的商业化也进入规模化阶段,已在北京、上海、广州、深圳四个超一线城市实现常态化运营,一线城市业务占比从 2022 年不足 2% 提升至 2025 年约 25%,客单价三年内增幅达 106%。
同时,酷哇已与浦发集团、北控集团、亦庄控股,以及盈峰环境、玉禾田、金地物业等大型城服企业及上市公司建立长期合作关系,生态伙伴朋友圈不断扩容。
酷哇的模式也开始在海外复制落地。酷哇的机器人车队已在新加坡与阿布扎比等准入标准极高的城市实现常态化运营,并持续向东亚、中东及欧洲市场拓展。
李柯宏介绍,目前酷哇科技的订单储备已超过 50 亿。
2、通用技术底座,让机器人真正理解与推演世界
酷哇能够跑通商业闭环,源于其围绕真实物理世界搭建的一整套技术体系。
相比语言和图像所处的数字世界,通用机器人面对的是一个高度开放、强因果约束的现实环境:任务多样、交互对象不可穷举、失败成本极高。
机器人在城市场景中执行任务,需要解决两个最核心的问题。
一是长尾场景不可穷举,规则与单模型难以覆盖。
突发路况、行人行为变化、复杂作业环境,都难以通过规则提前覆盖,单一感知模型也很容易在分布外场景中失效。
二是传统机器人系统缺乏对动作后果的预判能力。
常规的机器人系统往往遵循「感知—决策—执行」的线性逻辑。环境发生变化时,系统缺乏对动作后果的内在建模能力,常常在感知到问题后才做出修正。
在复杂城市环境中,这种被动反应很难支撑连续作业与平滑运行。
这两个问题本质上指向同一能力缺口——机器人缺乏对物理世界的理解与推演能力。
酷哇科技提出了 COOWA WAM 2.0 世界模型解决这两大问题,让机器人在行动前先「理解世界、预演未来、再做决策」。
COOWA WAM 2.0 分为四大核心板块:
- 基于语义的表征学习:让机器人看懂世界;
- 基于视频生成的未来预测:在脑子里预演未来;
- 直觉行动系统:快速想出做法;
- VLM 宏观约束:理性筛选出最佳方案。
首先,在视觉层面,机器人要能看懂世界。
WAM 2.0 利用图像 - 文本对齐(Masking + 对比学习)技术,提取高层语义特征,让机器人将画面和具体语义对应起来,不只是识别识别颜色与轮廓,还能明确哪些是人、哪些是车、物体之间如何互动。
这样一来,机器人不再被海量画面细节淹没,只关注对行动真正重要的信息,同一套视觉理解逻辑也能够在不同任务和不同机器人形态之间直接复用。
WAM 2.0 世界模型的核心是「基于视频生成的未来预测」模块。它会根据当前环境状态,学习物体之间的物理互动规律与空间变化趋势,让机器人在行动前先预测环境将如何变化,在脑海中预演不同动作的结果。
不过,现实环境变化极快,仅靠完整推演远远不够。为保证实时性,系统中还引入了类似人类直觉反应的快速行动生成机制,即「直觉行动系统」。
机器人会基于过往经验迅速提出多种可行动作方案,哪怕在突发情况下也能保持连续响应,避免陷入长时间计算停滞。
与此同时,更高层的推理系统始终在为这些快速决策把关,保证安全,即「VLM 宏观约束」。
VLM 并不直接控制运动细节,而是从任务目标、常识逻辑与安全规则出发,对候选动作进行筛选与约束,剔除潜在危险或不合理行为,确保整体决策既高效又可靠。
这一套机制让机器人从被动执行升级为主动推演决策,在复杂城市场景中保持稳定运行。
具身智能长期面临的另一大难题,是高质量物理交互数据的稀缺。
酷哇构建了虚实结合的数据进化闭环,包括「规模化真机部署 + 仿真系统扩展训练 + 自动化数据管线」三方面。
从 2018 年商业化落地开始,酷哇便坚持规模化部署真机采集数据,逐步沉淀起覆盖 50 多个城市的真实运营数据体系,累计运行里程已超过 4500 万公里,积累了数百万个高价值长尾场景样本,并形成约 50PB 的数据湖。
当遇到极端天气、罕见事故等现实中难以高频复现的长尾场景时,系统会通过 World Sim 仿真器扩展训练,补齐能力边界。
配合自动化数据清洗与标注管线,海量数据能够被快速转化为可训练样本,使模型迭代周期从传统的数月级压缩至按周更新。
从认知结构、行动推演到数据闭环,酷哇所构建技术体系,是一套真实物理世界的通用认知底座。
不同形态机器人共享对环境的理解与决策逻辑,使能力能够在城市出行、物业服务与高频城市服务场景之间快速迁移。
其能力也在不断向物流、巡检、新零售等更多城市场景扩展。例如可在园区与楼宇内部承担物流搬运任务,未来也有望在新零售与无人商业场景中完成补货与运营支持。
酷哇希望构建起一个 RoboCity(机器人生态城):数万台形态各异的机器人将通过 WAM 共享同一套世界认知与决策能力,城市运行可以像一套智能系统般协同运转。
回看酷哇科技的路径,它并没有试图一开始就解决通用机器人如何无所不能的终极命题。
相反,酷哇从多个具体而复杂的细分城市场景切入,在长期真实运行中反复验证与打磨能力,将专用经验逐步沉淀为可迁移的通用能力,并在这一过程中跑通商业闭环。
这种持续进化式路径,也为具身智能商业化提供了一种更可落地的现实范式。
本文版权归属原作者/机构所有。
当前内容仅代表作者观点,与本平台立场无关。内容仅供投资者参考,亦不构成任何投资建议。如对本平台提供的内容服务有任何疑问或建议,请联系我们。

