--- title: "对于来自中国的 AI 模型来说,这是一个重要但充满波折的一周。以下是具体发生的事情" type: "News" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/275968536.md" description: "中国的科技巨头,包括阿里巴巴、字节跳动和快手,本周推出了新的人工智能模型,展示了机器人技术和视频生成的进展。阿里巴巴的 RynnBrain 帮助机器人理解其环境,而字节跳动的 Seedance 2.0 则能够根据文本提示生成逼真的视频。快手的 Kling 3.0 提供了更好的视频一致性和音频生成。尽管技术进步,Seedance 在语音生成功能上遇到了由于同意问题而产生的困扰。这些发展突显了中国在人工智能领域的竞争地位,行业专家对此表示关注" datetime: "2026-02-14T06:47:34.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/275968536.md) - [en](https://longbridge.com/en/news/275968536.md) - [zh-HK](https://longbridge.com/zh-HK/news/275968536.md) --- # 对于来自中国的 AI 模型来说,这是一个重要但充满波折的一周。以下是具体发生的事情 2024 年 7 月 5 日,中国上海世博展览中心的世界人工智能大会上,阿里巴巴的展位。 Nurphoto | Nurphoto | Getty Images 尽管美国市场关注 Anthropic 和 Altruist 工具对软件和金融服务的影响,但中国的科技巨头本周发布的 AI 模型在机器人技术和视频生成方面显示出进展。 阿里巴巴、短视频平台 Kuaishou 和字节跳动(TikTok 的创作者)都发布了新的 AI 模型,强调中国公司如何与美国公司保持同步。 这发生在谷歌 DeepMind 的首席执行官 Demis Hassabis 告诉 CNBC,中国的 AI 模型仅落后于西方竞争对手 “几个月” 之后。 这些来自中国的模型直接与 OpenAI 的 Sora 等视频生成模型以及 Nvidia 和谷歌的机器人模型竞争。 以下是这些模型的概述。 ## 阿里巴巴的 RynnBrain 阿里巴巴的达摩院本周推出了 RynnBrain,这是一个旨在帮助机器人理解周围物理世界并识别物体的 AI 模型。 在一个视频演示中,阿里巴巴展示了一款手部有夹子的机器人,似乎能够数橙子、捡起橙子并将其放入篮子中。还展示了它从冰箱中取出牛奶。 模型需要经过广泛的训练,以使其能够识别日常物体进行交互,这意味着像捡水果这样的简单任务在机器人技术中可能具有挑战性。 RynnBrain 现在使阿里巴巴与 Nvidia 和谷歌等公司竞争,这些公司正在开发自己的机器人 AI 模型。 Hugging Face 的研究员 Adina Yakefu 告诉 CNBC:“它的一个关键创新是内置的时间和空间意识。” “机器人不仅仅是对即时输入做出反应,它可以记住事件发生的时间和地点,跟踪任务进度,并在多个步骤中继续进行。这使得它在复杂的现实环境中更加可靠和连贯。” Yakefu 补充说,阿里巴巴的 “更广泛的雄心” 是 “为具身系统建立一个基础智能层。” ## 字节跳动的 Seedance 2.0 Seedance 2.0 是一个视频生成 AI 模型,能够仅根据用户的文本提示生成逼真的视频。但提示也可以包含其他视频和图像。 使用 Seedance 2.0 生成的视频经过 CNBC 审核,似乎显示出相当逼真的图像和完全由 AI 创建的视频。 来自瑞典斯德哥尔摩的 Billy Boman 经营着一家制作 AI 生成内容的创意广告公司,他使用了 Seedance 2.0。 他说,AI 视频生成在过去两年中取得了显著进展,行业内的快速改进。 “在 2023 年……让某人跑或走是很困难的。任何类型的现实主义都被限制在非常短的片段中,一切都非常缓慢,纹理差,没有皮肤纹理,缺乏细节。现在情况完全改变了。现在我可以做任何事情。技术进步简直非凡,” Boman 在接受 CNBC 采访时说道。 Hugging Face 的 Yakefu 补充说,Seedance 2.0 模型在 “可控性、速度和生产效率” 方面显示出比之前的版本更大的进步。 “Seedance 2.0 是我迄今为止测试过的最全面的视频生成模型之一。它确实让我惊讶,因为在第一次尝试时就能提供令人满意的结果,即使是简单的提示。视觉效果、音乐和摄影结合在一起,感觉更像是精致而非实验性,” Yakefu 说。 然而,尽管用户对这项技术给予了好评,Seedance 却遇到了麻烦。当地媒体报道称,Seedance 暂停了一项功能,该功能允许 AI 根据用户上传的图片生成一个人的声音。这是在中国一位博主提出关于声音生成未经同意进行的担忧后发生的。 字节跳动在被 CNBC 联系时未立即作出回应。 ## Kuaishou 的 Kling 3.0 上周发布的 Kuaishou 的 Kling 3.0 是另一个与字节跳动竞争的视频生成模型。 Kling 3.0“在一致性、逼真输出、视频时长延长至 15 秒以及多种语言、方言和口音的本地音频生成方面进行了重大升级。” 该模型仅对付费订阅者开放,但 Kuaishou 表示很快将向公众开放。 Kuaishou 在其 Kling 模型上的成功是其过去一年股价上涨超过 50% 的关键因素。 股票图标 Kuaishou 年初至今的股价 ## 其他关键 AI 模型发布 在香港以知识图谱科技(Zhipu AI)交易的公司在发布 GLM-5 后,其股价在周四飙升,该模型是一个开源的大型语言模型,具有增强的编码能力和长期运行的代理任务。 该公司表示,该模型在编码基准测试中接近 Anthropic 的 Claude Opus 4.5,同时在某些测试中超过了谷歌的 Gemini 3 Pro。CNBC 无法验证这些说法。 MiniMax 的股价在周四也大幅上涨,此前该公司推出了更新的 M2.5 开源模型,具有增强的 AI 代理工具。“代理” 或 “代理 AI” 是指旨在自动化任务的 AI 工具。 — _CNBC 的 Anniek Bao 和 Dylan Butts 对此报告做出了贡献。_ ### 相关股票 - [01024.HK](https://longbridge.com/zh-CN/quote/01024.HK.md) - [09988.HK](https://longbridge.com/zh-CN/quote/09988.HK.md) - [512380.CN](https://longbridge.com/zh-CN/quote/512380.CN.md) ## 相关资讯与研究 - [理解市场 | 快手-W 早盘涨超 8% 近日可灵 AI 推出 4K 直出功能 花旗仍看好视频模型市场潜力](https://longbridge.com/zh-CN/news/285472748.md) - [阿里巴巴-W 有 2 宗大手成交 涉资 6,992.69 万元](https://longbridge.com/zh-CN/news/285474342.md) - [AI 时代,劳动如何创造价值?](https://longbridge.com/zh-CN/news/284988017.md) - [被 AI 抢走工作的人,在忙什么?](https://longbridge.com/zh-CN/news/285141161.md) - [涉 AI,中方在联合国表态](https://longbridge.com/zh-CN/news/285342085.md)