--- title: "关税刷屏的一周,AI 圈也 “暗流涌动”:Llama 4 来了,O3 和 O4-mini 也要来了,DeepSeek R2 和 GPT-5 也不远了?" description: "Meta 发布 Llama 4 系列,强调多模态和超长上下文窗口,部分模型将开源。OpenAI 确认 O3 和 O4-mini 即将上线,GPT-5 推迟发布但将免费。DeepSeek 与清华发布新论文,提出 SPCT 方法和元奖励模型,显著提升推理扩展性能。" type: "news" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/234660137.md" published_at: "2025-04-06T07:01:03.000Z" --- # 关税刷屏的一周,AI 圈也 “暗流涌动”:Llama 4 来了,O3 和 O4-mini 也要来了,DeepSeek R2 和 GPT-5 也不远了? > Meta 发布 Llama 4 系列,强调多模态和超长上下文窗口,部分模型将开源。OpenAI 确认 O3 和 O4-mini 即将上线,GPT-5 推迟发布但将免费。DeepSeek 与清华发布新论文,提出 SPCT 方法和元奖励模型,显著提升推理扩展性能。 本文作者:鲍奕龙 来源:硬 AI 本周全球被关税议题占据头条,但科技界的目光却聚焦在 AI 领域的密集动作上。 周末,Meta 深夜突袭发布 Llama 4 系列,号称 “原生多模态 + 千万级上下文窗口”,并首次披露单卡 H100 可运行的轻量化版本。此前 OpenAI 则宣布 O3 和 O4-mini 模型即将在几周内上线,同时确认 GPT-5 因技术整合和算力部署问题推迟数月。 DeepSeek 则与清华大学的研究团队本周联合发布了一篇关于推理时 Scaling 的新论文,提出了一种名为自我原则点评调优(SPCT)的学习方法,并构建了 DeepSeek-GRM 系列模型。结合元奖励模型实现推理时扩展,性能接近 671B 大模型,暗示 DeepSeek R2 临近。 ## Meta 强势推出 Llama 4,多模态与超长上下文成亮点 周六,Meta 正式发布了 Llama 4 系列模型,**Llama 4 全系采用混合专家(MoE)架构,并实现了原生多模态训练,彻底告别了 Llama 3 纯文本模型的时代**。此次发布的模型包括: > - Llama 4 Scout(17B 激活参数,109B 总参数量,支持 1000 万 + Token 上下文窗口,**可在单张 H100 GPU 上运行**); > > - Llama 4 Maverick(17B 激活参数,400B 总参数量,上下文窗口 100 万 +,**性能优于 GPT-4o 和 Gemini 2.0 Flash**); > > - 以及**强大的 Llama 4 Behemoth 预览(288B 激活参数,2 万亿总参数量,训练使用 32000 块 GPU 和 30 万亿多模态 Token)**。 > > > 此次公布的 Llama 4 Maverick 和 Llama 4 Scout 将是开源软件。然而,**Llama 4 的新许可证对使用有一定限制,例如月活用户超 7 亿的公司需申请特殊许可,且使用时需遵守多项品牌和归属要求**。 前 kaggle 总裁,fast AI 创始人 Jeremy Howard 表示,虽然感谢开源,但 Llama 4 Scout 和 Maverick 都是大型 MoE 模型,即使量化后也无法在消费级 GPU 上运行,这对开源社区的可及性来说是个不小的损失 **Meta 强调,Llama 4 Scout 和 Llama 4 Maverick 是其 “迄今为止最先进的型号”,也是 “同类产品中多模态性最好的版本”**。 > - **Scout 亮点**:速度极快,原生支持多模态,拥有业界领先的 1000 万 + Token 多模态上下文窗口(相当于处理 20 多个小时的视频!),并且能在单张 H100 GPU 上运行(Int4 量化后) > - **Maverick 性能**:在多个主流基准测试中击败了 GPT-4o 和 Gemini 2.0 Flash,推理和编码能力与新发布的 DeepSeek v3 相当,但激活参数量不到后者一半 X 网友也对 Scout 模型的性能感到震惊,尤其是其在单 GPU 上运行并支持超长上下文窗口的能力。 **最令人瞩目的是 Llama 4 Behemoth。**目前 Behemoth 仍处训练中,不过 Meta 将其定位为 “世界上最智能的 LLM 之一”。这个拥有 288B 激活参数和 2 万亿总参数量的 “巨兽”,在 32000 块 GPU 上训练了 30 万亿多模态 Token,展现了 Meta 在 AI 领域的雄厚实力。 有 X 网友指出了 Behemoth 训练的性能潜力,强调了它在阶段就已经表现出超越多个最高级模型的能力,例如 Claude 3.7 和 Gemini 2.0 Pro。 还有 X 网友调侃了 Meta 的 “烧钱” 策略,同时对 Llama 4 的参数规模表示惊讶。 此前《The Information》周五报道称,在投资者向大型科技公司施压,要求其展示投资回报的情况下,Meta 计划今年投入高达 650 亿美元来扩展其 AI 基础设施。 ## OpenAI 确认 O3 和 O4-mini 即将上线,GPT-5 免费策略引轰动 在 Llama 4 发布的同时,OpenAI 首席执行官 Sam Altman 则在社交媒体上确认,O3 和 O4-mini 将在未来几周内发布,而 GPT-5 则将在未来几个月与公众见面。 尽管没有更多关于 o3 和 o4mini 的细节内容,但是 Altman 表示,OpenAI 在很多方面真正改进了 o3 模型,一定会让用户大为满意。 **实际上 GPT-5 的功能和发布时间才是市场关注的重点**。据 Altman 透露,GPT-5 将整合语音、Canvas、搜索、Deep Research 等多项功能,成为 OpenAI 统一模型战略的核心。 **这意味着 GPT-5 将不再是一个单一的模型,而是一个集成了多种工具和功能的综合系统。**通过这种整合,GPT-5 将能够自主使用工具,判断何时需要深入思考、何时可以快速响应,从而胜任各类复杂任务。OpenAI 的这一举措旨在简化内部模型和产品体系,让 AI 真正实现随开随用的便捷性。 **更令人兴奋的是,GPT-5 将对免费用户开放无限使用权限,而付费用户则能体验到更高智力水平的版本。**此前,奥特曼在和硅谷知名分析师 Ben Thompson 的深度对谈中,**表示因为 DeepSeek 的影响, GPT-5 将考虑让用户免费使用。** 不过对于 GPT-5 的发布时间反复推迟,有网友做出了下面这个时间表来调侃。 ## DeepSeek 携手清华发布新论文 **DeepSeek 与清华大学的研究团队本周联合发布了一篇关于推理时 Scaling 的新论文**,提出了一种名为自我原则点评调优(Self-Principled Critique Tuning,简称 SPCT)的学习方法,并构建了 DeepSeek-GRM 系列模型。**这一方法通过在线强化学习(RL)动态生成评判原则和点评内容,显著提升了通用奖励建模(RM)在推理阶段的可扩展性,并引入元奖励模型(meta RM)进一步优化扩展性能。** **** SPCT 方法的核心在于将 “原则” 从传统的理解过程转变为奖励生成的一部分,使模型能够根据输入问题及其回答内容动态生成高质量的原则和点评。这种方法包括两个阶段: > - 拒绝式微调(rejective fine-tuning)作为冷启动阶段,帮助模型适应不同输入类型; > - 基于规则的在线强化学习(rule-based online RL)则进一步优化生成内容,提升奖励质量和推理扩展性。 为了优化投票过程,研究团队引入了元奖励模型(meta RM)。该模型通过判断生成原则和评论的正确性,过滤掉低质量样本,从而提升最终输出的准确性和可靠性。 实验结果显示,DeepSeek-GRM-27B 在多个 RM 基准测试中显著优于现有方法和模型,尤其是在推理时扩展性方面表现出色。**通过增加推理计算资源,DeepSeek-GRM-27B 展现了强大的性能提升潜力,证明了推理阶段扩展策略的优势**。 这一成果不仅推动了通用奖励建模的发展,也为 AI 模型在复杂任务中的应用提供了新的技术路径,甚至可能在 DeepSeek R2 上能看到该成果的展示。 有海外论坛网友调侃道,DeepSeek 一贯是 “论文后发模型” 的节奏,竞争对手 Llama-4 可能因此受压。 ### Related Stocks - [DPSK.NA - 深度求索](https://longbridge.com/zh-CN/quote/DPSK.NA.md) - [OpenAI.NA - OpenAI](https://longbridge.com/zh-CN/quote/OpenAI.NA.md) - [GOOGL.US - 谷歌-A](https://longbridge.com/zh-CN/quote/GOOGL.US.md) - [META.US - Meta](https://longbridge.com/zh-CN/quote/META.US.md) ## Related News & Research | Title | Description | URL | |-------|-------------|-----| | Sam Altman says AI is displacing jobs, but that some companies are blaming it for layoffs they would've made anyway | Sam Altman says AI is displacing jobs, but that some companies are blaming it for layoffs they would've made anyway | [Link](https://longbridge.com/zh-CN/news/276326822.md) | | OpenAI has a Hollywood problem. They just hired a guy to fix it. | OpenAI has a Hollywood problem. They just hired a guy to fix it. | [Link](https://longbridge.com/zh-CN/news/276320944.md) | | OpenAI releases EVMbench: AI steals money on DeFi, hackers will be out of a job. | OpenAI releases EVMbench: AI steals money on DeFi, hackers will be out of a job. | [Link](https://longbridge.com/zh-CN/news/276408439.md) | | Microsoft, OpenAI Pledge Funding for UK's AI Development Projects | Microsoft, OpenAI Pledge Funding for UK's AI Development Projects | [Link](https://longbridge.com/zh-CN/news/276413399.md) | | More than 20,000 sign a petition for OpenAI to resurrect GPT-4o | More than 20,000 sign a petition for OpenAI to resurrect GPT-4o | [Link](https://longbridge.com/zh-CN/news/276155147.md) | --- > **免责声明**:本文内容仅供参考,不构成任何投资建议。