低成本训练人工智能推理模型的时代到来了？
近日，加州大学伯克利分校 Sky Computing Lab 的研究团队 NovaSky 发布了一个名为 Sky-T1-32B-Preview 的开源人工智能推理模型，这一模型在多项关键基准测试中表现出与 OpenAI 早期 o1 版本相当的水平，更令人瞩目的是，其开发成本仅为 450 美元！
相较于不久前动辄数百万美元的模型开发费用，Sky-T1-32B-Preview 可谓是一个巨大的进步。NovaSky 团队在博客文章中表示：
<blockquote>
“Sky-T1-32B-Preview 的训练成本不到 450 美元，这证明了以低成本、高效率复制高级推理能力是可行的。”
</blockquote>
那么，为什么 NovaSky 团队能大幅降低训练成本？
根据 NovaSky 团队的报告，开发成本的大幅降低主要得益于合成训练数据的应用——NovaSky 团队利用阿里巴巴的 QwQ-32B-Preview 模型，生成了 Sky-T1-32B-Preview 的初始训练数据，随后 “整理” 数据混合，并利用 OpenAI 的 GPT-4o-mini 将数据重构为更易用的格式，最终形成了可用的训练集。使用 8 个 Nvidia H100 GPU 机架训练 320 亿参数的 Sky-T1-32B-Preview 模型，大约需要 19 个小时。
报告还提到，Sky-T1-32B-Preview 在 MATH500（一套竞赛级数学挑战题）和 LiveCodeBench（一个编程评估集）的部分难题上，表现优于 o1 的早期预览版；在 GPQA-Diamond（包含 PhD 级别的物理、生物和化学问题）测试中，Sky-T1-32B-Preview1 的表现略逊于 o1 预览版。
不过需要注意的是，OpenAI 正式发布的 o1 版本性能更强，且预计将在未来几周内推出更先进的 o3 模型。

OpenAI

阿里巴巴

阿里巴巴-WR

阿里巴巴-W

开发成本的大幅降低主要得益于合成训练数据的应用——NovaSky 团队利用阿里巴巴的 QwQ-32B-Preview 模型生成了初始训练数据，随后 “整理” 数据混合，并利用 OpenAI 的 GPT-4o-mini 将数据重构为更易用的格式，最终形成了可用的训练集。

- 加州大学伯克利分校发布低成本人工智能推理模型 Sky-T1-32B-Preview。  
- 该模型开发成本仅为 450 美元，显著低于数百万美元的传统模型。  
- Sky-T1-32B-Preview 在多项基准测试中表现与 OpenAI o1 版本相当。  

AI 大规模降本？又一个媲美 o1 的 “开源推理模型” 来了，借用阿里模型生成数据，训练成本竟然不到 450 美元！