--- title: "PrismML 推出节能的 1-bit LLM,试图让人工智能摆脱对云端的依赖" type: "News" locale: "zh-CN" url: "https://longbridge.com/zh-CN/news/281678580.md" description: "PrismML 是一家来自加州理工学院的人工智能初创公司,推出了一款名为 Bonsai 8B 的 1 位大型语言模型,旨在提升移动设备上的人工智能效率。该模型显著比传统模型更小、更快且更节能,内存占用仅为 1.15 GB,同时提供超过 10 倍的智能密度。PrismML 的创新架构使得在不牺牲性能的情况下实现低位量化的优势。该公司旨在将人工智能的部署从云数据中心转向设备端应用,Bonsai 8B 可在包括苹果设备和 Nvidia GPU 在内的多种平台上运行" datetime: "2026-04-04T08:10:40.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/281678580.md) - [en](https://longbridge.com/en/news/281678580.md) - [zh-HK](https://longbridge.com/zh-HK/news/281678580.md) --- # PrismML 推出节能的 1-bit LLM,试图让人工智能摆脱对云端的依赖 PrismML,一家来自加州理工学院的人工智能创业公司,发布了一款 1 位的大型语言模型,其性能超过了更重的模型,预计将提高人工智能在移动设备等应用上的效率和可行性。 这款名为 Bonsai 8B 的模型小巧且快速,功耗适中,基准性能特征与更大模型相媲美。 该公司在社交媒体上表示:"我们的第一个证明点是 1 位 Bonsai 8B,这是一款适合 1.15 GB 内存的 1 位模型,其智能密度超过全精度模型的 10 倍以上。" "它的体积小 14 倍,速度快 8 倍,并且在边缘硬件上能效高 5 倍,同时在其参数类别中与其他模型保持竞争力。" 基于 Transformer 架构的人工智能模型涉及数百万或数十亿个权重,这些权重控制神经元之间连接的强度,并影响模型执行任务的方式。它们在训练过程中设定,并根据表示它们所使用的精度占用内存空间。 以 GGUF FP16(16 位)量化的模型将占用比以 GGUF Q8\_0(8 位)或 GGUF Q4\_0(4 位)或 GGUF Q2\_K(2 位)量化的模型更多的空间。这不包括可能增加实际存储空间需求的元数据和开销。但在相同基本架构下,16 位模型通常比低位量化的模型表现更好。 PrismML 的 Bonsai 模型系列基于一种架构,其中"每个权重仅由其符号表示,{−1, +1},而每组权重共享一个缩放因子,"正如该公司在其白皮书中所解释的那样,而不是 16 位或 32 位浮点数。研究人员多年来一直在研究改进量化的方法,相关论文包括《BitNet: Bit-Regularized Deep Neural Networks》(2017)和《1 位 LLM 的时代:所有大型语言模型都在 1.58 位中》(2024)。 PrismML 的方法基于加州理工学院电气工程教授 Babak Hassibi 及其同事的研究。该公司声称其 1 位架构避免了历史上伴随低位量化而来的权衡,特别是糟糕的指令跟随、多步骤推理错误和不可靠的工具使用。 - Claude 代码源泄露揭示了 Anthropic 可以收集多少关于你和你的系统的信息 - Claude 代码在给出过多命令时绕过安全规则 - 亚马逊安全负责人:人工智能使渗透测试效率提高 40% - OpenAI 获得 1220 亿美元用于'仅仅构建东西',而世界正在摧毁他们 PrismML 的首席执行官兼创始人 Babak Hassibi 在一份声明中表示:"我们花了多年时间开发所需的数学理论,以在不失去推理能力的情况下压缩神经网络。" "我们将 1 位视为起点,而不是终点。" Hassibi 认为,该公司的 1 位架构建立了一种新的人工智能范式,专注于每单位计算和能量的智能。 为了鼓励其他人朝这个方向思考——还记得性能每瓦特成为热门话题的时候吗?——PrismML 提出了智能密度的测量,这一指标使其模型展现出良好的表现。 该公司解释道:"我们将智能密度定义为模型平均错误率的负对数(在相同基准套件中)除以模型大小。" 在智能密度评估中,Qwen3 8B 在各种基准测试(MMLU Redux、MuSR、GSM8K 等)中稍微领先于 Bonsai 8B,智能密度得分仅为 0.10/GB,远低于 Bonsai 8B 的 1.06/GB。 指标可能对营销很重要,但 PrismML 模型更有意义的标准是它们将人工智能从云数据中心移出的潜力。该公司预见其模型将为设备上的代理、实时机器人、安全企业系统以及其他在内存带宽、功率或合规性限制下可能妨碍部署的项目提供动力。 该公司表示:"1 位 Bonsai 8B 可以通过 MLX 在 Apple 设备(Mac、iPhone、iPad)上原生运行,通过 Nvidia GPU 通过 llama.cpp CUDA 运行。" "模型权重今天可以在 Apache 2.0 许可证下获得。" 还有两个较小的模型可用:1 位 Bonsai 4B 和 1 位 Bonsai 1.7B。® ### 相关股票 - [NVDX.US](https://longbridge.com/zh-CN/quote/NVDX.US.md) - [IXN.US](https://longbridge.com/zh-CN/quote/IXN.US.md) - [SMH.US](https://longbridge.com/zh-CN/quote/SMH.US.md) - [AAPB.US](https://longbridge.com/zh-CN/quote/AAPB.US.md) - [XSD.US](https://longbridge.com/zh-CN/quote/XSD.US.md) - [NVDL.US](https://longbridge.com/zh-CN/quote/NVDL.US.md) - [SOXL.US](https://longbridge.com/zh-CN/quote/SOXL.US.md) - [PSI.US](https://longbridge.com/zh-CN/quote/PSI.US.md) - [AAPX.US](https://longbridge.com/zh-CN/quote/AAPX.US.md) - [SOXX.US](https://longbridge.com/zh-CN/quote/SOXX.US.md) - [NVDU.US](https://longbridge.com/zh-CN/quote/NVDU.US.md) - [AAPL.US](https://longbridge.com/zh-CN/quote/AAPL.US.md) - [NVDA.US](https://longbridge.com/zh-CN/quote/NVDA.US.md) ## 相关资讯与研究 - [Anthropic 发布 Managed Agents,才发现这支硅谷华人团队早就押对了赌注](https://longbridge.com/zh-CN/news/282149364.md) - [英伟达收购告吹后,Nebius 正洽谈收购以色列人工智能初创公司 AI21](https://longbridge.com/zh-CN/news/282161968.md) - [巨鲸落万物生:Sora 退场、PixVerse C1 接棒,瞄准影视工业化](https://longbridge.com/zh-CN/news/282128811.md) - [Anthropic 年化收入突破 300 亿美元,科创半导体 ETF 华夏冲击 4 连涨](https://longbridge.com/zh-CN/news/282128085.md) - [Anthropic 发布 Claude Managed Agents 解耦架构重塑长周期任务处理](https://longbridge.com/zh-CN/news/282123376.md)