--- title: "PrismML 推出節能的 1-bit LLM,試圖讓人工智能擺脱對雲端的依賴" type: "News" locale: "zh-HK" url: "https://longbridge.com/zh-HK/news/281678580.md" description: "PrismML 是一家來自加州理工學院的人工智能初創公司,推出了一款名為 Bonsai 8B 的 1 位大型語言模型,旨在提升移動設備上的人工智能效率。該模型顯著比傳統模型更小、更快且更節能,內存佔用僅為 1.15 GB,同時提供超過 10 倍的智能密度。PrismML 的創新架構使得在不犧牲性能的情況下實現低位量化的優勢。該公司旨在將人工智能的部署從雲數據中心轉向設備端應用,Bonsai 8B 可在包括蘋果設備和 Nvidia GPU 在內的多種平台上運行" datetime: "2026-04-04T08:10:40.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/281678580.md) - [en](https://longbridge.com/en/news/281678580.md) - [zh-HK](https://longbridge.com/zh-HK/news/281678580.md) --- # PrismML 推出節能的 1-bit LLM,試圖讓人工智能擺脱對雲端的依賴 PrismML,一家來自加州理工學院的人工智能創業公司,發佈了一款 1 位的大型語言模型,其性能超過了更重的模型,預計將提高人工智能在移動設備等應用上的效率和可行性。 這款名為 Bonsai 8B 的模型小巧且快速,功耗適中,基準性能特徵與更大模型相媲美。 該公司在社交媒體上表示:"我們的第一個證明點是 1 位 Bonsai 8B,這是一款適合 1.15 GB 內存的 1 位模型,其智能密度超過全精度模型的 10 倍以上。" "它的體積小 14 倍,速度快 8 倍,並且在邊緣硬件上能效高 5 倍,同時在其參數類別中與其他模型保持競爭力。" 基於 Transformer 架構的人工智能模型涉及數百萬或數十億個權重,這些權重控制神經元之間連接的強度,並影響模型執行任務的方式。它們在訓練過程中設定,並根據表示它們所使用的精度佔用內存空間。 以 GGUF FP16(16 位)量化的模型將佔用比以 GGUF Q8\_0(8 位)或 GGUF Q4\_0(4 位)或 GGUF Q2\_K(2 位)量化的模型更多的空間。這不包括可能增加實際存儲空間需求的元數據和開銷。但在相同基本架構下,16 位模型通常比低位量化的模型表現更好。 PrismML 的 Bonsai 模型系列基於一種架構,其中"每個權重僅由其符號表示,{−1, +1},而每組權重共享一個縮放因子,"正如該公司在其白皮書中所解釋的那樣,而不是 16 位或 32 位浮點數。研究人員多年來一直在研究改進量化的方法,相關論文包括《BitNet: Bit-Regularized Deep Neural Networks》(2017)和《1 位 LLM 的時代:所有大型語言模型都在 1.58 位中》(2024)。 PrismML 的方法基於加州理工學院電氣工程教授 Babak Hassibi 及其同事的研究。該公司聲稱其 1 位架構避免了歷史上伴隨低位量化而來的權衡,特別是糟糕的指令跟隨、多步驟推理錯誤和不可靠的工具使用。 - Claude 代碼源泄露揭示了 Anthropic 可以收集多少關於你和你的系統的信息 - Claude 代碼在給出過多命令時繞過安全規則 - 亞馬遜安全負責人:人工智能使滲透測試效率提高 40% - OpenAI 獲得 1220 億美元用於'僅僅構建東西',而世界正在摧毀他們 PrismML 的首席執行官兼創始人 Babak Hassibi 在一份聲明中表示:"我們花了多年時間開發所需的數學理論,以在不失去推理能力的情況下壓縮神經網絡。" "我們將 1 位視為起點,而不是終點。" Hassibi 認為,該公司的 1 位架構建立了一種新的人工智能範式,專注於每單位計算和能量的智能。 為了鼓勵其他人朝這個方向思考——還記得性能每瓦特成為熱門話題的時候嗎?——PrismML 提出了智能密度的測量,這一指標使其模型展現出良好的表現。 該公司解釋道:"我們將智能密度定義為模型平均錯誤率的負對數(在相同基準套件中)除以模型大小。" 在智能密度評估中,Qwen3 8B 在各種基準測試(MMLU Redux、MuSR、GSM8K 等)中稍微領先於 Bonsai 8B,智能密度得分僅為 0.10/GB,遠低於 Bonsai 8B 的 1.06/GB。 指標可能對營銷很重要,但 PrismML 模型更有意義的標準是它們將人工智能從雲數據中心移出的潛力。該公司預見其模型將為設備上的代理、實時機器人、安全企業系統以及其他在內存帶寬、功率或合規性限制下可能妨礙部署的項目提供動力。 該公司表示:"1 位 Bonsai 8B 可以通過 MLX 在 Apple 設備(Mac、iPhone、iPad)上原生運行,通過 Nvidia GPU 通過 llama.cpp CUDA 運行。" "模型權重今天可以在 Apache 2.0 許可證下獲得。" 還有兩個較小的模型可用:1 位 Bonsai 4B 和 1 位 Bonsai 1.7B。® ### 相關股票 - [NVDX.US](https://longbridge.com/zh-HK/quote/NVDX.US.md) - [IXN.US](https://longbridge.com/zh-HK/quote/IXN.US.md) - [SMH.US](https://longbridge.com/zh-HK/quote/SMH.US.md) - [AAPB.US](https://longbridge.com/zh-HK/quote/AAPB.US.md) - [XSD.US](https://longbridge.com/zh-HK/quote/XSD.US.md) - [NVDL.US](https://longbridge.com/zh-HK/quote/NVDL.US.md) - [SOXL.US](https://longbridge.com/zh-HK/quote/SOXL.US.md) - [PSI.US](https://longbridge.com/zh-HK/quote/PSI.US.md) - [AAPX.US](https://longbridge.com/zh-HK/quote/AAPX.US.md) - [SOXX.US](https://longbridge.com/zh-HK/quote/SOXX.US.md) - [NVDU.US](https://longbridge.com/zh-HK/quote/NVDU.US.md) - [AAPL.US](https://longbridge.com/zh-HK/quote/AAPL.US.md) - [NVDA.US](https://longbridge.com/zh-HK/quote/NVDA.US.md) ## 相關資訊與研究 - [倚天酷碁營收/3 月 4.21 億元創新高 月增 64.06%、年增 29.15%](https://longbridge.com/zh-HK/news/282142921.md) - [今年股價漲 84%!桃園農田崛起的載板設備新寵,它如何憑 2 數字黏牢輝達供應商,助欣興良率成長近 3 成?](https://longbridge.com/zh-HK/news/282046068.md) - [當員工都不願賣:Anthropic 的估值遊戲,進入「賣方消失」階段](https://longbridge.com/zh-HK/news/282128570.md) - [DXC 與 ServiceNow 攜手合作,迎來新一波人工智能優先的企業轉型](https://longbridge.com/zh-HK/news/281925517.md) - [輝達買下 SchedMD 取得 AI 開源軟體,引發公平競爭疑慮](https://longbridge.com/zh-HK/news/281950411.md)