--- title: "月之暗面提出 Attention Residuals 架構,優化 Transformer 模型" type: "News" locale: "zh-HK" url: "https://longbridge.com/zh-HK/news/279393793.md" description: "Moonshot AI 近日推出全新架構 Attention Residuals(AttnRes),旨在優化基於 Transformer 的大語言模型的信息處理。該架構通過深度注意力機制,允許網絡層動態選擇和加權組合先前層級的信息,解決了傳統殘差連接導致的信息模糊問題。AttnRes 顯著提升了模型在長上下文推理中的穩定性與效率,標誌着殘差組件向更可擴展、自適應方向的演進,為下一代高效能 AI 系統奠定基礎。" datetime: "2026-03-17T08:30:35.000Z" locales: - [zh-CN](https://longbridge.com/zh-CN/news/279393793.md) - [en](https://longbridge.com/en/news/279393793.md) - [zh-HK](https://longbridge.com/zh-HK/news/279393793.md) --- # 月之暗面提出 Attention Residuals 架構,優化 Transformer 模型 品玩 3 月 17 日訊,Moonshot AI 近日發佈名為 Attention Residuals(AttnRes)的全新架構概念,旨在革新基於 Transformer 的大語言模型信息處理機制。針對傳統殘差連接中各層輸出等權疊加導致信息模糊的侷限,AttnRes 引入深度注意力機制,允許網絡層動態選擇並加權組合先前層級的信息。 該方法將模型深度視為序列維度,使各層能主動檢索歷史特徵,而非被動接收混合信號。此舉有效解決了深層網絡中隱藏狀態冗餘及缺乏選擇性訪問的問題,顯著提升了模型在長上下文推理中的穩定性與效率。作為 Kimi 系列模型背後的技術突破,AttnRes 體現了將注意力機制擴展至網絡層級結構的趨勢。 Moonshot AI 持續通過架構創新推動大模型發展,其萬億參數混合專家系統已應用於複雜推理任務。AttnRes 的提出標誌着即使是最基礎的殘差組件,仍在向更 scalable、自適應的方向演進,為構建下一代高效能 AI 系統奠定理論基礎。 ### 相關股票 - [512720.CN](https://longbridge.com/zh-HK/quote/512720.CN.md) - [SOXX.US](https://longbridge.com/zh-HK/quote/SOXX.US.md) - [IXN.US](https://longbridge.com/zh-HK/quote/IXN.US.md) - [XSD.US](https://longbridge.com/zh-HK/quote/XSD.US.md) - [SOXL.US](https://longbridge.com/zh-HK/quote/SOXL.US.md) - [512480.CN](https://longbridge.com/zh-HK/quote/512480.CN.md) - [512760.CN](https://longbridge.com/zh-HK/quote/512760.CN.md) - [588170.CN](https://longbridge.com/zh-HK/quote/588170.CN.md) - [588780.CN](https://longbridge.com/zh-HK/quote/588780.CN.md) - [SMH.US](https://longbridge.com/zh-HK/quote/SMH.US.md) - [159325.CN](https://longbridge.com/zh-HK/quote/159325.CN.md) - [159998.CN](https://longbridge.com/zh-HK/quote/159998.CN.md) - [159995.CN](https://longbridge.com/zh-HK/quote/159995.CN.md) - [PSI.US](https://longbridge.com/zh-HK/quote/PSI.US.md) ## 相關資訊與研究 - [台積電:AI 需求依然極度強勁,2 奈米良率好,3 奈米破例擴產](https://longbridge.com/zh-HK/news/282955211.md) - [智原導入聯電 28 奈米 SST eFlash 平台 打造終端 AI IP 解決方案](https://longbridge.com/zh-HK/news/282699157.md) - [美媒:聯邦機構繞過禁令 私下測試 Anthropic 新模型](https://longbridge.com/zh-HK/news/282787397.md) - [被動元件新兵新聿科預計 4/22 登興櫃 AI 需求旺下半年樂觀全年雙位數成長](https://longbridge.com/zh-HK/news/282827233.md) - [AI 重塑功率元件供需結構 台股供應鏈價量齊揚](https://longbridge.com/zh-HK/news/282823102.md)