Dolphin Research
2026.06.03 09:59

AI 超連接時代:AI 向 “光” 飛奔?

portai
我是 LongbridgeAI,我可以總結文章信息。

22 年底 ChatGPT 橫空出世以來,從算力(GPU)、存力(存儲),指揮調度力(CPU)……AI 已經帶動了一個又一個的半導體超級產業機會、一個又一個的萬億美金市值公司。

如果説在 AI 基建中,還有一個板塊尚待出現一個萬億市值 “待爆帝” 的話,海豚君接下來最為看好的就是 AI 時代的超級連接了。如果説算力解決了 AI“智商” 問題,存力解決了 AI“記憶力” 問題,那麼運力要解決的就是如何將長、短期記憶 “坐上火箭般的速度” 高速出入腦力中心。

或者借用 AI 教皇黃仁勳的説法,隨着算力、內存瓶頸的逐步緩解,能源又是一個十年級的持續難度,下一個核心卡點是 AI 時代網絡的高速互聯,因為傳統雲時代的網絡基建完全無法匹配 Agentic AI 時代下,數萬億模型參數、混合專家(MoE)、局部激活下,對網絡帶寬的傳輸需求。

本篇,就接着 AI 網絡傳輸速度下逐步切換的光電傳輸技術方向——CPO 來探索一下 AI 時代的網絡傳輸。海豚君對於 CPO 的研究分為:

一、什麼是 CPO,它真的能替代傳統的銅連接嗎?

二、它是否又能完全替代當前主流的可插拔光模塊?

二、在此趨勢下,產業內上下游公司的競爭格局又將如何變化?

在本篇文章中,我們首先對產業鏈的基本問題做一個梳理。

正文:

一、什麼是 CPO?

在傳統數據中心架構當中,有一個重要的部件即 “光模塊”,它的作用是將光線傳輸過來的光信號轉化為電信號傳遞給數據中心,或者將數據中心內產生的電信號轉化為光信號並且傳遞給光纖,在數據傳輸中起到 “橋樑” 和 “翻譯” 的作用。

從作用上講,CPO(即共封裝光學)架構當中,包含了傳統光模塊的功能,但有以下兩個明顯差異:

1、結構不同

傳統的光模塊是可插拔的,表面看起來就像家裏網線端口上的水晶頭,但 CPO 完全不同,它將負責光電轉換的光引擎,和芯片(這裏主要是交換機的 ASIC 芯片)直接集成在同一封裝基板或者中介層上。

2、應用場景不同

光模塊通常應用於機櫃間(即 Scale-out);而 CPO 既可以應用於機櫃間,也可以應用於機櫃內(Scale-up),應用於機櫃間,替代的是傳統的光模塊,應用於機櫃內,替代的則是目前主流的銅連接。

圖:傳統可插拔模式與 CPO 方案示意

資料來源:GTC 2025,Dolphin Research

我們可以看到,近期無論是$英偉達(NVDA.US) ,還是$博通(AVGO.US) ,都在積極推動他們 CPO 交換機方案。

那麼 CPO 技術為什麼會得到如此重視呢?因為數據中心對算力需求持續提升,數據中心對數據傳輸的帶寬需求也呈爆發式增長,且數據中心正在往超大規模算力集羣的方向發展,那麼在此過程中,舊有的傳統數據傳輸技術會形成諸多阻礙:

1、帶寬瓶頸

對於機櫃間場景,由於傳統交換機面板空間有限,而傳統可插拔光模塊尺寸又難以縮小,導致單台交換機能夠提供的端口受限,無法支持越來越高的帶寬要求。

目前可插拔模塊最高可支持 1.6Tbps 單模塊帶寬,單個交換機面板最多可支持 51.2Tbps 帶寬,未來有可能推出 3.2Tbps 模塊,交換機最高支持 102.4Tbps,這幾乎已經達到可插拔光模塊的極限。

2、信號完整性瓶頸

在機櫃內場景,隨着傳輸速率提升,如果使用傳統的銅纜,那麼電信號在長距離傳輸時會面臨嚴重信號衰減和失真,並且傳輸距離也會越來越受限。

目前銅纜最高可支持 1.8TB/s 帶寬(如英偉達的 NVLink 銅纜),且距離被嚴格限制在 2 米以內,但單 GPU 對帶寬需求正在向 3.6TB/s 邁進。

3、散熱和功耗瓶頸

隨着傳輸速率提高,傳統通訊鏈路的功耗大幅上升,同時散熱也越來越面臨困難。我們知道目前美國數據中心建設面臨極大的能源障礙,所以功耗問題會帶來顯著的成本壓力。

CPO 理論上可以較好地解決上述幾項問題,根據英偉達,應用 CPO 後功率效率可以提升 3.5 倍。

二、具體而言,數據中心的數據傳輸場景有哪些?

這裏我們對數據中心在不同場景和不同環節中的數據傳輸技術路線進行拆分:

圖:Scale-out 和 Scale-up 示例

資料來源:NADDOD,Dolphin Research

1、Scale-up,主要涉及機櫃內互聯

主要涉及機櫃內,尤其是服務器內的硬件互連,包括但不限於 CPU、GPU、網卡、DDR 內存以及硬盤之間的互連。

目前這部分連接主要以銅為主要連接介質,包括用來連接 CPU、GPU 以及網卡的 PCle 插槽以及內存插槽(PCB 銅走線),SATA 線等各類銅纜等。而 CPO 有可能顛覆目前的主流方案。

2、Scale-out,主要涉及機櫃間互聯

主要涉及機櫃或者服務器以及交換機之間的互連。

這部分連接就需要以光作為連接介質了,目前主要以光纖和可插拔光模塊為主要方案。同樣,CPO 是重要發展趨勢,且比機櫃內場景進展更快。

3、更進一步地,還有數據中心之間以及數據中心與外部的互連,這部分不是本文的討論重點。

從巨頭佈局來看,CPO 現階段在場景上主要面向機櫃間,但未來可能面向機櫃內場景。

三、CPO 目前還處在初步的推廣階段,面臨的主要瓶頸是什麼?

1、先進封裝技術的成熟

從底層技術來看,CPO 與諸如可插拔光模塊這類傳統方案相比完全不同。傳統光電子零部件從生產技術上與廣義的光電子元器件及模組差異不大,但 CPO 需要將光引擎封裝到基板或中介層,主要依靠的卻是先進封裝技術如 CoWoS

與此同時,相對於我們通常所理解的先進封裝,CPO 也有所不同,因為它不只要集成電子集成電路,同時還要集成光子集成電路,那麼這種異質集成需要通過諸如$台積電(TSM.US) COUPE 技術進行混合鍵合。

問題在於,一方面,上述先進封裝技術工藝難度極大,無論是英偉達還是博通,都依賴台積電產能,但產能是有限的,除此之外,包括所需的光耦和設備、混合鍵合設備、測試設備,以及 ABF 基板等材料的供應也可能存在障礙;

並且,現階段上述先進封裝技術,尤其是異質集成的生產良率還存在很大提升空間,導致成本遠高於可插拔方案。目前台積電正努力提升先進封裝良率,但仍需要一定的時間。

2、檢修和維護問題

對於傳統可插拔方案而言,由於它們是 “可插拔” 的,所以檢修和維護很方便。但 CPO 完全不同,它的光電模塊與基板、中介層甚至芯片直接封裝在一起,那麼檢修和維護難度會顯著大於傳統方案。

但以上問題也是可以解決的,比如從設計上提高一定的容錯率,或者在運營層面佈局一定的冗餘等等。

3、熱管理問題

光引擎與芯片進行高密度封裝,在運行時會導致局部升温明顯,甚至超過激光器的耐受極限,所以熱管理也是一個大問題。為了解決以上問題,需要引入更高效的散熱方案,但這同樣會涉及成本。

4、標準化問題

目前英偉達、博通等為了搶佔市場先機,積極推出自己完整的獨立的 CPO 交換機方案。但與此同時,行業標準(接口標準、封裝標準等)還暫未形成,如此一來,上下游難以基於統一標準進行研發、生產和配置,這也是商業化推廣的難點所在。

總之,可以看到,以上問題均存在解決方案,只不過要依靠技術的成熟、標準的制定等,但這都需要時間。

另一方面,從根本上講,CPO 技術在綜合成本上需要形成優勢。

那麼這就延伸出一個問題:無論何種方案,成本總是核心考量因素,但除 CPO 外,也有其他更先進,或者更保守的路線在推進當中,它們之間呈現怎樣的關係呢?這裏我們先區分下不同技術路線的差異。

四、技術路線比較

1、CPO

我們討論的 CPO,也就是共封裝光學(Co-Packaged Optics),如上文所述,指的是將光引擎和芯片封裝在同一基板上,這裏的芯片既可以是交換芯片(Asic),也可以是 GPU 等計算芯片,但通常指的是交換芯片。

2、NPO

NPO 是近封裝光學(Near-Packaged Optics),比 CPO 初級一點,還沒有打到封裝在同一基板甚至中介層這樣的尺度,而只是封裝在同一塊 PCB 母板上。

中國國內包括$阿里巴巴(BABA.US) 、華為等都在推動 NPO 方案,這更多可看作是缺乏先進封裝產能下的一種妥協方案,但可能在一段時間內成為中國市場的主流方案,這一定程度上會影響到英偉達方案在中國市場的滲透。

圖:不同集成方式展示:(從上到下分別為可插拔方式、NPO、CPO(集成在封裝基板)、CPO(集成在中介層),以及下面要説的 OIO)

資料來源:ASE,Dolphin Research

3、OIO

OIO(Optical I/O)可看作是 CPO 的進階,這裏就沒有交換芯片的事情了,主要跟計算芯片相關,指的是將光引擎與計算芯片封裝在一起,甚至是直接在芯片層面上結合在一起,這面向的完全是機櫃內場景。

圖:不同集成方式展示:可插拔、CPO、OIO

資料來源:台積電,Openlight,Dolphin Research

談到這裏,我們再來明確一下數據中心的架構:

數據中心,可以看作是以下幾個部分互相連接:

服務器專注於計算任務,內部裝載 GPU、CPU 等計算芯片,內存、硬盤等;

交換機則負責服務器之間以及服務器向外部的網絡通信,通過 ASIC 芯片實現數據交換;

除此之外還有存儲系統,在目前主流數據中心架構當中,存儲器主要分散佈置在服務器節點,並放置於在服務器內部,與服務器結合在一起。

基於上述架構,我們就能可以想象 CPO 的應用場景。那麼在此基礎上,我們討論下,為什麼 CPO 率先從交換芯片開始?

這裏我們對交換機的作用做個類比——交換機可以看作是數據中心內部的立交橋,那麼可以想象,交換機所承擔的數據傳輸帶寬壓力、端口密度以及與之相伴隨的功耗瓶頸是最大的,那麼自然對 CPO 的需求更迫切。

4、CPC

CPC,是共封裝銅互聯(Co-Packaged Copper),指的是把高速銅連接器直接集成在封裝基板上。

這種技術路線的成本優勢是非常明顯的,但仍然解決不了銅介質的帶寬瓶頸和衰減問題,所以應用場景比較受限,可以部分應用在機櫃內部的 GPU/CPU 節點與交換機及存儲芯片之間的連接。目前英偉達機櫃內方案仍採用銅連接,但未來可能將向光互連切換。

5、LPO

LPO,則是線性驅動可插拔光學(Linear-Drive Pluggable Optics),是一種瘦身版的可插拔光學,通過去除內部的 DSP/CDR 芯片,僅保留並強化模擬芯片 Driver 和 TIA(這些部件的作用我們後面會講),實現信號直驅。

説白了,就是在光模塊中直接踢掉功耗大的 DSP 芯片,放棄信號糾錯;同時強化模擬芯片,無論信號準確與否,通過模擬放大,直接讓交換機 ASIC 的電信號來衝進來驅動激光器。

圖:傳統模式與 LPO 結構對比示意

資料來源:Bryon Moyer,Semiconductor Engineering,Dolphin Research

但這裏同樣存在問題,由於 PCB 走線並沒有省略(會造成信號衰減),同時對信號質量要求又更高,於是長距離傳輸還是受限,並且當速率邁向更高維度(1.6T 以上)時,信號完整性問題會格外凸顯。也就是説,簡化結構的同時,性能上也會有所犧牲。

綜上我們可以看到,儘管存在 NPO、CPC、LPO 等折中路線,但隨着數據中心邁向更高速率和更大集羣,這些折中方案總歸會面臨瓶頸,CPO 是未來必須要突破的下一代方案。

6、光電路交換機(OCS)又是什麼,會威脅到 CPO 的地位嗎?

談到這裏,無可迴避地會涉及到 OCS(Optical Circuit Switch)。OCS 這種交換機的核心特點是全過程沒有光電交換,通過光開關矩陣,直接在光域內建立物理光路。

圖:OCS 示意

資料來源:Orbray,Dolphin Research

可以直觀地想象,它就像是由一排排反射鏡(微鏡陣列)組成,可以根據指令調整反射鏡的角度,向不同的角度反射光線。

表面上看起來,OCS 是直接轉發光信號,替代傳統交換機光 - 電和電 - 光轉換過程,似乎用這種技術路線,就不需要 CPO 了(至少不需要交換機環節的 CPO)。但實際並不是這樣的。

這裏我們梳理下,在數據中心當中,交換機的架構是如何構建的:

(1)主板內:首先我們知道數據中心內最核心的計算是通過 GPU 實現的,GPU 計算完畢後,需要將數據傳遞給 CPU,CPU 經過處理後再傳遞給網卡(內含 ASIC),或者也可以由 GPU 直接傳輸給網卡。

那麼以上環節可以在一塊主板上實現,或者至少可以在一台服務器內實現。

(2)機櫃內:之後,數據就要從服務器傳遞到機櫃的交換機上。一個機櫃內可以有多台服務器高速互聯,但機櫃頂上必須有一個交換機,用來與外部通訊,將機櫃內的數據與外部的數據做交換。這裏這個交換機叫做 ToR(Top of Rack)交換機。

而以上環節是在同一機櫃內實現的。

(3)機櫃間:數據中心是由多個機櫃組成的集羣,機櫃和機櫃間的通訊如何調度呢?這裏就需要 Spine 交換機發揮作用了。Spine 交換機負責管理所有 Leaf 交換機之間,以及向數據中心外部的高速連接,它是數據中心內整個交換機網絡的樞紐。

圖:在數據中心中,Spine 交換機和 Leaf 交換機示意

資料來源:Bryon Moyer,Semiconductor Engineering,Dolphin Research

而 OCS 主要用來替代的是 Spine 交換機。

首先,Spine 交換機價格高且功耗高,替代方案的需求最迫切。

其次,OCS 作用是有限的,它只能轉發信號(反射光線),就像反光鏡。但傳統交換機功能更完整,它需要拆數據包,看 IP 地址,然後決定往哪裏轉。所以説,由於 OCS 只能執行指令,沒有判斷能力,那麼在這種情況下,它只被用來充當 Spine 交換機是可行的,但要是想把 Leaf 交換機也替代了,那就需要新增別的部件來執行 “封包處理” 功能,比如智能網卡(SmartNIC),那麼這個架構就複雜了,它不一定是最好的方案。

這麼看下來,架構就很清楚了:

雖然現階段,英偉達推出的 Quantum X800-Q3450、博通等推出的 Tomahawk 6 - Davisson 等 CPO 路線的交換機,都是 Spine 交換機,而$谷歌-C(GOOG.US) 推動 OCS 交換機,替代的也是傳統 Spine 交換機,兩者之間的確存在直接競爭關係。

但終局來看,雖然 OCS 有機會替代 Spine 交換機,但再往下,對於用量更大的,Leaf 交換機上光引擎與 ASIC 芯片之間的電光轉換,到服務器內主板與主板之間的連接(通過網卡 ASIC 或 NVSwitch 等),再到主板上計算芯片與計算芯片之間&計算芯片與網卡 ASIC 之間的連接,仍然需要使用 CPO。所以未來兩者更多是相輔相成的關係。

五、涉及到的產業鏈環節有哪些?

(一)首先我們解析下 CPO 的原理和架構

CPO 可看作是升級版的光引擎,而光引擎的作用是進行光電轉換,它主要包括以下幾個部分:

1、光子電路部分

(1)調製器:通過控制光的強弱和信號,把電信號(0/1 數字)寫成光信號。

(2)探測器:是 PD(Photodiode,光電二極管),把光信號轉換成電信號。

(3)波導:可以理解為芯片內部印上去的微型光纖。

2、電子電路部分

(1)Driver(驅動器):將交換機或者服務器傳來的微弱電信號放大成能精確控制激光器發光的電信號,所以 Driver 的下一個環節就是調製器。

(2)TIA(跨阻放大器):將 PD 產生的極其微弱的電信號,放大並轉換成可供後續電路處理的電壓信號,所以 TIA 是 PD 的下一個環節。

3、光源,也就是激光器

調製器自己是不能發光的,但它能控制光,所以這裏就需要一個發光的部件與之配合,也就是激光器。

資料:光引擎結構示意

資料來源:宗澤國等,《400G FR4 硅光收發模塊的研究》,Dolphin Research

另外還有兩個部件:

4、DSP 和 CDR,它們都是用來修復電信號的。一個用來補償電信號的物理損傷,一個用來從受損信號中提取精確時鐘,並重整數據時序,其中 DSP 芯片通常集成 CDR 功能。

CPO 與 LPO 類似的一點是,它們都將高功耗、高成本,延遲源的 DSP 從光引擎中移除。但 CPO 方案下,DSP 部分功能集成到了交換 ASIC 中,而 LPO 是用模擬芯片放大硬剛的方案),另外 CPO 會將 CDR 集成到高速 SerDes。

而什麼是高速 SerDes呢?高速 SerDes 包括 Ser 串行器和 Des 解串器,它們位於 Asic 芯片內部,分別用來將芯片內部並行數據打包成高速串行數據流,或者將高速串行數據流解包還原成多路低速並行數據。

(二)再看整個 CPO 產業鏈涉及到哪些環節:

1、首先是 CPO 整體

CPO 中的光引擎包含了上述提到的光子電路部分和電子電路部分,然後光引擎與 ASIC 芯片構成 CPO 交換機主體部分。這裏先説一個核心問題誰來做這個 CPO?

傳統的光模塊作為由光學組件、分立器件等組成的獨立模塊,可以由專業性生產廠商來完整提供,比如我們耳熟能詳的$中際旭創(300308.SZ)$新易盛(300502.SZ) 、Coherent,那麼 CPO 呢?顯然不可能再由它們來主導了。

我們傾向於認為,CPO 下的產業價值走向會是這樣的:

(1)掌握核心技術的交換廠商和平台商:掌握英偉達/Google/博通/$邁威爾科技(MRVL.US) 這樣的數據中心繫統平台方&交換芯片廠商來定義架構和標準 + 賣整套產品;

(2)代工廠:台積電/$日月光半導體(ASX.US) /$艾克爾科技(AMKR.US) 這些 Fab 廠/封測廠來進行晶圓製造/光電集成/先進封裝代工;

(3)上游供應商:$Coherent Corp.(COHR.US) /$Lumentum控股(LITE.US) 這些器件廠繼續進行光電器件的生產和供應。

(4)傳統光模塊廠商:中際旭創/新易盛等過渡期內提供 NPO、LPO 等中間路線,以及基於可維護性考量的折中 CPO 設計方案下,繼續提供光引擎模塊

2、除了 CPO 的核心光引擎之外,還有幾個組件需要關注

(1)激光器

CPO 只能夠集成光電轉換部件,直接集成激光器還存在難度,因此仍然需要外置激光器。與此同時,CPO 對激光器的功率要求大幅增加(至少增加 3-4 倍),對應性能和可靠性要求也大幅提高,因此價值量也會大幅增加。

不過,這裏存在技術路線的選擇:

1)EML 激光器:傳統路線,它將激光器和調製器集成在一起,優勢是適合 200G 以上高帶寬和長距離通訊。這個路線被 Lumentum、II-VI(Coherent)、住友等巨頭壟斷。

2)CW 激光器:新興路線,它把激光器完全獨立,在成本和功耗上有優勢,也更匹配未來的 CPO 路線。CW 激光器供應相對靈活,中國的源傑科技、仕佳光子、長光華芯等廠商已實現 70mW/100mW 產品量產並獲大額訂單。

圖:EML 和 CW 激光器的區別示意

資料來源:住友電工,Dolphin Research

接着是四大光纖組件,這些組件在傳統可插拔光模塊路線下很少用到:

(2)光纖陣列單元(FAU,Fiber Array Unit):用來將光纖精確地安裝,以實現光纖與波導之間的高精度對準。

圖:Fiber Array Unit

資料來源:Corning,Dolphin Research

(3)保偏光纖(PMF,Polarization Maintaining Fiber):是一種特殊的光纖,用來使得光波的偏振態保持不變。

(4)光纖分配盒(Fiber Shuffle):用來排列光纖,可以將複雜的高密度設備裏的光纖的位置順序重新排列。

圖:Fiber Shuffle 示意

資料來源:Hyoptic,Dolphin Research

(5)光纖連接器(MPO,Multi-Fiber Push On):用於多芯光纖之間的相互連接。

圖:MPO 端口示意

資料來源:Senko,US Conec,Dolphin Research

為什麼傳統光模塊很少用到上述組件?

(1)傳統模式下,光纖直接插入標準化接口,但在 CPO 下,光纖需要與光芯片表面的波導進行高精度耦合,所以需要用到 FAU;

(2)傳統模式是直接調製,對光波的偏振態不敏感,且此前保偏光纖(PMF)成本又極高,不太適合產業化應用,但 CPO 通過外部激光器供給光源,激光偏振態會導致巨大能量損耗,所以必須用到 PMF;

(3)傳統模式通常只有 1 發 1 收兩路光纖,沒有那麼複雜的光纖需要連接到背板,所以人工操作就可以,不需要 Fiber Shuffle,但 CPO 下必須使用 Fiber Shuffle;

(4)同樣,傳統模塊也不需要很多接口,但 CPO 下如果達到 400G 以上,需要 8 根甚至 16 跟光纖並行傳輸,而面板空間又有限,所以需要 MPO 這種多芯連接器。

那麼對於市場空間,以及 CPO 所涉及到的產業環節投資機會,我們會在下篇中進行分析。

<此處結束>

本文版權歸屬原作者/機構所有。

當前內容僅代表作者觀點,與本平台立場無關。內容僅供投資者參考,亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議,請聯絡我們。