本文綜合自 - 系統化投資。在人工智能浪潮下,英偉達無疑是站在風口浪尖的一家公司,成為了首家市值達到 1 萬億美元的芯片製造商。而英偉達之所以能獨領風騷,一個關鍵原因在於其廣受人工智能領域追捧的芯片產品,即 A100 芯片及更高一代的 H100 芯片,目前這些高端芯片及相應的顯卡已是一卡難求。而就在去年 11 月發佈的 H200,預計於 2024 年第二季度開始供貨,到時必然引起搶購。微軟亞洲研究員的高級研究員張弋近期在播客節目中感嘆,現在居然到了整個地球都拿不出足夠的 A100 芯片的奇怪場景。一年前,幾乎無人料到這一情形。英偉達 2020 年推出的 A100 芯片現在是有價無市,而乘着 ChatGPT 爆紅的 H100 更是被大公司瘋狂搶購。這也讓英偉達的業績一路高歌,股價更是節節高升。人工智能領域的初創公司 Core Weave 創始人兼首席執行官 Brannin McBee 不禁感嘆:H100 是地球上最稀缺的工程資源之一。這句表態足以讓人窺得英偉達現在的盛景。但世上芯片千千萬,為何只有英偉達的芯片成為人工智能領域獨一無二的玩家?而英偉達這一向來在顯卡稱霸的公司,又為何能在深度學習和人工智能領域打下這麼大的一片江山?微軟的兩次推進1999 年,初露頭角的英偉達首次推出了 GPU 這一概念。在此之前,包括英特爾在內的 CPU 廠商都堅信圖形處理是 CPU 的活,CPU 乾的事情越多越好,將圖形工作獨立到另一附屬處理器上的想法十分雞肋。當時,圖形應用領域中又以搞遊戲的日本廠商話語權最重。日系主機的 CPU 很強,大部分開發工作都集中於 CPU 之上,因此 GPU 並沒有得到多少市場空間。轉機在於,不服氣的微軟想要衝擊屬於日本廠商的行業領先地位,其開發出了 Direct X 這一標準化的 API 圖形接口,此後大量的圖形功能從 CPU 裏面移植出來,轉到 GPU 之上。加上微軟另一產品 Xbox 的推出,其 CPU、GPU 各司其職的搭配,打破了行業內 CPU 芯片一家獨大的局面。而英偉達是當年硬件領域唯幾跟着微軟旗幟前進的公司,並在 GPU 這條道上一路走到黑。此後,微軟又推動了另一次變革,引入統一渲染技術,即讓 GPU 將圖形繪製的頂點計算和之後的渲染兩個步驟進行合併。它和顯卡領域另一知名公司 ATI 合作了 GPU Xenos,成功應用了這一技術。無心插柳統一渲染只是圖形應用上的一步,但卻給英偉達帶來了完全不同的發展路徑,可以説是英偉達在後來 GPU 發展,甚至介入深度學習領域中的起點。在看到統一渲染架構之後,英偉達果斷的把自己從前的 GPU 架構推倒重來。其 GPU 流處理器被進行了細緻的分組,變成一個個小型流處理器且能單獨運行,解決了流處理器此前被綁定無法獨立運行而被迫閒置的問題。這奠定了英偉達後來革命性 CUDA 架構的出世。由於英偉達的流處理器是很獨立且標準的單元,極易控制和調度,這讓原本只能串行處理的任務可以被並行處理。這讓編程難度大大降低。與此同時,英偉達的競爭對手 ATI 卻因為早期沒有投入硬件架構變革,因為沿用過去的串行設計,沉沒成本越來越高,讓其革新變得越來越難且越來越貴,最後成功被英偉達擠出顯卡市場。此後,英偉達又在 2017 年引入了 Tensor Core 計算單元概念,其專門為深度學習而設計,支持更低精度的運算從而大幅節省了模型算力。這一專用的加速單元很大程度上排擠了 CUDA 處理深度學習的空間,但也同時打了英偉達競爭對手一個措手不及,讓 AI 專用芯片也不再吸引人。於是,英偉達 GPU 機緣巧合地成為 AI 領域最被認可的硬件。賭贏趨勢2003 年,“快速迭代,不斷試錯” 的英偉達搞了一個不受歡迎的項目。其開發了一款 Soc 芯片,將基於 ARM 架構的 CPU 與自己的 GPU 集成在一起。自 Soc 芯片之後,英偉達每隔幾年都發布一些芯片。2015 年,其推出了 Tegra K1,使用 Arm 公版 CPU 和自己的開普勒架構 GPU,但由於功耗和發熱皆不盡人意,對大部分使用者來説很是折磨。但業內人士卻對這些挫折十分認可。一位投資人曾指出,英偉達在守住 GPU 基本盤的同時,不斷在新的領域伸出觸角,並讓無數買它顯卡的人陪它分攤成本。他還稱讚道,雖然英偉達的很多東西,如 CUDA 在一段時間內看不到落地的場景,但在試錯過程中它建立起了完整的生態,並在一股新風向襲來的時候,成功站上了風口。這也是英偉達 GPU 打敗其他芯片,成功吃下 AI 紅利的一個原因。一方面,GPU 的通用性更佳,比專用芯片更適應變化;另一方面,英偉達擁有完整生態,讓它的 GPU 成為當下最合適的那個選擇。事實上,當 AI 一瞬間爆發,行業內的企業無奈發現,GPU 是簡單高效運行生成式 AI 模型的最好選擇,一個本用來玩遊戲的 GPU 不太可能切換去跑 AI 程序,目前只有英偉達的 GPU 能夠做到運行 AI 模型。而英偉達的故事裏還有一個小彩蛋。2016 年,英偉達發佈了第一款深度學習的超級計算機 DXG-1。令人稱道的是,英偉達首席執行官黃仁勳當年彷彿能預知未來,將第一台 DXG-1 捐給了當時還是初創企業的 OpenAI。2022 年,OpenAI 帶着橫空出世的 ChatGPT 引爆了人工智能概念,也帶動英偉達成為芯片領域中的香餑餑。這一段緣分不得不令人感慨,但又像是黃仁勳遠見之下的善果。CPU 與 GPU 的區別CPU 和 GPU 都是運算的處理器,在架構組成上都包括 3 個部分:運算單元 ALU、控制單元 Control 和緩存單元 Cache,但是,三者的組成比例卻相差很大,在 CPU 中緩存單元大概佔 50%,控制單元 25%,運算單元 25%;在 GPU 中緩存單元大概佔 5%,控制單元 5%,運算單元 90%。