
06.09 MiMo × TileRT,要想富先修路

今天 MiMo × TileRT 聯合發佈 Xiaomi MiMo-V2.5-Pro 的 UltraSpeed 模式,通過模型與系統的極致 Codesign,在通用 GPU 上將萬億參數模型的生成速度首次突破了 1000 tokens/s。股價依然低迷看到這個消息,垂死病中驚坐起,還是挺欣慰的,感覺又有了寫的動力。
端側受益:手機、AIoT 最先感受到變化
最可能快速受益的是手機、AIoT 等受限於硬件、無法本地運行大模型的小設備。
以智能安防攝像頭為例,目前端側輕量模型完成一次人臉比對約需 200ms,精度有限;調用雲端大模型輔助分析雖然更準,但響應通常需要 2-3 秒,用户體感明顯卡頓。UltraSpeed 下,一個 200 token 的典型請求雲端響應僅需約 0.2 秒, 精度上了一個台階,延遲卻降了一個數量級。
類似場景還有很多:智能門鎖的人臉確認、智能音箱的多輪對話、翻譯機的長句處理。當雲端大模型的響應速度逼近端側推理的量級時,一個關鍵的經濟臨界點就被突破了——"端側小模型處理高頻簡單任務 + 雲端大模型實時處理複雜任務"的分層架構,從可選方案變為最優解。
這對小米"人車家"生態的意義尤其大:這些場景目前大量停留在端側規則編排階段,智能化水平並不高。當每一個終端設備都能以接近本地的速度調用雲端智能時,整個生態的智能化水平會整體抬升一個台階。
智駕受益:目前主要影響生產端
對車端實時駕駛:目前還無法直接使用,因為智駕對延遲的要求是 80-100ms 級別,而且必須在無網絡環境下穩定工作。UltraSpeed 的 0.2 秒響應仍然不夠,車端推理仍是不可替代的。特斯拉憑藉 AI5 自研芯片在車端直接運行大模型,這個硬件優勢目前沒有捷徑可繞過。
但生產端意義比較大,小米和特斯拉的差別在於使用了 Thor 芯片,更多依賴於軟件優化和雲端大模型蒸餾。UltraSpeed 有兩個特點,一個是讓蒸餾效率提升約 10 倍,二是用的通用 GPU,也就是帶來了性價比極高的雲端迭代速度,在目前硬件採購和芯片博弈的階段,先通過軟件效率也能快速推進智駕水平。
未來趨勢:要想富,先修路
MiMo 今年的發展速度確實驚人:年初 API 上線,4 月 2.5 版本,5 月大幅降價,今天又宣佈 UltraSpeed 1000 tokens/s 模式試用,精準契合了硬件生態對 AI 的剛需。
從趨勢看,具備自研大模型和自研芯片的能力,是未來 AI 產品的入場券。目前 MiMo 的優化已經相當出色,如果芯片能有更好的協同定製,再輔以 OS 在帶寬和調度上的加持,未來的提升空間巨大。
AI × 芯片 × OS,是承載上層所有應用和體驗的底層基礎設施。很多事情按當前的常識看似乎不可能發生,但當推理成本足夠低、速度足夠快,突破臨界點之後,常識就會被改寫,產品力和競爭力也會隨之變化。
小米在自研大模型、自研芯片、OS 優化三個方向上持續重投入,結合近期金山雲增持進一步加強雲端基礎設施,想起了那句老話:要想富,先修路。
$小米集團-W(01810.HK)
本文版權歸屬原作者/機構所有。
當前內容僅代表作者觀點,與本平台立場無關。內容僅供投資者參考,亦不構成任何投資建議。如對本平台提供的內容服務有任何疑問或建議,請聯絡我們。



