06.09 MiMo × TileRT，要想富先修路

今天 MiMo × TileRT 聯合發佈 Xiaomi MiMo-V2.5-Pro 的 UltraSpeed 模式，通過模型與系統的極致 Codesign，在通用 GPU 上將萬億參數模型的生成速度首次突破了 1000 tokens/s。股價依然低迷看到這個消息，垂死病中驚坐起，還是挺欣慰的，感覺又有了寫的動力。

端側受益：手機、AIoT 最先感受到變化

最可能快速受益的是手機、AIoT 等受限於硬件、無法本地運行大模型的小設備。

以智能安防攝像頭為例，目前端側輕量模型完成一次人臉比對約需 200ms，精度有限；調用雲端大模型輔助分析雖然更準，但響應通常需要 2-3 秒，用户體感明顯卡頓。UltraSpeed 下，一個 200 token 的典型請求雲端響應僅需約 0.2 秒， 精度上了一個台階，延遲卻降了一個數量級。

類似場景還有很多：智能門鎖的人臉確認、智能音箱的多輪對話、翻譯機的長句處理。當雲端大模型的響應速度逼近端側推理的量級時，一個關鍵的經濟臨界點就被突破了——"端側小模型處理高頻簡單任務 + 雲端大模型實時處理複雜任務"的分層架構，從可選方案變為最優解。

這對小米"人車家"生態的意義尤其大：這些場景目前大量停留在端側規則編排階段，智能化水平並不高。當每一個終端設備都能以接近本地的速度調用雲端智能時，整個生態的智能化水平會整體抬升一個台階。

智駕受益：目前主要影響生產端

對車端實時駕駛：目前還無法直接使用，因為智駕對延遲的要求是 80-100ms 級別，而且必須在無網絡環境下穩定工作。UltraSpeed 的 0.2 秒響應仍然不夠，車端推理仍是不可替代的。特斯拉憑藉 AI5 自研芯片在車端直接運行大模型，這個硬件優勢目前沒有捷徑可繞過。

但生產端意義比較大，小米和特斯拉的差別在於使用了 Thor 芯片，更多依賴於軟件優化和雲端大模型蒸餾。UltraSpeed 有兩個特點，一個是讓蒸餾效率提升約 10 倍，二是用的通用 GPU，也就是帶來了性價比極高的雲端迭代速度，在目前硬件採購和芯片博弈的階段，先通過軟件效率也能快速推進智駕水平。

未來趨勢：要想富，先修路

MiMo 今年的發展速度確實驚人：年初 API 上線，4 月 2.5 版本，5 月大幅降價，今天又宣佈 UltraSpeed 1000 tokens/s 模式試用，精準契合了硬件生態對 AI 的剛需。

從趨勢看，具備自研大模型和自研芯片的能力，是未來 AI 產品的入場券。目前 MiMo 的優化已經相當出色，如果芯片能有更好的協同定製，再輔以 OS 在帶寬和調度上的加持，未來的提升空間巨大。

AI × 芯片 × OS，是承載上層所有應用和體驗的底層基礎設施。很多事情按當前的常識看似乎不可能發生，但當推理成本足夠低、速度足夠快，突破臨界點之後，常識就會被改寫，產品力和競爭力也會隨之變化。

小米在自研大模型、自研芯片、OS 優化三個方向上持續重投入，結合近期金山雲增持進一步加強雲端基礎設施，想起了那句老話：要想富，先修路。

$小米集團-W(01810.HK)