谷歌發佈首個原生多模態嵌入模型 Gemini Embedding 2

華爾街見聞
2026.03.10 23:36
portai
我是 PortAI,我可以總結文章信息。

谷歌 DeepMind 於 3 月 10 日推出首個原生多模態嵌入模型 Gemini Embedding 2,可將文本、圖像、視頻、音頻及文檔統一映射至單一嵌入空間。模型支持超 100 種語言,首次引入原生語音嵌入能力,無需語音轉文字中間環節。採用 MRL 技術支持靈活壓縮向量維度,兼顧性能與存儲成本。