谷歌发布首个原生多模态嵌入模型 Gemini Embedding 2

华尔街见闻
2026.03.10 23:36
portai
我是 PortAI,我可以总结文章信息。

谷歌 DeepMind 于 3 月 10 日推出首个原生多模态嵌入模型 Gemini Embedding 2,可将文本、图像、视频、音频及文档统一映射至单一嵌入空间。模型支持超 100 种语言,首次引入原生语音嵌入能力,无需语音转文字中间环节。采用 MRL 技术支持灵活压缩向量维度,兼顾性能与存储成本。