专题：mrl

谷歌发布Gemini Embedding 2：多模态数据统一嵌入空间

媒体量子位2026/03/11 17:308920

• 多模态数据统一嵌入空间

• 支持图像、视频、音频等混合输入

谷歌推出Gemini Embedding 2，首次将文本、图像、视频、音频和文档统一映射到同一语义空间，实现跨模态语义对齐。该模型支持多模态混合输入，提升AI Agent理解屏幕和环境的能力，技术上采用MRL方法，可动态调整向量维度，适用于RAG、语义搜索、情感分析等场景。