DeepMind发布Gecko:专注于文档检索性能媲美大7倍模型

2024-04-07 13:55 · 稿源：站长之家

划重点:
⭐️ Gecko 是一种通用的文本嵌入模型，可用于训练文档检索、语义相似度和分类等任务。
⭐️ Gecko 通过从 LLM 中提炼知识，并融入到检索器中，实现了强大的检索性能。
⭐️ 在大规模文本嵌入基准上，具有256个嵌入维度的 Gecko 优于具有768个嵌入尺寸的现有模型。

站长之家（ChinaZ.com）4月7日消息:谷歌 DeepMind 发布了一种名为 Gecko 的文本嵌入模型，专注于文档检索、语义相似度和分类等多种任务。文本嵌入模型在自然语言处理中扮演着重要角色，通过将文本转换为高维向量空间中的向量表示，实现捕捉文本的语义信息。

Gecko 通过从 LLM 中提炼知识，然后融入到检索器中，实现了强大的检索性能。在大规模文本嵌入基准上，具有256个嵌入维度的 Gecko 表现优异，超越了具有768个嵌入尺寸的现有模型。

该研究为多个任务创建了通用嵌入模型，利用 LLM 生成的合成数据集 FRet 进行训练，并得到 LLM 的支持。

研究结果显示，Gecko 在与大7倍模型和5倍高维嵌入进行比较时，取得了相竞争的结果。Gecko 的出现为改善信息检索系统提供了一种强大的替代方案，同时在分类、STS 和摘要方面也达到了新的 SOTA 水平。

论文地址:https://arxiv.org/pdf/2403.20327.pdf

（举报）

相关推荐

关键词：

前DeepSeek研究员罗福莉已加入小米：全力奔赴AGI

11月12日，“95后AI天才少女”罗福莉宣布加入小米MiMo大模型团队。她曾因“雷军千万年薪挖角”话题引发热议，拥有丰富AI研发经历，先后在幻方量化和DeepSeek参与大模型研发。罗福莉表示，将与团队致力于推动AI从语言迈向物理世界，全力构建通用人工智能。她的加入将为小米AI研究注入新活力。

AI天才少女小米大模型罗福莉
你的品牌在豆包、DeepSeek里搜不到?这份GEO品牌监控攻略，3步把曝光拉满

GEO指数是AI搜索时代的品牌可见度衡量指标，量化品牌被AI引用、推荐和对比的频率与深度。与传统SEO比拼搜索排名不同，GEO衡量的是品牌在AI回答中的提及率和好感度。数据显示，高GEO指数品牌在AI搜索中的转化率是传统SEO的3.4倍。文章通过案例说明，企业可通过监控竞品差距、补充缺失内容关键词、优化AI提示词等策略提升GEO指数。建议立即使用AIBase平台免费体验GEO监控，把握AI搜索新机遇。

GEO指数 AI搜索品牌能见度
AI浪潮下，项目经理如何破局 | 2025 PMI项目管理大会

人工智能正重塑项目管理模式，项目经理需超越传统技能，掌握AI赋能下的效率提升、创新促进与决策优化能力。个人应通过组织平台与业务深度绑定，构建不可替代的核心价值。2025PMI项目管理大会将探讨AI前沿应用，助力从业者系统掌握转型路径，实现个体与组织的双向赋能，在AI时代保持竞争力。

人工智能项目管理 PMO
DeepSeek崩了上热搜页面显示“服务器繁忙”

截至2025年11月3日，大量用户在微博话题#DeepSeek崩了#下集中反馈，DeepSeek平台出现服务异常状况，引发广泛关注。综合各方信息，此次故障呈现多方面表现，对用户使用造成显著影响。众多用户表示遭遇服务全面中断问题，在尝试使用平台

DeepSeek故障服务器异常服务中断
品牌在deepseek、豆包里排第几?免费GEO排名查询工具帮你一键看清

随着AI搜索普及，传统SEO正被GEO（生成式引擎优化）取代。GEO核心是提升品牌在AI生成答案中的可见度，而非获取点击流量。数据显示超60%用户已使用AI搜索，若品牌未被AI提及将失去流量入口。文章推荐免费工具AIBase，支持多平台一键检测品牌在主流AI助手的曝光排名、竞品对比及可视化报告，并提供内容权威性、语义化表达等GEO优化策略，帮助品牌在AI时代建立竞争优势。
荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

本期AI日报聚焦多项技术突破：月之暗面开源AI代理框架Kosong，支持异步编排与插件化设计；Replit推出AI集成功能，可一键调用300+模型；商汤发布空间智能模型SenseNova-SI，性能超越GPT-5；百度推出多模态模型ERNIE-4.5-VL，新增图像思考能力；谷歌地图全面AI化，集成Gemini实现智能交互；ChatTutor上线可视化教学系统，覆盖多学科实时推演；新版Google Finance引入AI深度搜索与财报追踪；OpenAI低调上线Polaris Alpha模型，支持256K上下文并更新知识库至2024年10月。

AI代理开源框架异步编排
荐AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear模型；MiniMax Music 2.0 发布

本期AI日报聚焦多领域创新：昆仑万维推出SkyReels V3模型，整合顶尖视频生成能力；月之暗面Kimi Linear模型处理长文本速度提升2.9倍；MiniMax Music 2.0实现专业级音乐创作；字节跳动启动豆包股权激励计划吸引AI人才；苹果iOS 27将迎AI重大升级，Siri更个性化；Dia浏览器融合Arc设计理念与AI技术；文心魔法漫画工具实现一键生成连载作品；谷歌Gemini Canvas新增PPT自动生成功能，由Gemini 2.5 Pro驱动，提升职场效率。

AI视频生成 SkyReels V3
小渔夫“AIGC”双算法获国家备案，GEO效能再进阶！

11月6日，国家网信办发布《境内深度合成服务算法备案清单》，小渔夫自主研发的“产品营销文本生成算法”和“博客文章文本生成算法”正式通过备案。这标志着公司在GEO出海营销领域实现合规化与标准化，两项算法分别用于高效生成多语言产品营销文案和深度行业博客内容，助力外贸企业精准构建AI时代内容优势，提升出海竞争力。

算法备案深度合成服务 GEO出海营销
荐AI日报：Lovart AI上线“元素拆分”功能；Xcode 26.1.1发布；阿里云通义模型首次大规模赋能双11

本期AI日报涵盖八大热点：Lovart AI推出"元素拆分"功能，实现海报智能分层编辑；苹果Xcode 26.1.1优化AI编码性能；阿里云通义模型双11单日翻译调用量突破14亿次；Gemini 3在历史手稿破译中展现专家级能力；德国法院裁定OpenAI使用歌词训练构成侵权；开源语音模型Maya1实现富有表现力的实时文本转语音；Meta首席AI科学家LeCun计划离职创办世界模型公司；AI专家罗福莉加入小米，将致力于构建物理世界智能。

AI设计元素拆分海报编辑
新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

苹果因自研大模型项目遇瓶颈，决定引入谷歌Gemini大模型升级Siri，计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数，将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能，支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送，后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

苹果谷歌Gemini Siri升级

今日大家都在搜的词：

热文

3 天
7天

DeepMind发布Gecko:专注于文档检索性能媲美大7倍模型

前DeepSeek研究员罗福莉已加入小米：全力奔赴AGI

你的品牌在豆包、DeepSeek里搜不到?这份GEO品牌监控攻略，3步把曝光拉满

AI浪潮下，项目经理如何破局 | 2025 PMI项目管理大会

DeepSeek崩了上热搜页面显示“服务器繁忙”

品牌在deepseek、豆包里排第几?免费GEO排名查询工具帮你一键看清

荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

荐AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear模型；MiniMax Music 2.0 发布

小渔夫“AIGC”双算法获国家备案，GEO效能再进阶！

荐AI日报：Lovart AI上线“元素拆分”功能；Xcode 26.1.1发布；阿里云通义模型首次大规模赋能双11

新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

今日大家都在搜的词：

热文

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

雷军回应小米双11战绩：谢谢大家支持

卢伟冰：小米手机双11连续三年国产销量第一

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

京东发布双11战报：订单总量增长近60% 下单用户同比增长40%

95岁巴菲特每周还上5天班此前计划年底退休

荣耀500系列官宣：超级标准版+超级Pro版

AI日报：Lovart AI上线“元素拆分”功能；Xcode 26.1.1发布；阿

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

雷军回应小米双11战绩：谢谢大家支持

卢伟冰：小米手机双11连续三年国产销量第一

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

OPPO Reno15系列定档11月17日发布

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

焕新享界S9开卖72小时预订突破8000台

站长商机

DeepMind发布Gecko:专注于文档检索 性能媲美大7倍模型

今日大家都在搜的词：

热文

站长商机

DeepMind发布Gecko:专注于文档检索性能媲美大7倍模型