首页 > 业界 > 关键词  > Gecko最新资讯  > 正文

DeepMind发布Gecko:专注于文档检索 性能媲美大7倍模型

2024-04-07 13:55 · 稿源:站长之家

划重点:

⭐️ Gecko 是一种通用的文本嵌入模型,可用于训练文档检索、语义相似度和分类等任务。

⭐️ Gecko 通过从 LLM 中提炼知识,并融入到检索器中,实现了强大的检索性能。

⭐️ 在大规模文本嵌入基准上,具有256个嵌入维度的 Gecko 优于具有768个嵌入尺寸的现有模型。

站长之家(ChinaZ.com)4月7日 消息:谷歌 DeepMind 发布了一种名为 Gecko 的文本嵌入模型,专注于文档检索、语义相似度和分类等多种任务。文本嵌入模型在自然语言处理中扮演着重要角色,通过将文本转换为高维向量空间中的向量表示,实现捕捉文本的语义信息。

image.png

Gecko 通过从 LLM 中提炼知识,然后融入到检索器中,实现了强大的检索性能。在大规模文本嵌入基准上,具有256个嵌入维度的 Gecko 表现优异,超越了具有768个嵌入尺寸的现有模型。

该研究为多个任务创建了通用嵌入模型,利用 LLM 生成的合成数据集 FRet 进行训练,并得到 LLM 的支持。

研究结果显示,Gecko 在与大7倍模型和5倍高维嵌入进行比较时,取得了相竞争的结果。Gecko 的出现为改善信息检索系统提供了一种强大的替代方案,同时在分类、STS 和摘要方面也达到了新的 SOTA 水平。

论文地址:https://arxiv.org/pdf/2403.20327.pdf

举报

  • 相关推荐
  • DeepSeek:已对AI生成合成内容添加标识 用户不得恶意删除

    今天下午,DeepSeek发布了《关于AI生成合成内容标识的公告》。 公告中称,Deepseek始终高度重视AI的安全问题,已在平台内对AI生成合成内容添加标识,并明确提醒用户相关内容由AI生成。 此举为贯彻落实《人工智能生成合成内容标识办法》(2025年9月1日起施行)及《网络安全技术 人工智能生成合成内容标识方法》等国家标准的相关要求,防止AI生成内容可能引发的公众混淆、�

  • 别再猜了!手把手教你用数据选择AI模型,我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

    开发者分享模型选择心路历程:从盲目试错到数据驱动。曾因追求低价模型导致成本飙升,后通过AIbase平台对比Gemini 2.5 Flash-Lite和DeepSeek-V3,基于价格、上下文长度和代码能力等数据,最终选择更适合代码生成任务的DeepSeek-V3。强调没有“最好”的模型,只有“最适合”的模型,建议开发者善用专业工具进行数据驱动决策,避免隐性成本。

  • Gemini 2.5 Flash-Lite与 DeepSeek-V3 深度对比:谁在性价比上更胜一筹?

    面对琳琅满目的大模型API,开发团队常陷入选择困境。文章指出,2024年既是机遇也是挑战的时代,闭源模型选择丰富但性能与成本平衡复杂。通过AIbase等数据驱动平台进行客观对比至关重要。以Gemini 2.5 Flash-Lite和DeepSeek-V3为例,前者综合能力强适合多语言场景,后者在代码生成和成本控制上优势明显。建议开发者明确需求,通过实际测试验证模型表现,理性选择最适合的方案。

  • 免费使用!腾讯地图已接入DeepSeek-V3.1

    DeepSeek V3.1于2025年8月21日发布并开源,腾讯地图率先完成接入。新版AI助手“AI叮当”在三大核心能力显著提升:思考效率更高,响应更快;上下文理解更强,支持多轮连贯对话;智能体调用更精准,尤其在中文网页理解和跨领域搜索方面表现突出。依托升级,AI叮当可提供个性化行程规划、周边推荐及景点知识问答等智能出行服务,让导航升级为全程智能生活陪伴。

  • 检出率超95%,支持透明液体识别!INDEMIND脏污识别:更快、更准、更智能

    扫地机器人技术正从“盲目清扫”向“智能识别”进化。INDEMIND推出立体视觉污染识别方案,能精准识别固态、液态、粉末及混合四类污渍,检出率超95%。该技术结合智能决策引擎,实现自主调整清洁参数,避免二次污染。同时提供单目、双目及三目模块矩阵,支持快速适配升级,推动行业迈向精准化智能清洁新阶段。

  • INDEMIND:高需求和低渗透之间,服务机器人为何规模化落地难?

    在全球经济面临劳动力短缺的背景下,加之疫情的进一步催化,服务机器人取得了蓬勃发展,预计 2022 年,全球服务机器人市场规模将达到 217 亿美元,然而尽管如此,在高速发展之下,机器人的行业渗透率却并未明显提高,究其原因在于红利之后,机器人的规模化商业落地过程走的并不顺利...作为国内领先的机器人关键AI技术供应商,INDEMIND在机器人的导航、避障、决策、AI交

  • AI日报:腾讯开源3D世界模型HunyuanWorld-Voyager;即梦AI系列模型开放API;通义推智能体开发框架AgentScope 1.0

    本文介绍了AI日报栏目,聚焦人工智能领域最新动态。主要内容包括:腾讯开源具备3D重建能力的HunyuanWorld-Voyager模型、通义实验室推出的多智能体开发框架AgentScope 1.0、即梦AI开放图像与视频生成API、腾讯翻译模型Hunyuan-MT-7B在WMT2025斩获佳绩、苹果推出图像生成技术STARFlow和视觉语言模型FastVLM、新模型CoMPaSS-FLUX.1提升空间理解能力、Cherry Studio免费提供Qwen38B模型、谷歌Gemini API新增网页内容解析功能,以及腾讯优图开源智能体框架Youtu-Agent。这些进展展现了AI技术在多个领域的创新与应用。

  • Google Gemini vs Deepseek:谁更适合你的业务场景?AI大模型选型终极对比指南

    企业在选择大模型时面临两难:国际大厂的Gemini技术先进,但国内DeepSeek性价比突出。AIbase平台通过真实场景测试数据指出:1)跨境电商客服场景中,Gemini多语言识别准确率提升12%,但需注意API延迟问题;2)金融研报分析场景下,DeepSeek支持128K长文本且成本仅为Gemini的1/3。决策关键:抛开参数迷雾,聚焦成本、响应速度、语言支持和场景匹配四大维度。AIbase提供可视化对比工具,3分钟生成专属选型报告,让技术决策不再玄学。

  • AI日报:DeepSeek V3.1正式发布;企业微信5.0推出全新AI能力;快手 Klear-Reasoner 模型成功登顶

    AI日报栏目聚焦人工智能领域最新动态。DeepSeek V3.1发布,大幅增强长文档分析和代码理解能力;企业微信5.0集成智能搜索、总结和机器人功能;快手Klear-Reasoner模型数学推理准确率超90%;谷歌Docs新增AI语音朗读功能;Firecrawl完成1450万美元融资并推出V2版本API;Meta上线AI语音翻译功能;微软Excel集成Copilot实现一键数据分析;Claude桌面客户端推动AI编程可视化;苹果Xcode将原生集成Cl

  • 谷歌DeepMind发布Genie 3世界模型:支持实时生成交互式3D环境

    据媒体报道,谷歌DeepMind正式发布了其新一代通用世界模型Genie 3。 该模型能够根据用户的文本提示,快速生成丰富多样的交互式虚拟环境。Genie 3不仅能够以每秒24帧的速度生成720p分辨率的高清交互式3D世界,更创新性地引入了 可提示世界事件” 功能。用户通过简单文本指令,即可实时修改虚拟环境,显著提升了沉浸感与创造力。 DeepMind视Genie 3为迈向通用人工智能(AGI) 的�

今日大家都在搜的词: