首页 > 业界 > 关键词  > Gecko最新资讯  > 正文

DeepMind发布Gecko:专注于文档检索 性能媲美大7倍模型

2024-04-07 13:55 · 稿源:站长之家

划重点:

⭐️ Gecko 是一种通用的文本嵌入模型,可用于训练文档检索、语义相似度和分类等任务。

⭐️ Gecko 通过从 LLM 中提炼知识,并融入到检索器中,实现了强大的检索性能。

⭐️ 在大规模文本嵌入基准上,具有256个嵌入维度的 Gecko 优于具有768个嵌入尺寸的现有模型。

站长之家(ChinaZ.com)4月7日 消息:谷歌 DeepMind 发布了一种名为 Gecko 的文本嵌入模型,专注于文档检索、语义相似度和分类等多种任务。文本嵌入模型在自然语言处理中扮演着重要角色,通过将文本转换为高维向量空间中的向量表示,实现捕捉文本的语义信息。

image.png

Gecko 通过从 LLM 中提炼知识,然后融入到检索器中,实现了强大的检索性能。在大规模文本嵌入基准上,具有256个嵌入维度的 Gecko 表现优异,超越了具有768个嵌入尺寸的现有模型。

该研究为多个任务创建了通用嵌入模型,利用 LLM 生成的合成数据集 FRet 进行训练,并得到 LLM 的支持。

研究结果显示,Gecko 在与大7倍模型和5倍高维嵌入进行比较时,取得了相竞争的结果。Gecko 的出现为改善信息检索系统提供了一种强大的替代方案,同时在分类、STS 和摘要方面也达到了新的 SOTA 水平。

论文地址:https://arxiv.org/pdf/2403.20327.pdf

举报

  • 相关推荐
  • AI日报:阿里入局AI眼镜;套壳AI产品TypingMind赚百万美元;DeepMind天才科学家去世

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、阿里入局AI眼镜:与雷鸟达成战略合作雷鸟创新与阿里云在上海签署独家战略合作协议,旨在共同推进AI眼镜技术的发展。这些新设备的推出,尤其是华硕和Geekom等厂商的参与,标志着微软在与苹果的竞争中正寻求技术上的领先。

  • DeepSeek-V3 是怎么训练的|深度拆解

    DeepSeek-V3低调发布,在国际上狠狠秀了一波肌肉:只用了500多万美金的成本,带来了不输Claude3.5的成绩,并开源!下面,让我们以更加系统的方式,来看看这次的DeepSeek-V3,是这么炼成的。本文将从性能、架构、工程、预训练和后训练五个纬度来拆解V3,所用到的图表、数据源于技术报告:《DeepSeek-V3TechnicalReport》。安全和伦理类数据:包含了用于提升模型安全性和符合伦理规范的指�

  • 为什么说DeepSeek是2025年的Kimi

    DeepSeek是否能定义“低成本训练”概念?岁末年初,杭州的大模型创业公司“深度求索”DeepSeek不断放出大新闻。它所公布的一个开源模型DeepSeek-V3,在各种基准测试等方面,能够大致打平需要付钱的GPT-4o。在此之后它是否还能定义第二个概念,或许不太重要;蜂拥至的融资将会是对它之前定义概念的奖赏。

  • 国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开

    DeepSeek新版模型正式发布,技术大佬们都转疯了!延续便宜大碗特点的基础之上,DeepSeekV3发布即完全开源,直接用了53页论文把训练细节和盘托出的那种。QLoRA一作的一个词评价就是:优雅。当然最后也确实帮上忙了贾扬清也再次感叹:最最后,除了本次官方公布的测试结果,Imsys匿名竞技场也出来提前预热了。

  • AI日报:百川智能金融大模型发布ChatGPT新增跨对话记忆功能;DeepSeek大模型一开发者将加盟小米;OpenAI最强推理模型o3

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、OpenAI发布o3:AI推理能力的重大突破,得分高达87.5%OpenAI最近推出了其最新的o-Model推理系列模型o3,标志着在数学和科学推理领域的重大进展。闪极还推出了一个吸引人的促销活动,用户在300天内打卡200天可获得全额退款。

  • 全网都在扒的DeepSeek团队,是清北应届生撑起一片天

    DeepSeek-v3大模型横空出世,以1/11算力训练出超过Llama3的开源模型,震撼了整个AI圈。“雷军开千万年薪挖DeepSeek研究员罗福莉”的传闻,也使得人们把目光聚焦向DeepSeek的人才。DeepSeek,可能是组织形态上最像OpenAI的一家中国AI公司了。

  • 雷军千万年薪挖角95后AI天才少女 DeepSeek罗福莉将加入小米

    小米公司近期在人工智能领域迈出了重要一步,DeepSeek开源大模型DeepSeek-V2的关键开发者罗福莉将加盟小米,担任小米AI实验室的领导,并负责大模型团队的建设。这一人事变动在业界引起了广泛关注,特别是在小米寻求加强其在大模型领域布局的背景下。罗福莉的加入预计将进一步推动小米在AI大模型领域的发展,加强公司在该领域的竞争力。

  • DeepSeek V3刷屏,550万元2000张卡做出的开源模型,和OpenAI几亿烧出来的一样好

    像是迷雾中走出的一头怪兽,DeepSeekV3在先行“泄露”并引发一阵惊叹后,开发方深度求索正式发布了技术报告。在这个报告中,Deepseek透露了训练的关键数据,其中最引人注目的,是它的高效和对算力资源依赖之小,同时效果又异常的好——“在预训练阶段,在每个万亿标记上训练DeepSeek-V3只需要180KH800GPU小时,也就是说,在我们的具有2048个H800GPU的集群上需要3.7天。神话OpenAI们,尤其是以“卡”的名义神话然后看低中国开发者们自己的模型和Infra创新能力的阶段看起来要结束了。

  • AI日报:理想汽车AI大模型APP将上线;小米搭建GPU万卡集群投入AI;Deepseek V3开源;ChatGPT搜索有被操纵风险

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、理想汽车AI大模型APP即将上线!“理想同学”入驻手机,化身全能生活助手理想汽车的CEO李想在2024理想AITalk上宣布,‘理想同学’AI大模型APP将于12月27日正式上线。Gemini2.0引入了代理功能,Veo2改变了视频内容生成方式,Mariner项目改善了人机交互,LearnLM为教育提供个性化支持NotebookLM则帮助用户更好地管理信息。

  • AI日报:国产之光!DeepSeek APP正式上线;潞晨升级Video Ocean V2.0免费高质量;OpenAI组建人形机器人团队

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、潞晨升级免费视频生成模型VideoOceanV2.0,20秒高清大片一键成型在AI技术蓬勃发展的今天,潞晨科技推出的VideoOceanV2.0标志着视频创作的又一次重大飞跃。政策强调人才引进与培养,推动产学研融合,支持数据标注领域的职业资格与技能等级衔接,力求到2027年实现产业规模化和创新能力显著提升,年均复合增长率预计超过20%。