首页 > 业界 > 关键词  > Gecko最新资讯  > 正文

DeepMind发布Gecko:专注于文档检索 性能媲美大7倍模型

2024-04-07 13:55 · 稿源:站长之家

划重点:

⭐️ Gecko 是一种通用的文本嵌入模型,可用于训练文档检索、语义相似度和分类等任务。

⭐️ Gecko 通过从 LLM 中提炼知识,并融入到检索器中,实现了强大的检索性能。

⭐️ 在大规模文本嵌入基准上,具有256个嵌入维度的 Gecko 优于具有768个嵌入尺寸的现有模型。

站长之家(ChinaZ.com)4月7日 消息:谷歌 DeepMind 发布了一种名为 Gecko 的文本嵌入模型,专注于文档检索、语义相似度和分类等多种任务。文本嵌入模型在自然语言处理中扮演着重要角色,通过将文本转换为高维向量空间中的向量表示,实现捕捉文本的语义信息。

image.png

Gecko 通过从 LLM 中提炼知识,然后融入到检索器中,实现了强大的检索性能。在大规模文本嵌入基准上,具有256个嵌入维度的 Gecko 表现优异,超越了具有768个嵌入尺寸的现有模型。

该研究为多个任务创建了通用嵌入模型,利用 LLM 生成的合成数据集 FRet 进行训练,并得到 LLM 的支持。

研究结果显示,Gecko 在与大7倍模型和5倍高维嵌入进行比较时,取得了相竞争的结果。Gecko 的出现为改善信息检索系统提供了一种强大的替代方案,同时在分类、STS 和摘要方面也达到了新的 SOTA 水平。

论文地址:https://arxiv.org/pdf/2403.20327.pdf

举报

  • 相关推荐
  • 如何用DeepSeek一键自动生成Word文档

    DeepSeek推出AI自动排版Word文档功能,用户只需输入指令即可一键生成格式规范的文档,大幅提升办公效率。操作流程:1.在DeepSeek对话框输入文档要求并指定HTML格式输出;2.AI处理完成后点击运行按钮;3.页面会出现下载Word按钮,点击即可获取自动排版的文档。该工具同样支持生成PDF、Excel等格式,只需修改指令中的文件类型即可。免费工具地址:https://www.deepseek.com

  • MiniMax深夜开源首个推理模型M1,这次是真的卷到DeepSeek了。

    ​不知道还有多少人记得,AI行业的六小虎。 行业内都在说,他们已经寂静好久了。 上一次相关的项目发布,还是前一段时间我写的MiniMax声音模型的更新,Speech-02。 而昨晚凌晨将近12点的时候,又是MiniMax,居然在X上,预告了他们一整周的发布计划。

  • 高考数学全卷重赛!一道题难倒所有大模型,新选手Gemini夺冠,豆包DeepSeek并列第二

    本次AI高考数学测试评估了7个大模型的表现,包括Doubao、DeepSeek、Qwen3等。测试包含14道客观题和5道解答题,总分150分。结果显示:1)客观题各模型差距不大,最大分差仅3分;2)解答题成为主要失分区,仅Gemini2.5Pro获得满分;3)图像识别题(第6题)难倒所有多模态模型,暴露AI图文理解短板。最终Gemini2.5Pro以145分居首,Doubao和DeepSeek R1以144分并列第二。测试表明大模型在数学推理能力上有进步,但在复杂论证和多步骤计算方面仍需提升。

  • 月之暗面放王炸!开源Kimi新模型:超新版DeepSeek R1全球第一

    月之暗面推出了针对软件工程任务的全新开源代码大模型Kimi-Dev-72B。 该模型在SWE-bench Verified编程基准测试中取得了全球最高开源模型水平,以仅72B的参数量,超越了刚发布不就、参数量达671B的新版DeepSeek-R1。

  • 如何用 DeepSeek 为社群设计7 天激活话术

    本文介绍如何利用DeepSeek工具高效设计AI社群运营方案。针对社群运营中成员激活的痛点,提供7天连贯激活话术的自动化生成方案,包含欢迎语、每日话题、科普内容和互动形式。操作流程分三步:注册登录DeepSeek平台;输入精准指令生成初稿;优化话术细节并整理为可执行的SOP方案。该方法可显著提升运营效率,支持根据参与数据持续优化话术,实现系统化的社群激活管理。

  • 如何用 DeepSeek 生成备课教案

    本教程介绍如何利用AI工具DeepSeek快速生成七年级中国古代史教案。操作流程包括:1.登录DeepSeek官网;2.进入文本生成界面;3.输入详细指令,包含教学目标、重难点、教学过程等要素;4.等待AI生成教案;5.检查并调整内容。该工具能帮助教师高效完成系统化的教案设计,但生成后仍需根据实际教学需求进行适当修改和完善,最后保存为所需格式使用。

  • 如何用 DeepSeek 生成星球日更内容

    本文介绍如何利用DeepSeek工具高效生成星球日更内容。主要内容包括:1.注册登录DeepSeek官网进入对话界面;2.输入精准指令获取内容,如"生成7篇藏马鸡主题的星球日更";3.对生成内容进行相关性、实用性评估;4.通过补充指令优化不满意内容。该工具能快速提供多样化素材,解决持续创作压力,经过多次调整可获得符合定位的优质内容。操作流程简单,适合自媒体运营和社群内容创作。

  • 如何用 DeepSeek 进行论文降重

    本文介绍了如何利用DeepSeek AI工具降低学术论文重复率。该工具能对重复率超标的段落进行学术化改写,在保证专业术语准确性的同时降低查重率。使用方法是:1)在DeepSeek网站输入降重指令和段落;2)可指定改写风格(如某期刊格式)或具体方向(如主动改被动句);3)审查改写结果,确保语义准确、术语恰当、逻辑连贯。若发现问题可再次优化。该工具适用于毕业论文、期刊�

  • 如何用 DeepSeek 进行合同审核

    本文介绍如何利用DeepSeek AI工具高效审核合同法律风险。合同是商业活动的重要保障,但隐藏的法律风险可能带来巨大损失。DeepSeek能快速识别合同条款中的合法性存疑、违约责任模糊、交付条款不清等问题,并提供专业修改建议。操作流程包括:1.登录DeepSeek平台;2.上传合同文件;3.输入审核指令;4.查看详细审核结果。该工具适用于企业法务、律师及商务人员,能有效规避合同风险,提高审核效率。

  • 如何用 DeepSeek 生成爆款标题

    本文介绍如何利用DeepSeek工具快速生成15个爆款标题,提升内容吸引力。操作步骤:1.访问DeepSeek官网;2.输入指令,如"为夏日低卡甜品生成15个小红书标题",要求包含emoji、数字或关键词;3.根据不同平台特性调整风格:小红书需活泼多用emoji,知乎要理性干货,抖音则简短有力突出冲突。该工具能帮助创作者在海量信息中脱颖而出,解决标题创作难题。