智源开源检索排序模型 BGE Re-Ranker v2.0

2024-03-21 09:46 · 稿源：站长之家

站长之家(ChinaZ.com) 3月21日消息:智源研究院推出了新一代检索排序模型 BGE Re-Ranker v2.0，支持100+ 种语言，文本长度更长，并在多项评测中达到了 SOTA（state-of-the-art）的结果。该模型是智源团队在 BGE(BAAI General Embedding)系列基础上的新尝试，扩展了向量模型的 “文本 + 图片” 混合检索能力。

BGE Re-Ranker v2.0采用分层自蒸馏策略优化推理效率，通过不同尺寸的模型基座（如 MiniCPM-2B、Gemma-2B、BGE-M3-0.5B）支持多语言检索能力。此外，该模型还新增了对 “文本 + 图片” 混合检索功能的支持，通过引入 CLIP 模型生成的 visual token 实现。

微信截图_20240321094710.png

在性能评测方面，BGE Re-Ranker v2.0在英文、中文、多语言主流基准上取得了优秀的检索效果。例如，在 MTEB、C-MTEB、MIRACL、LLaMA-Index 等评测基准中，BGE Re-Ranker v2.0在重排 BGE-v1.5-large 的 top-100候选集时表现优异，提升了检索精度。同时，模型在 RAG 场景下也能够显著提升各种 embedding 模型的召回结果，配合 BGE-M3可以获得最佳的端到端检索质量。

BGE 系列模型的优秀性能和通用性也受到了社区的广泛关注，Vespa、Milvus 等主流向量数据库框架已经集成了 BGE-M3模型，为用户搭建 “三位一体” 的检索流水线提供了便利。

综上所述，智源研究院推出的 BGE Re-Ranker v2.0检索排序模型具有强大的多语言支持、更长文本长度、优秀的检索效果和灵活的 “文本 + 图片” 混合检索功能，为信息检索领域带来了新的利器。

项目地址：

https://github.com/FlagOpen/FlagEmbedding

https://huggingface.co/BAAI

（举报）

相关推荐

关键词：

奇点智能研究院出席 GOSIM 杭州 2025：以 AI 开源推动治理创新，共建可信智能未来

奇点智能研究院出席GOSIM杭州2025全球开源创新大会，发布AI与开源融合领域研究成果，展现中国科技智库专业力量。团队围绕AI产业变革、开源治理等议题发表演讲，发布《2025全球开源发展报告》及AI大模型开源开放分级评估规范，推动AI开源从理念走向制度化实践。致力于构建透明、可信、普惠的全球开源AI生态，促进技术向善与可持续发展。

奇点智能研究院 GOSIM 2025
OpenAI发布语音模型GPT-realtim：具备情感感知能力多语言无缝切换

OpenAI正式发布语音模型GPT-realtime。据介绍，GPT-realtime是一款专注于语音AI Agent的多模态模型，能够生成高度自然流畅的语音，精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解，并可结合语音或文本对话使用，非常适合应用于客服、教育、金融、医疗等领域，用于构建高质量的语音智能体。官方表示，新模型在复杂指令遵循、工具精确调用以及生成更自然、�

语音模型 GPT-realtime 多模态模型
Soul旗下研究院发布《2025年轻人减肥报告》，解读年轻人减肥态度

Soul App发布《2025年年轻人减肥报告》，基于2249份Z世代问卷。报告显示，年轻人减肥态度更趋主体性，近六成视减肥为自我管理途径，近半认为是健康管理手段。减肥动机中“外貌好看”占54.7%，但健康因素占比达45.7%。超六成年轻人在三个月内放弃减肥，“坚持难”和“管不住嘴”是主因。值得注意的是，超两成人曾成功减重20斤，对减肥成功的定义也更趋多元，不再仅关注体重数字，更重视身体状态和健康改善。

健康生活体重管理年轻人减肥
水的“隐藏”风味：安吉尔联合中粮营养健康研究院解码健康饮水口感的奥秘

饮用水行业正从安全迈向健康新阶段，安吉尔集团与中国营养健康研究院合作，启动《饮用水健康与感官品质研究报告》编制工作。研究聚焦矿物质比例对健康的影响，通过技术创新实现水质精准调控，提升口感和健康价值。报告将填补行业在健康与感官交叉领域的理论空白，推动制定更全面的健康饮水标准，引领行业高质量发展。

健康饮水感官品质饮用水研究
小米开源首个原生端到端语音大模型支持音频重建任务和音频转文本任务

小米发布首款开源端到端语音大模型Xiaomi-MiMo-Audio，拥有12亿参数，在智能性、情感表达和交互适配方面接近人类水平。该模型最大技术突破在于少样本学习能力，通过创新预训练架构和超一亿小时训练数据，成功突破传统语音模型依赖大规模标注数据的技术瓶颈。基于Transformer架构，支持音频重建和音频转文本等多任务处理。小米已在Huggingface平台发布预训练和指令微调版本，并在Github开源Tokenizer模型，为研究者和开发者提供完整工具链。

AI语音开源模型少样本学习
荐AI日报：小米开源首个原生端到端语音大模型；通义万相Wan2.2-Animate正式开源；Suno v5即将上线

AI日报今日聚焦多项技术突破：小米开源首个端到端语音大模型Xiaomi-MiMo-Audio；通义万相推出全新动作生成模型Wan2.2-Animate；Suno即将发布革命性音乐模型v5；生数科技获数亿融资，视频生成技术商业化加速。同时关注OpenAI修复ChatGPT安全漏洞，谷歌将Gemini集成至Chrome浏览器，Luma AI发布支持16位色的Ray3视频生成模型，法国Mistral推出开源推理模型Magistral Small 1.2，Notion发布AI智能体，腾讯混元3D Studio提升3D创作效率。

AI 语音大模型小米开源
行业迈向标准化！销售易Engage2025大会首发AI CRM评价模型

2025年9月9日，腾讯旗下销售易在京举办第七届用户大会Engage2025。大会以“数驱增长智赢未来”为主题，汇聚800余位来自世界500强、中国优秀出海企业、在华外资机构及各行业领军企业的高管与业务先锋，共议AI+CRM创新与企业数智化增长的前沿实践。腾讯集团副总裁、政企业务总裁、销售易董事长李强在开幕致辞中强调，CRM系统作为企业核心基础设施，是连接客户与战略的重要桥梁，更是推动持续增长的新引擎。会上，销售易携手中国信息通信研究院发布行业首个《面向企业用户的AI+CRM建设的评价模型课题共研成果》，填补了CRM智能化领域建设指导体系的空白，标志着国内CRM行业步入规范化发展的新阶段。
从新闻联播点赞到人机大战取胜！时空壶W4Pro硬核功能横扫跨语言场景

时空壶W4Pro+AI同传耳机通过先进AI技术解决跨语言沟通难题，支持42种语言即时互译，翻译延迟仅3-5秒。在商务谈判、展会等场景中表现出色，具备抗噪能力强、续航持久等特点，显著提升跨国交流效率，成为企业拓展国际市场的可靠工具。

跨语言沟通商务活动 AI同传耳机
时空壶W4Pro：商务跨语言场景的高效沟通解决方案

时空壶W4Pro+AI同传耳机通过优化技术与功能设计，支持40种语言及93种口音的即时互译，翻译延迟控制在3-5秒，实现类似母语对话的流畅交流。适用于面对面商务洽谈、跨国展会等场景，提供稳定精准的跨语言沟通支持，并具备电话同传、视频会议字幕翻译等功能，成为商务人士打破语言壁垒的核心工具。

全球化商务交流跨语言沟通 AI同传耳机
荐AI日报：腾讯开源图像模型HunyuanImage2.1；爱诗科技获6000万美元融资；Freepik上线豆包Seedream4.0图像模型

本文汇总了AI领域的最新动态：腾讯升级混元生图模型至2.1版，支持2K分辨率与中英文输入；爱诗科技获阿里领投6000万美元融资，聚焦AI视频生成；Freepik上线Seedream 4.0图像模型，提供高分辨率生成选项；阿里千问新模型通过MoE架构提升推理效率10倍；微软在Office 365中集成Anthropic技术，调整AI供应商策略；首款AI Agent浏览器Fellou CE发布，简化工作流程；清华团队开源GUAVA技术，实现

AI日报混元生图模型 2K分辨率

今日大家都在搜的词：

热文

3 天
7天

智源开源检索排序模型 BGE Re-Ranker v2.0

奇点智能研究院出席 GOSIM 杭州 2025：以 AI 开源推动治理创新，共建可信智能未来

OpenAI发布语音模型GPT-realtim：具备情感感知能力多语言无缝切换

Soul旗下研究院发布《2025年轻人减肥报告》，解读年轻人减肥态度

水的“隐藏”风味：安吉尔联合中粮营养健康研究院解码健康饮水口感的奥秘

小米开源首个原生端到端语音大模型支持音频重建任务和音频转文本任务

荐AI日报：小米开源首个原生端到端语音大模型；通义万相Wan2.2-Animate正式开源；Suno v5即将上线

行业迈向标准化！销售易Engage2025大会首发AI CRM评价模型

从新闻联播点赞到人机大战取胜！时空壶W4Pro硬核功能横扫跨语言场景

时空壶W4Pro：商务跨语言场景的高效沟通解决方案

荐AI日报：腾讯开源图像模型HunyuanImage2.1；爱诗科技获6000万美元融资；Freepik上线豆包Seedream4.0图像模型

今日大家都在搜的词：

热文

AI日报：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去

小米召回116887辆SU7电动汽车：将OTA升级消除安全隐患

iPhone17 Pro Max续航实测夺冠 iPhone Air表现不俗

小米发布REDMI 15R 5G手机：售价1099元起搭载6000mAh电池

雷军回应小米召回11.7万辆SU7：将为用户带来更多期待功能

AI日报：小米开源首个原生端到端语音大模型；通义万相Wan2.2-A

苹果承诺修复iPhone17拍照黑色方块、白色曲线等问题

苹果 iPhone 17/Pro 系列今日发售多维度升级

京东：iPhone 17开卖4小时全国超3万人签收

鸿蒙智行秋季发布会定档9月23日：尚界H5、新问界M7来了

上市没几天iPhone 17已跌破发售价部分机型降幅高达千元

小米17 Pro Max官宣雷军：全面对标iPhone 正面迎战

小米17 Pro系列外观公布：搭载“妙享背屏”

小米16改名小米17 本月发布：现已上架开启预约

AI日报：小红书发布对话合成模型 FireRedTTS-2；百度文心新模型

AI日报：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去

小米手机官博头像上热搜：泄密17 Pro系列或配备背屏

AI日报：腾讯发布混元3D 3.0模型；昆仑万维上线Agent Studio功

小米17官宣本月发布卢伟冰称有信心直面iPhone17

尚界H5小订突破10万台预售16.98万起

站长商机