利用检索增强生成技术提升语言模型的能力

2023-08-09 09:54 · 稿源：站长之家

文章要点:

检索增强生成（RAG）方法可以让语言模型访问最新的知识库，从而提高模型在实际业务中的应用能力。
RAG 方法相比重新训练模型或微调模型更为便宜和容易实现，同时也避免了数据集准备的工作量。
使用 Haystack 等开源框架，结合句子嵌入技术和检索算法，可以构建强大的 RAG-enabled 语言模型，提供准确、实时的信息检索和问题回答能力。

站长之家(ChinaZ.com) 8月9日消息:虽然人们在工作中使用ChatGPT等生成式人工智能可以大大提高效率，但有时候，ChatGPT52%的回答是错误的。有人提出，可以利用检索增强生成（RAG）方法来增强语言模型(LLM)。

为了解决这个问题，国外一博主提出了两种方法:一种是在最新数据上训练或微调模型，但这种方法成本高且准备数据集的工作量大;另一种方法是使用 RAG 方法，将一个最新的知识库与大型语言模型结合起来，这种方法成本较低且易于实施。

这些涉及到如何使用 Haystack 框架、sentence transformers 和 transformers 库来构建 RAG-enabled 模型。首先，需要对文档进行预处理和存储，然后构建一个提取式问答管道，包括检索器和阅读器。最后，通过使用大型语言模型（如 OpenAI 的 gpt-4）构建一个 RAG-enabled 代理模型。

博主通过向模型提问关于2022年俄乌冲突的问题进行了测试，并与谷歌搜索的结果进行了对比。测试结果显示，RAG-enabled 模型能够给出相关的回答，但在某些情况下可能会产生幻觉或不完全准确的回答。

通过利用 RAG 方法增强语言模型的能力，使其可以访问最新的知识库，从而在各种应用场景中更加实用。但需要注意的是，模型的性能取决于提供的知识库的质量，而且部署模型的基础设施也会影响推理时间。此外，通过增加步骤数或添加记忆组件等方式，可以进一步改进模型的性能。

具体操作方法点此查看

（举报）

相关推荐

关键词：

豆包-应用生成·「一点都不技术」创作挑战赛开赛！

英特尔联合豆包-应用生成发起“一点都不技术”创作挑战赛，旨在通过零代码AI工具降低创意门槛。用户只需输入一句话或一张图，即可在5分钟内生成网页、工具或小游戏等多样化作品。赛事设置总价值20万元奖励，包含现金及火箭发射观礼等特色福利，并构建“创作-交流-成长”的完整生态，推动AI技术普惠。活动将持续至2025年12月8日，让每个平凡创意都有机会落地生花。

AI技术创意革命零代码
从巴别鱼到技术突围：W4Pro以体验领先定义跨语言沟通新标杆

时空壶W4Pro开放式AI同传耳机通过技术创新，将科幻构想变为现实产品。在跨语言沟通核心指标上实现双重突破：响应延迟仅0.2秒，较行业平均提速75%；翻译延迟控制在3秒内，实测平均2.8秒，较竞品提速38%-53%。搭载骨声纹识别+矢量降噪双技术方案，在85分贝嘈杂环境中语音识别准确率仍保持98%以上。支持43种语言及96种口音实时互译，覆盖全球98%主流区域，新增孟加拉语等小语种适配。单设备即可实现双向跨语言交流，打破多数竞品需配对使用的局限。单次充电支持6小时翻译使用，综合续航达18小时，开放式挂耳设计仅重12克。该产品精准解决了跨语言沟通中的延迟、降噪、场景适配等核心痛点，推动行业向"无感沟通"迈进。

跨语言沟通 AI同传耳机技术创新
百度智能云联合昆仑芯、HAMi，落地双模式算力调度方案，提升算力利用率

百度智能云联合昆仑芯与CNCF开源项目HAMi，推出基于昆仑芯P800的XPU/vXPU双模式算力调度方案。该方案已在金融客户集群落地，支持智能客服、营销辅助等十余类AI业务，兼顾稳定性与灵活性。XPU整卡模式通过拓扑寻优调度保障大规模训练性能，vXPU虚拟化模式以多粒度切分实现单卡多任务，最大化资源利用率。双模式协同让国产算力高效匹配业务需求，同时提供自动化调度与人工调节结合的灵活管理能力。

XPU/vXPU双模式昆仑芯P800 算力调度
百度搜索推出“百度猎户座”AI引擎，涵盖基座模型、搜索AI API、 MCP、垂类优势能力

2025年11月13日，百度发布“百度猎户座”AI引擎，全面开放25年搜索技术与前沿AI能力。该系统整合底座模型、搜索API、MCP及垂直领域能力，基于多智能体架构统一连接信息、工具、服务与模型，融合搜索技术优势与全网MCP生态资源。即日起对外开放，支持企业快速接入打造专属AI应用。同时，文心助手上线个性化记忆功能，视频生成推出“参考生成”玩法，AI短剧创作平台免费提供超30万部IP资源及全流程工具。

百度猎户座 AI引擎搜索技术
登榜LMArena！文心大模型5.0-Preview文本能力国内第一

11月8日，文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出，超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容；复杂长问题理解适用于学术问答、报告分析等任务；指令遵循能力支持智能助理、代码生成等场景，为多领域内容生产提供高效支撑。

文心模型 ERNIE-5.0 创意写作
寒武纪：构建大模型开发到部署的全流程开放服务能力

华鑫证券研报显示，寒武纪2025年上半年业绩亮眼，营收28.81亿元，同比增长4347.82%；归母净利润10.38亿元，增长295.82%。公司募资39.85亿元，重点投向大模型芯片及软件平台建设，以增强AI算力芯片综合实力。凭借云边端一体、软硬协同等技术优势，其产品已获多领域客户认可，覆盖金融、互联网等行业。未来随着技术迭代与生态完善，业绩有望持续提升。

寒武纪 AI算力芯片大模型芯片
简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案，标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑，该模型围绕用户兴趣成长周期设计，提供个性化学习支持：可为未明确兴趣方向的用户智能推荐内容，为入门用户规划学习路径，为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖，并通过社群互动增强学习动力。公司未来将持续优化模型能力，联合行业伙伴构建完整培养体系，推动兴趣教育向个性化、高质量方向发展。

简智AI大模型生成式人工智能兴趣教育
触觉增强世界模型引关注，一目科技IROS首秀定义机器人感知新维度

在2025年IROS大会上，中国AI企业一目科技凭借触觉感知与具身智能领域的突破成为焦点。公司展示了全球最薄仿生视觉触觉传感器，厚度大幅缩减，实现0.005N三维力分辨率和120fps输出帧率。CEO李智强提出"视觉-触觉-语言-行动"新范式，指出触觉能捕捉物理世界的隐秘维度。通过创新仿真平台和生成式AI技术，突破传统数据收集限制，显著提升机器人操作技能训练效率。现场机械臂成功演示易碎品抓取等复杂任务，验证了触觉感知在精细操控中的核心价值，为"操控即服务"产业愿景提供技术支撑。
新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

苹果因自研大模型项目遇瓶颈，决定引入谷歌Gemini大模型升级Siri，计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数，将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能，支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送，后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

苹果谷歌Gemini Siri升级
【火柴AI必看】如何利用FB高效找客户：实战攻略全解析

本文介绍在Facebook高效寻找客户的五大策略：明确目标客户画像，优化账号资料与内容，精准投放广告，积极互动建立关系，提供优质服务促成合作。强调持续优化策略才能在激烈市场中脱颖而出，助力业务拓展。

Facebook营销目标客户分析社交平台优化

今日大家都在搜的词：

热文

3 天
7天

利用检索增强生成技术提升语言模型的能力

豆包-应用生成·「一点都不技术」创作挑战赛开赛！

从巴别鱼到技术突围：W4Pro以体验领先定义跨语言沟通新标杆

百度智能云联合昆仑芯、HAMi，落地双模式算力调度方案，提升算力利用率

百度搜索推出“百度猎户座”AI引擎，涵盖基座模型、搜索AI API、 MCP、垂类优势能力

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

寒武纪：构建大模型开发到部署的全流程开放服务能力

简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

触觉增强世界模型引关注，一目科技IROS首秀定义机器人感知新维度

新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

【火柴AI必看】如何利用FB高效找客户：实战攻略全解析

今日大家都在搜的词：

热文

iPhone Pocket正式开售：联名三宅一生售价1299元起

1899元苹果手机包卖完了！iPhone Pocket在吐槽声中销售火爆

AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT

微信小程序将在iOS端支持接入虚拟支付苹果抽成15%

华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

雷军回应小米双11战绩：谢谢大家支持

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

卢伟冰：小米手机双11连续三年国产销量第一

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

95岁巴菲特每周还上5天班此前计划年底退休

京东发布双11战报：订单总量增长近60% 下单用户同比增长40%

站长商机