首页 > 业界 > 关键词  > DeepMind最新资讯  > 正文

DeepMind推出OPRO技术,可优化ChatGPT提示

2023-11-21 11:04 · 稿源:站长之家

**划重点:**

1. 🧠 OPRO(优化通过提示)是由Google DeepMind开发的强大方法,利用大型语言模型(LLM)作为其自身提示的优化器。

2. 🔄 OPRO通过使用LLM作为优化器,以自然语言描述的方式解决问题,从而改进提示的性能,特别适用于梯度不容易获取的提示优化问题。

3. 🌐 DeepMind在线性回归和“旅行推销员问题”等数学优化问题上测试了OPRO,并展示了在优化LLM如ChatGPT和PaLM上的潜在效果。

站长之家(ChinaZ.com)11月21日 消息:最新的AI研究报道中,Google DeepMind推出了一项名为“优化通过提示(OPRO)”的技术,将大型语言模型(LLM)作为其自身提示的优化器。该方法旨在通过自然语言描述问题,指导LLM生成和改进解决方案,从而提高提示性能。

OPRO的工作方式相对简单,使用LLM作为优化器,但与使用数学公式不同,它采用自然语言描述优化问题,指导LLM迭代生成和改进解决方案。这对于提示优化等问题特别有用,因为在这些情况下,梯度不容易获取。

该技术以“元提示”作为输入,由任务的自然语言描述以及一些问题和解决方案的示例组成。在优化过程中,LLM基于问题描述和元提示中的先前解决方案生成候选解决方案。然后,OPRO评估这些候选解决方案的结果,并将它们与其质量得分一起添加到元提示中。这个过程重复进行,直到模型不再提出具有改进得分的新解决方案。

LLM作为优化器的一个关键优势是它们能够处理自然语言指令,这使用户能够描述优化任务而无需形式规范。例如,用户可以指定“准确性”等度量标准,同时提供其他指令,如要求模型提供简洁且普遍适用的解决方案。

OPRO还充分利用了LLM对上下文模式的识别能力,通过在元提示中包含的示例来识别优化轨迹。这一方面是OPRO的核心魔力,因为LLM将语言视为数字令牌,可以发现人类观察不到的模式。

DeepMind在线性回归和“旅行推销员问题”等两个著名的数学优化问题上测试了OPRO,并展示了在这些情况下的有望结果。然而,OPRO的真正潜力在于优化LLM的使用,如ChatGPT和PaLM。

image.png

DeepMind的研究显示,OPRO可以引导LLM优化其自身提示,即找到最大化特定任务响应准确性的提示。例如,为了发现解决词数学问题的最佳提示,一个“优化器LLM”被给予一个包含指令和示例的元提示,其中包含优化提示的占位符。模型生成一组不同的优化提示,并将它们传递给一个“评分LLM”,该LLM在问题示例上测试它们并评估结果。最佳提示及其分数被添加到元提示的开头,然后重复这个过程。

研究人员使用PaLM和GPT系列的多个LLM对该技术进行了评估,根据实验,所有模型都能通过迭代优化提高生成提示的性能。

虽然DeepMind尚未发布OPRO的代码,但该技术的概念直观且简单,可以在几小时内创建一个自定义实现。这里分享一个由LlamaIndex制作的使用OPRO增强LLM在检索增强生成(RAG)任务上性能的逐步指南感兴趣的可以访问阅读。

https://docs.llamaindex.ai/en/latest/examples/prompts/prompt_optimization.html

OPRO是利用LLM优化其性能的多种技术之一,这一领域正在积极探索各种主题,包括越狱和红队行动,研究人员正在不断释放大型语言模型的全部潜力。

举报

  • 相关推荐
  • AI日报:混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布

    【AI日报】汇总了最新AI领域动态:1)腾讯开源混元系列小尺寸模型,适用于消费级显卡;2)昆仑万维发布推理大模型MindLink,提升回答透明度;3)B站推出AI原声翻译功能,保留UP主音色;4)谷歌Gemini 2.5在数学奥赛夺金,展现强大推理能力;5)OpenAI展示GPT-5网络信息整合特性;6)苹果组建AI团队挑战ChatGPT;7)高德地图推出全球首个AI原生地图应用;8)Adobe推出AI图像合成工具Harmonize;9)NVIDIA发布革命性视频渲染技术;10)谷歌推出Android Studio免费AI编程助手;11)开源结构化信息提取工具LangExtract;12)Figma开发者模式升级提升设计转代码效率。

  • 刚刚,OpenAI通用智能体ChatGPT Agent正式登场

    ​Agent AI 时代,比我们想象中来得要早一些。 北京时间周五凌晨,OpenAI 突然开启了新产品直播。 本次发布的是全新的 ChatGPT Agent,它实现了通用智能体(Agent)能力的关键升级。

  • A日报:Kimi开放平台上线Kimi Playground;OpenAI重磅发布ChatGPT Agent;Suno推人声替换功能

    【AI日报】汇总了近期AI领域重要进展:1)月之暗面推出Kimi Playground平台,实现从对话助手到智能助理的转变;2)OpenAI发布ChatGPT Agent,支持自主执行浏览、购物等任务;3)Suno发布v4.5+版本,新增人声替换等音乐创作功能;4)谷歌Veo3视频生成模型上线,支持文本转视频;5)全球首个直播流扩散模型MirageLSD发布,实现实时视频转换;6)VSCode编程助手Traycer提升大型代码库处理效率;7)ART框架支持Python一键训练AI Agent;8)NVIDIA语音识别模型Canary-Qwen-2.5B词错率创新低;9)Mistral AI推出Le Chat挑战ChatGPT;10)百度小度上线首个支持物理交互的MCP Server;11)Lightricks的LTXV模型实现60秒高质量视频生成;12)开源模型LTX-Video13B支持30倍速高清视频生成。

  • OpenAI发布ChatGPT Agent智能体:支持写代码、做PPT、分析金融

    OpenAI推出ChatGPT智能体,整合网页交互、数据搜索与多模态协作功能,可完成代码生成、PPT制作、金融分析等复杂任务。该智能体融合Operator的网页自动化操作、Deep Research的数据分析能力及优化后的GPT-4对话引擎三大核心模块。目前面向付费用户开放,Pro版近乎无限使用,其他版本每月限50次任务。OpenAI承认其仍存在金融建模需人工验证、非英语文本解析准确率低等技术局限,并

  • AI日报:12306 MCP Server上线;百度推AI搜索助手Tizzy.ai;ChatGPT录音模式面向Plus用户开放

    【AI日报】今日AI领域重要动态:1)百度推出无广告智能搜索助手Tizzy.ai,整合影视资源与深度思考功能;2)12306开源火车票查询引擎上线,采用FastAPI架构实现秒级响应;3)ChatGPT向Plus用户全面开放录音功能,支持实时记录与内容总结;4)开源SaaS模板FireGEO助力快速构建现代化Web应用;5)国产工具ReadMeX可一键生成高质量GitHub文档;6)百度AI助手新增视频通话功能,支持方言识别;7)Jacky

  • AI 大模型选型指导:一文实测 Kimi‑K2‑Turbo‑Preview 与 Qwen3‑Coder‑Flash

    本文对比分析了Kimi-K2-Turbo-Preview和Qwen3-Coder-Flash两款AI大模型在开发者选型中的表现。K2-Turbo采用MoE架构,激活参数32B,支持128K上下文,在代码调试和自动化流程方面表现突出;Qwen3-Coder为480B参数的MoE模型,原生支持256K上下文,擅长大规模代码库理解和API集成。二者在中级任务表现接近,但K2在复杂可视化任务更优,Qwen3在多轮Agent调用更稳定。建议根据需求选择:注重调试自动化选K2,需要长上下文支持选Qwen3。推荐使用AIbase模型广场进行高效选型对比。

  • 智能手表初代传奇落幕!苹果宣布Apple Watch Series 1将不再提供维修服务

    苹果公司近日宣布,Apple Watch Series 1正式走入历史,不再提供维修服务。 根据苹果的维修政策,产品停售后超过5年但未满7年会被归类为过时产品”,维修需视零件供应情况而定;停售后超过7年则为停产产品”,全面终止所有维修支持。 此次Apple Watch Series 1被降级为停产产品”,意味着未来官方将不再受理其维修服务。 值得注意的是,Apple Watch Series 1并非初代Apple Watch,而是

  • Soul App 在 ChinaJoy,在三次元的世界打造“Gen AI社交游乐园”

    2025年8月1日,第二十二届ChinaJoy将在上海新国际博览中心开幕。作为亚洲规模最大、最具影响力的数字娱乐盛会,ChinaJoy不仅是青年流行文化的标杆性事件,更是全球数字创意产业发展的风向标。社交平台Soul App以"Soul树洞情绪疗愈酒吧"为主题亮相,推出原创IP"莫比乌斯·第三弹"限定款数字文创,展现平台孵化的原生潮流文化。现场观众还能体验Soul最新的AI社交技术,包括与虚拟人即时互动等。Soul通过数字文创产品深度融合平台标志性的"捏脸"文化,让用户通过个性化形象设计展现独特风格,实现情感表达。数据显示,Soul 18-30岁主力用户群体正通过数字文创实现自我探索与身份重构,反映了当代年轻人"情价比"取代传统"性价比"的消费心理。此外,Soul还展示了AI社交创新实践,致力于打造"超类真人"和"深度沉浸"的社交体验,重新定义AI社交范式。

  • 秘塔AI也终于悄悄上线了DeepResearch。

    测试完以后,我觉得这玩意,还是值得我将近通宵写一篇的。 深度研究,也就是DeepResearch。 我过去写过很多次秘塔AI了,因为我自己的搜索习惯,现在基本就是,大活上ChatGPT用DeepResearch,常识问答直接找豆包,一般的AI搜索就是秘塔AI。 当然很多ChatBot产品都有AI搜索,但是我自己这两年,还是习惯用秘塔AI和Perplexity这样形态的原生AI搜索产品了,这可能就是习惯的力量吧。

  • AI日报:字节发布同声传译模型Seed LiveInterpret 2.0;秘塔搜索API上线;Lovart AI正式版全球发布

    AI日报栏目报道了多项AI领域最新进展:1)字节跳动发布端到端同声传译模型Seed LiveInterpret 2.0,实现中英高质量实时翻译;2)秘塔搜索API上线,提供低价多模态搜索服务;3)Lovart AI正式版发布,作为首个AI设计Agent重塑创作流程;4)李沐团队推出Higgs Audio v2语音合成模型,融合千万小时训练数据;5)OpenAI开发Sora2视频生成模型,与谷歌Veo3展开竞争;6)OpenAI与Oracle合作扩展Stargate项目,�