首页 > 业界 > 关键词  > 谷歌最新资讯  > 正文

谷歌提出全新RLHF方法:消除奖励模型,且无需对抗性训练

2024-02-12 10:29 · 稿源: 机器之心公众号

效果更稳定,实现更简单。大型语言模型(LLM)的成功离不开「基于人类反馈的强化学习(RLHF)」。RLHF 可以大致可以分为两个阶段,首先,给定一对偏好和不偏好的行为,训练一个奖励模型,通过分类目标为前者分配更高的分数。然后通过某种强化学习算法优化这个奖励函数。然而,奖励模

......

本文由站长之家合作伙伴自媒体作者“机器之心公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • AI日报:谷歌Gemini 3 Pro Preview模型上线;Cloudflare文件异常致全球宕机;百度Q3 AI收入96亿元

    谷歌发布Gemini 3大模型及Antigravity AI开发平台,支持参数灵活调整;Cloudflare因配置异常致全球服务中断6小时;微软测试AI文件连接器,允许Claude直接读取本地文件;百度Q3 AI收入96亿元,萝卜快跑订单激增;小米AI眼镜新增直播与语音控制功能;TikTok推出AI内容推荐调节选项;微软将Copilot全面集成至Office应用;谷歌推出实时生成交互界面的Generative UI技术;Manus发布Browser Operator,将浏览器升级为全功能AI代理。

  • 谷歌发布Gemini 3 数学能力堪称全球最强

    谷歌正式推出新一代推理模型Gemini 3.0 Pro,在各大评测榜单表现优异:LMArena竞技场以1501分登顶,数学基准测试达23.4%远超同行,编程能力稳居第一梯队,视觉理解准确率高达72.7%达现有水平两倍。该模型基于自研TPU训练,配套发布Agentic编程平台Antigravity,支持多步骤复杂流程自主执行(如智能整理收件箱)。目前通过Gemini应用、AI Studio及API向各类用户开放。

  • 新Siri或明年春季发布 苹果公司或引入谷歌Gemini大模型 AI技术

    苹果因自研大模型项目遇瓶颈,决定引入谷歌Gemini大模型升级Siri,计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数,将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能,支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送,后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

  • AI吃播开始和真人吃播抢“饭碗”

    被咬开时发出清脆声响的玻璃水果、镶嵌着宝石的首饰盒、播放着音乐的水晶球,甚至还有毛绒玩具labubu和金条……各种你能想到或者想不到的,都正成为AI吃播的“食材”,被AI主播们塞入嘴里,轻松咀嚼。 这是一场风靡国内国外的热潮。在国外,Tiktok上一位叫leilanikovac的博主发了一条AI吃熔浆的视频,点赞数突破81.7万,另一位博主在三天内发了11条切水果的视频后,粉丝数

  • 遇到平板电池问题,试试联想想帮帮AI服务智能体的AI智修功能

    联想推出“想帮帮AI服务智能体”,通过AI智修功能解决手机/平板常见故障。用户只需在APP中输入问题,AI即可自动检测电池耗电快、断触、游戏卡顿等异常,结合知识库智能诊断并执行修复。系统具备主动预警、自动修复能力,严重故障时可协助预约售后。该服务覆盖设备全生命周期,提供快速定位、即时处理的一站式解决方案,让用户告别手动排查烦恼。

  • AI日报:Sora正式登陆Android;网易云音乐推AI调音大师;谷歌将推Nano Banana2

    本期AI日报聚焦多领域突破:OpenAI视频应用Sora登陆安卓平台并引入付费角色功能;网易云音乐推出AI调音大师实现智能音效适配;字节跳动高薪布局人形机器人赛道;谷歌Gemini平台将升级图像生成技术;llama.cpp实现多模态革命;特斯拉秘密实验室通过行为数据训练机器人;上海首例AI著作权案宣判保护原创;微软推出自研图像生成器MAI-Image-1,在创意效率与质量间取得平衡。

  • 爱诗科技下注的AI视频,正在比它预期的更「快」落地

    「我们决定全力投入视频生成领域,因为我们坚信视频生成一旦能够落地,其产品化和商业化的潜力可能不亚于大语言模型。」爱诗科技创始人兼CEO王长虎在2025年6月的一场演讲中,这样解释为什么要在2023年就坚定地选择AI视频生成这个非共识赛道作为自己的创业方向。 短短两年后,视频大模型的产品化和商业化潜力已经如王长虎判断的那样,在快速落地,形成自己的创作生�

  • 蚂蚁也正式加入AI超级入口战场,他的名字,叫灵光。

    蚂蚁集团推出全新AI助手“灵光”,以极致用户体验为核心突破传统AI工具。其亮点包括:结构化排版回答、交互式图表生成、3D模型渲染(如越王勾践剑动态演示),并支持闪应应用——用户可通过自然语言指令快速生成定制化小程序(如人生计时器、财报分析工具)。结合支付宝生态潜力,未来或实现真实账单管理与订阅优化。产品通过优雅设计唤醒用户探索欲,重新定义�

  • 这个双11,为什么AI成了下单的主要催化剂?

    今年双11已经走到第17个年头,消费者依旧熬夜比价,商家照样通宵盯盘,但后台的「发动机」已经换了芯。 当AI从大模型论文里走出来,第一站就上了电商——这个离钱最近、数据最肥的试验田。 淘宝把大模型塞进搜索框,一句「清理下水道小飞虫的东西」这样口语化的表达,也能打捞数十亿SKU;豆包把商城藏进对话框,边闲聊边下单,让购物像发朋友圈一样随手;飞书则远�

  • 科杰科技入选赛迪AI Infra平台市场研究报告,引领Data&AI数据基础设施新范式

    近日,赛迪顾问发布《2025中国AI Infra平台市场研究报告》,全面梳理中国AI基础设施平台市场格局、技术趋势与竞争态势。报告显示,2024年中国AI Infra平台市场规模达345亿元,预计2025年将飙升至673亿元,同比增长95.1%。企业AI应用正从单点验证迈向嵌入核心业务流的深度阶段,对基础设施提出更高要求。科杰科技凭借Data&AI融合架构、湖仓一体引擎及企业级AI落地能力强势入选,位列“挑战者”象限,彰显其在Data&AI领域的领先地位。

今日大家都在搜的词: