首页 > 业界 > 关键词  > 谷歌最新资讯  > 正文

谷歌提出全新RLHF方法:消除奖励模型,且无需对抗性训练

2024-02-12 10:29 · 稿源: 机器之心公众号

效果更稳定,实现更简单。大型语言模型(LLM)的成功离不开「基于人类反馈的强化学习(RLHF)」。RLHF 可以大致可以分为两个阶段,首先,给定一对偏好和不偏好的行为,训练一个奖励模型,通过分类目标为前者分配更高的分数。然后通过某种强化学习算法优化这个奖励函数。然而,奖励模

......

本文由站长之家合作伙伴自媒体作者“机器之心公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • AI日报:谷歌发布Veo 3.1;通义千问推Qwen Chat Memory功能;Sora2免费用户可生成15秒视频

    本期AI日报聚焦多项技术更新:谷歌Veo 3.1视频模型新增音频生成与精细化编辑功能;通义千问推出记忆功能提升对话连贯性;Sora2免费用户可生成15秒视频,Pro版支持25秒;百度文心助手升级8种创作模式;谷歌Flow工具增强视频光影编辑与音频合成能力;Anthropic发布高性价比Claude Haiku 4.5;北京查处首例AI虚假广告案,涉伪造主持人带货;阿里推出响应仅200毫秒的编程工具Qoder CLI。

  • AI日报:谷歌Gemini 3.0 Pro小范围推送;爱诗科技完成1亿元B+轮融资;百度发布文档解析模型 PaddleOCR-VL

    谷歌Gemini 3.0 Pro开始小范围推送,强化推理与多模态能力;百度发布全球领先文档解析模型PaddleOCR-VL,重塑OCR技术格局;爱诗科技完成亿元B+轮融资,ARR突破4000万美元;Anthropic推出Claude“skills”功能,提升AI工作效率;Pinterest推出AI内容限制工具,用户可自定义减少生成式图像;开源多模态模型LLaVA-OneVision-1.5超越Qwen2.5-VL;OpenAI视频生成模型Sora 2上线微软Azure平台,进入公共预览阶段;旅行搜索引擎Kayak推出“AI模式”,简化旅行规划与预订流程。

  • AI日报:快手KAT-Dev代码模型开源登顶;全球首款IP66防护人形机器人DR02发布;谷歌Chrome即将引入Gemini新功能

    快手开源72B代码模型KAT-Dev在SWE-Bench测试中准确率达74.6%,创国产AI编程里程碑;杭州云深处推出全球首款IP66防护全候作业机器人DR02;谷歌Chrome将集成Gemini引发隐私担忧;学者指控苹果使用盗版书籍训练AI,版权争议再起;Liquid AI发布高效稀疏激活模型LFM2-8B-A1B;苹果拟收购Prompt AI布局智能家居视觉技术;AI伴侣应用泄露4300万条用户隐私对话;西湖大学DeepScientist显著提升科研效率。

  • “AI家教”火了,哪家大厂领跑?

    各大应用榜单刚刚公布的9月数据,揭示出一个AI应用新风向——教育类AI应用正加速崛起。 多家机构的数据显示,这一赛道的月活用户(MAU)与下载量双双上涨,部分产品涨幅甚至逼近1000%。 以非凡产研的数据为例,好课帮助教育旗下的“光速写作”凭借场景定位与功能体验,月环比下载增速高达926.59%,科大讯飞旗下的“E听说中学”依托校园教学场景的产品设计,月活跃用�

  • 从游戏出海到AI应用出海 世纪华通建树海外AI市场

    世纪华通凭借成熟产品矩阵与全球化运营能力,成为中国游戏企业出海标杆。随着国内AI技术突破,公司加速拓展全球化赛道,推动AI应用落地海外市场。旗下极测信息与日本信华信合作,将核心产品“AI自主检测系统”引入日本自动化测试市场。该系统突破传统工具局限,实现测试用例自动生成与智能优化,效率提升超50%,已获行业权威认可。此次合作印证中国AI技术在垂直领域的全球价值,并凸显公司“ALL IN AI”战略——通过多元化产品覆盖产业需求,让AI成为全球化竞争核心势能。

  • 星环科技AI Infra平台:重构企业AI基础设施

    星环科技AI基础设施平台通过四层架构实现全面升级:资源平台统一调度异构资源;AI就绪数据平台支持11种数据模型统一处理;AI平台覆盖机器学习到大模型全生命周期;知识平台实现知识抽取与服务化。该平台具备多模型统一架构、全流程实时数据处理、高性能时序数据库等九大核心优势,形成从数据到知识、模型到应用的完整智能化支撑体系,助力企业规模化落地AI应用。

  • 纳米 AI 创作者赴疆支教 让AI火种扎根边疆点亮学生科技梦

    近日,纳米AI创作者赴新疆基层学校开展公益支教,将纳米AI视频制作功能带给学生。这场跨越千里的科技支教,让当地学生首次接触前沿AI技术,在西部课堂播下科技探索的种子。学生们通过简单文字描述即可生成专属AI短视频,直观体验科技魅力。创作者表示,希望通过低门槛的AI工具,在边疆播撒科技火种,让学生们看见更广阔的世界,未来不仅能使用科技,更可能成为科技创造者。纳米AI团队将持续推动AI普及,让更多边疆课堂感受科技力量。

  • 向AI构建能力,用模型产出价值,让金融优质发展

    2025年云栖大会在杭州举行,聚焦“云智一体+碳硅共生”主题,展现中国前沿科技生命力。阿里云智能集团副总裁张鹰介绍,“通义点金”平台全新升级,致力于构建金融行业垂直模型,打造具备业务洞察力的“专家级智能体”。核心突破包括:通过飞轮平台实现模型与业务双向螺旋上升,构建可观测、可评测、可迭代能力;赋予模型“自知之明”,精准调用工具并内化人类逻辑思维;建立多层次交叉验证测评体系,确保金融级严谨性。未来将持续推动通用模型与金融专业知识的有机结合,助力金融业务核心效能提升。

  • 飞书再进化:会议纪要,AI直接“画”出来了

    一场90分钟的季度复盘会,信息密度极高。销售总监在第27分钟报出了Q3的关键增长数据,产品经理在第58分钟提到了下个季度的核心留存率目标,设计师则在屏幕上快速切换了五个版本的App首页设计稿。 会议结束,你的邮箱里收到了一份两万字的会议纪要全文。那些闪光的、高价值的数字和洞察,像金子一样被埋没在浩瀚的文字沙滩里,除非有人愿意再花一个小时重读一遍,�

  • 荣耀亲选KUMI AI Note发布:支持AI通话录音智能转换 699元

    荣耀发布KUMI AI Note智能记事本,售价699元。产品采用磁吸卡片设计,厚度仅2.89mm,重量30g,便于携带。具备五大AI功能:语音转逻辑图、133种语言翻译、断句排版、人物识别及信息整理,转写准确率98%。内置高品质电池,支持24小时连续录音,配备Wi-Fi快传技术(5小时录音30秒传完)。适合会议记录、内容创作等场景,是便携的AI办公助手。

今日大家都在搜的词: