大模型自我奖励：Meta让Llama2自己给自己微调，性能超越了GPT-4

2024-01-21 09:43 · 稿源：机器之心公众号

人工智能的反馈（AIF）要代替 RLHF 了?大模型领域中，微调是改进模型性能的重要一步。随着开源大模型逐渐变多，人们总结出了很多种微调方式，其中一些取得了很好的效果。最近，来自 Meta、纽约大学的研究者用「自我奖励方法」，让大模型自己生成自己的微调数据，给人带来了一点新

......

本文由站长之家合作伙伴自媒体作者“机器之心公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

OpenAI发布GPT-5.1：情商大涨本周开始推送

OpenAI正式推出GPT-5.1模型，以“智商与情商深度融合”为核心亮点。新模型优化推理能力，强化情绪价值与个性化交互，包含Instant与Thinking两大核心版本：Instant首次引入自适应推理功能，针对复杂任务延长思考时间，简单问题保持极速响应；Thinking版本智能分配思考时长，提升回答透彻度与通俗性。新增Auto功能自动匹配最佳模型，支持六种官方预设风格及精准微调。安全评估首次纳入心理健康与情感依赖维度，防范拟人化风险。付费用户可保留旧版三个月过渡期。

GPT-5.1模型智商与情商自适应推理
华为Mate 80系列下周预热：史上最强Mate 四剑齐发

博主定焦数码暗示，华为Mate 80系列将在11月18日预热，11月25日正式发布。据悉，华为Mate 80系列将推出4款旗舰，包括Mate 80、Mate 80 Pro、Mate 80 Pro Max和Mate 80 RS非凡大师。其中Mate 80和Mate 80 Pro是6.75英寸1.5K屏，Mate 80 Pro Max和Mate 80 RS非凡大师是6.89英寸1.5K屏，四款机型全部支持3D人脸识别，这是Mate系列旗舰第一次全系标配3D人脸识别。核心配置上，Mate 80系列首发全新的麒麟

华为Mate 80 麒麟9030芯片
苹果发布iOS 26.2 beta 2：动效更流畅、继续适配液态玻璃

苹果今天凌晨发布了iOS 26.2 beta 2，依然在适配更多的液态玻璃效果，并且还优化了动画效果，更流畅丝滑了。以下是本次主要更新内容：游戏库新增排序与筛选功能，支持手柄导航，且在播放过程中可实时更新分数。新版还强化了社交互动功能，用户可以直接从游戏”应用中邀请朋友进行挑战或实时多人游戏，当朋友打破你的高分纪录时，系统还会发送通知，方便你立即�

iOS 26.2 游戏库更新
LIFETOO品牌缩醛磷脂荣获2025年TITAN健康奖，以科学创新推动脑健康产业升级

LIFETOO品牌凭借核心产品"缩醛磷脂脑活素"荣获2025年TITAN健康奖神经健康领域奖项。该成分通过高效抗氧化、调节神经功能及改善认知等机制发挥作用，动物实验显示能显著提升学习记忆能力。奖项认证了品牌在科研转化与成分应用方面的实力，为应对全球老龄化趋势下的脑健康挑战提供了科学解决方案，推动功能性食品行业向专业化发展。

TITAN健康奖缩醛磷脂脑活素神经健康
荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

本期AI日报聚焦多项技术突破：月之暗面开源AI代理框架Kosong，支持异步编排与插件化设计；Replit推出AI集成功能，可一键调用300+模型；商汤发布空间智能模型SenseNova-SI，性能超越GPT-5；百度推出多模态模型ERNIE-4.5-VL，新增图像思考能力；谷歌地图全面AI化，集成Gemini实现智能交互；ChatTutor上线可视化教学系统，覆盖多学科实时推演；新版Google Finance引入AI深度搜索与财报追踪；OpenAI低调上线Polaris Alpha模型，支持256K上下文并更新知识库至2024年10月。

AI代理开源框架异步编排
华为Mate X7首发定制20GB内存：本月见

博主定焦数码爆料，华为Mate X7将会首发定制20GB超大内存，这是华为史上内存最大的折叠屏旗舰。在AI时代，AI手机需要充足的运行内存，运行内存可以随时读写，其响应速度比硬盘等长期存储介质快得多。因此，若想实现手机快速调用AI功能的效果，最高效的方法是让AI模型一直在运行内存中加载，即时刻准备着”。这次华为Mate X7配备了20GB超大内存，比安卓阵营普遍采用的1

华为Mate X7 20GB内存
华为Mate 80标准版首次支持3D人脸识别：看齐Pro

博主数码闲聊站爆料，华为Mate 80全系支持3D人脸识别，包括标准版，这在Mate系列史上还是第一次。已知Mate 70 Pro系列支持3D人脸识别，其正面采用三挖孔形态，预计Mate 80系列正面也将是三挖孔设计，而且该机还将支持侧边指纹识别。据悉，全新的华为Mate 80系列共有4款机型，分别是Mate 80、Mate 80 Pro、Mate 80 Pro Max、Mate 80 RS非凡大师。其中Mate 80和Mate 80 Pro屏幕尺寸是6.75英寸，M

华为Mate 80 3D人脸识别
最强Mate旗舰！华为Mate 80本月下旬亮相

华为Mate 80系列会在11月25日前后发布，这将是史上最强Mate旗舰。据悉，本次发布会将会推出Mate 80、Mate 80 Pro、Mate 80 Pro 和Mate 80 RS四款旗舰，其中标准版代号Voyager，支持66W有线快充；Pro、Pro 及RS版统一采用Sagittarius代号，支持100W有线充电。

华为Mate 80 麒麟9030芯片
华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

华为11月14日推出WATCH ULTIMATE DESIGN非凡大师紫金款智能手表。该系列定位超高端，于2023年9月首次发布，由刘德华代言。新款采用18K黄金材质，设计灵感源自航海轮舵，表圈手工镶嵌六颗黄金，搭配黄金表圈、旋转表冠及可伸缩蝴蝶扣等精致设计，尽显奢华质感。功能方面支持双向北斗卫星消息、百米防水及健康管理，智能模式下续航达8天。新品将于11月15日10:08开启预售，面向追求高端独特风格的消费者。

华为WATCH ULTIMATE DESIGN
荣耀500系列11月24日亮相：比华为Mate 80早一天

荣耀宣布即将发布荣耀500系列，该系列以越级配置带来双超体验，性能不妥协，续航再突破，重新定义档位标准。博主定焦数码爆料，荣耀500系列发布时间应该是11月24日，跟华为Mate 80系列发布会很接近，后者预计会在11月25日亮相。据悉，荣耀本次发布会将会推出荣耀500和荣耀500 Pro两款机型，全系搭载高通骁龙8系旗舰平台，其中标准版搭载高通骁龙8s Gen4，Pro版搭载高通骁�

荣耀500系列高通骁龙8系横向跑道DECO

今日大家都在搜的词：

热文

3 天
7天

大模型自我奖励：Meta让Llama2自己给自己微调，性能超越了GPT-4

OpenAI发布GPT-5.1：情商大涨本周开始推送

华为Mate 80系列下周预热：史上最强Mate 四剑齐发

苹果发布iOS 26.2 beta 2：动效更流畅、继续适配液态玻璃

LIFETOO品牌缩醛磷脂荣获2025年TITAN健康奖，以科学创新推动脑健康产业升级

荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

华为Mate X7首发定制20GB内存：本月见

华为Mate 80标准版首次支持3D人脸识别：看齐Pro

最强Mate旗舰！华为Mate 80本月下旬亮相

华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

荣耀500系列11月24日亮相：比华为Mate 80早一天

今日大家都在搜的词：

热文

iPhone Pocket正式开售：联名三宅一生售价1299元起

1899元苹果手机包卖完了！iPhone Pocket在吐槽声中销售火爆

AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT

微信小程序将在iOS端支持接入虚拟支付苹果抽成15%

华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

雷军回应小米双11战绩：谢谢大家支持

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

卢伟冰：小米手机双11连续三年国产销量第一

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

95岁巴菲特每周还上5天班此前计划年底退休

京东发布双11战报：订单总量增长近60% 下单用户同比增长40%

站长商机