首页 > 业界 > 关键词  > Meta最新资讯  > 正文

大模型自我奖励:Meta让Llama2自己给自己微调,性能超越了GPT-4

2024-01-21 09:43 · 稿源: 机器之心公众号

人工智能的反馈(AIF)要代替 RLHF 了?大模型领域中,微调是改进模型性能的重要一步。随着开源大模型逐渐变多,人们总结出了很多种微调方式,其中一些取得了很好的效果。最近,来自 Meta、纽约大学的研究者用「自我奖励方法」,让大模型自己生成自己的微调数据,给人带来了一点新

......

本文由站长之家合作伙伴自媒体作者“机器之心公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • OpenAI发布GPT-5.1:情商大涨 本周开始推送

    OpenAI正式推出GPT-5.1模型,以“智商与情商深度融合”为核心亮点。新模型优化推理能力,强化情绪价值与个性化交互,包含Instant与Thinking两大核心版本:Instant首次引入自适应推理功能,针对复杂任务延长思考时间,简单问题保持极速响应;Thinking版本智能分配思考时长,提升回答透彻度与通俗性。新增Auto功能自动匹配最佳模型,支持六种官方预设风格及精准微调。安全评估首次纳入心理健康与情感依赖维度,防范拟人化风险。付费用户可保留旧版三个月过渡期。

  • 华为Mate 80系列下周预热:史上最强Mate 四剑齐发

    博主定焦数码暗示,华为Mate 80系列将在11月18日预热,11月25日正式发布。 据悉,华为Mate 80系列将推出4款旗舰,包括Mate 80、Mate 80 Pro、Mate 80 Pro Max和Mate 80 RS非凡大师。 其中Mate 80和Mate 80 Pro是6.75英寸1.5K屏,Mate 80 Pro Max和Mate 80 RS非凡大师是6.89英寸1.5K屏,四款机型全部支持3D人脸识别,这是Mate系列旗舰第一次全系标配3D人脸识别。 核心配置上,Mate 80系列首发全新的麒麟

  • 苹果发布iOS 26.2 beta 2:动效更流畅、继续适配液态玻璃

    苹果今天凌晨发布了iOS 26.2 beta 2,依然在适配更多的液态玻璃效果,并且还优化了动画效果,更流畅丝滑了。 以下是本次主要更新内容: 游戏库新增排序与筛选功能,支持手柄导航,且在播放过程中可实时更新分数。 新版还强化了社交互动功能,用户可以直接从游戏”应用中邀请朋友进行挑战或实时多人游戏,当朋友打破你的高分纪录时,系统还会发送通知,方便你立即�

  • LIFETOO品牌缩醛磷脂荣获2025年TITAN健康奖,以科学创新推动脑健康产业升级

    LIFETOO品牌凭借核心产品"缩醛磷脂脑活素"荣获2025年TITAN健康奖神经健康领域奖项。该成分通过高效抗氧化、调节神经功能及改善认知等机制发挥作用,动物实验显示能显著提升学习记忆能力。奖项认证了品牌在科研转化与成分应用方面的实力,为应对全球老龄化趋势下的脑健康挑战提供了科学解决方案,推动功能性食品行业向专业化发展。

  • AI日报:月之暗面开源AI新框架Kosong;百度发布新模型ERNIE-4.5-VL;GPT-5.1“隐身”登场

    本期AI日报聚焦多项技术突破:月之暗面开源AI代理框架Kosong,支持异步编排与插件化设计;Replit推出AI集成功能,可一键调用300+模型;商汤发布空间智能模型SenseNova-SI,性能超越GPT-5;百度推出多模态模型ERNIE-4.5-VL,新增图像思考能力;谷歌地图全面AI化,集成Gemini实现智能交互;ChatTutor上线可视化教学系统,覆盖多学科实时推演;新版Google Finance引入AI深度搜索与财报追踪;OpenAI低调上线Polaris Alpha模型,支持256K上下文并更新知识库至2024年10月。

  • 华为Mate X7首发定制20GB内存:本月见

    博主定焦数码爆料,华为Mate X7将会首发定制20GB超大内存,这是华为史上内存最大的折叠屏旗舰。 在AI时代,AI手机需要充足的运行内存,运行内存可以随时读写,其响应速度比硬盘等长期存储介质快得多。因此,若想实现手机快速调用AI功能的效果,最高效的方法是让AI模型一直在运行内存中加载,即时刻准备着”。 这次华为Mate X7配备了20GB超大内存,比安卓阵营普遍采用的1

  • 华为Mate 80标准版首次支持3D人脸识别:看齐Pro

    博主数码闲聊站爆料,华为Mate 80全系支持3D人脸识别,包括标准版,这在Mate系列史上还是第一次。 已知Mate 70 Pro系列支持3D人脸识别,其正面采用三挖孔形态,预计Mate 80系列正面也将是三挖孔设计,而且该机还将支持侧边指纹识别。 据悉,全新的华为Mate 80系列共有4款机型,分别是Mate 80、Mate 80 Pro、Mate 80 Pro Max、Mate 80 RS非凡大师。 其中Mate 80和Mate 80 Pro屏幕尺寸是6.75英寸,M

  • 最强Mate旗舰!华为Mate 80本月下旬亮相

    华为Mate 80系列会在11月25日前后发布,这将是史上最强Mate旗舰。 据悉,本次发布会将会推出Mate 80、Mate 80 Pro、Mate 80 Pro 和Mate 80 RS四款旗舰,其中标准版代号Voyager,支持66W有线快充;Pro、Pro 及RS版统一采用Sagittarius代号,支持100W有线充电。

  • 华为WATCH ULTIMATE DESIGN非凡大师紫金款明天开启预售

    华为11月14日推出WATCH ULTIMATE DESIGN非凡大师紫金款智能手表。该系列定位超高端,于2023年9月首次发布,由刘德华代言。新款采用18K黄金材质,设计灵感源自航海轮舵,表圈手工镶嵌六颗黄金,搭配黄金表圈、旋转表冠及可伸缩蝴蝶扣等精致设计,尽显奢华质感。功能方面支持双向北斗卫星消息、百米防水及健康管理,智能模式下续航达8天。新品将于11月15日10:08开启预售,面向追求高端独特风格的消费者。

  • 荣耀500系列11月24日亮相:比华为Mate 80早一天

    荣耀宣布即将发布荣耀500系列,该系列以越级配置带来双超体验,性能不妥协,续航再突破,重新定义档位标准。 博主定焦数码爆料,荣耀500系列发布时间应该是11月24日,跟华为Mate 80系列发布会很接近,后者预计会在11月25日亮相。 据悉,荣耀本次发布会将会推出荣耀500和荣耀500 Pro两款机型,全系搭载高通骁龙8系旗舰平台,其中标准版搭载高通骁龙8s Gen4,Pro版搭载高通骁�

今日大家都在搜的词: