首页 > 业界 > 关键词  > 批判性微调最新资讯  > 正文

让SFT重新伟大!CMU等华人学者提出全新「批判式微调」,媲美复刻版DeepSeek

2025-03-09 10:29 · 稿源: 新智元公众号

【新智元导读】在面对复杂的推理任务时,SFT往往让大模型显得力不从心。最近,CMU等机构的华人团队提出了「批判性微调」(CFT)方法,仅在50K 样本上训练,就在大多数基准测试中优于使用超过200万个样本的强化学习方法。模仿是传统语言模型训练的主要方式。LLM在解决现实世界问题方

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 从“看家”到“懂家”:海雀大模型摄像头,重塑家庭主动智能新范式

    1月8日至11日,海雀科技在阿里云通义千问智能硬件展上发布搭载AI大模型的海雀摄像头。该产品不仅是家用智能摄像头首次在设备端直接使用大模型,更标志着摄像头从被动记录工具向主动服务的AI伙伴转变。海雀摄像头能看、会听、会思考、会执行指令,深入家庭场景,为育儿家庭提供“全能陪聊搭子”与“安心守护者”,为有老人的家庭提供“可对话的养生助手”,并成为所有家庭的“智能管家”。通过千万用户数据,海雀精准切入需求,以“主动智能”引领行业,为AI硬件赛道提供了从技术堆砌到场景融合的参考范本。

  • 20+大模型与70+智能体调度!李未可AI眼镜定义群体智能新范式

    文章以丹尼尔·卡尼曼的“快与慢”思维系统理论为引,介绍了李未可AI智能眼镜如何将AI融入人类最自然的“看、听、说”交互中。该产品通过“超能李未可”系统,结合自研大模型与多智能体协同的“群体智能”模式,实现了从快速直觉响应到深度理性思考的无缝衔接。它能高效处理实时翻译、信息查询等日常任务,并在需要时启动多专家智能体进行复杂规划与创意生成,致力于成为用户随身、随思、随需的“第二大脑”,让技术回归增强人类感知与创造能力的本质。

  • 国产全球最强医疗大模型Baichuan-M3发布:已超越GPT-5.2与人类医生

    AI大模型今年会向更专业的方向发起猛攻,除了AI编程之外,AI医疗也成为一大重点,OpenAI刚收购了一个医疗初创公司,Cluade也推出了AI医疗助手。 今天还有一家国产大模型新品也将目光瞄准了医疗,那就是Baichuan-M3,这是知名大佬王小川投资成立的百川智能发布的AI医疗大模型,号称全球最强。 据百川智能介绍,Baichuan-M3 专为医疗场景深度优化,融合海量医学文献、临床指南�

  • 苹果谷歌官宣合作:新一代Siri选定使用Gemini大模型

    苹果公司宣布将与谷歌展开深度合作,借助谷歌的人工智能技术为今年晚些时候推出的产品功能,尤其是Siri,提供强大的AI支持。 根据合作内容,谷歌将通过其先进的Gemini模型和成熟的云技术,为苹果未来的基础模型注入核心动力。苹果在官方声明中明确表示,经过审慎评估,谷歌的技术为苹果基础模型奠定了最为坚实的基础,公司对即将为用户带来的创新体验充满期待。

  • 花3000元让AI改口,大模型的尽头是广告?

    大模型界的翘楚OpenAI,面对每年数十亿美元的研发成本,正迎来一个艰难的决定:其员工正在琢磨如何让 ChatGPT 在用户提出相关问题时,优先显示赞助内容。 也就是说,当用户让大模型推荐一家眼镜店、一款工业传感器、一家民宿时,很可能大模型给出的是企业的软广。但大模型本身可能并不知道答案被“精心设计”过,它依然兢兢业业,会根据各个指标筛选出你想要的产品�

  • 昇腾赋能 TransMLA:无需重训突破架构壁垒,助力主流大模型高效适配 MLA

    北京大学张牧涵团队提出TransMLA转化框架,实现无需重训即可将主流大模型(如LLaMA、Qwen)从GQA架构迁移至MLA架构。该框架通过四大核心技术模块解决迁移痛点:结构映射、RoRoPE位置编码适配、频率折叠融合及KV矩阵均衡化,在昇腾算力支持下,成功在LLaMA-2-7B上裁剪68.75%的KV缓存,仅轻微性能损失。昇腾硬件的高效并行架构与存储优化体系为技术落地提供关键支撑,推动TransMLA集成至高性能推理框架生态,大幅降低企业升级成本,为长上下文推理提供自主算力解决方案。

  • 苹果新一代Siri要来了!选定谷歌Gemini大模型提供支持

    苹果将与谷歌合作,为今年晚些时候推出的产品功能(如Siri)提供人工智能支持。 谷歌将通过Gemini模型和云技术,为苹果未来的基础模型提供动力。 苹果在声明中表示:经过仔细评估,我们认为谷歌的技术为苹果基础模型提供了最强大的基础,我们对它将为用户带来的创新体验感到兴奋。” 据悉,苹果拟每年支付谷歌约10亿美元,获取定制化Gemini模型使用权,核心版本为1.

  • 连投六轮!明势天使项目「MiniMax」正式登陆港交所,成史上IPO规模最大AI大模型公司

    2026年1月9日,AI公司MiniMax在香港联交所主板上市,成为史上IPO规模最大的AI大模型公司。明势资本作为其最早的投资方之一,自2022年3月公司创业初期便参与投资,并连续六轮加注,是参与融资轮次最多的机构。此次IPO定价165港元,盘中大涨97%,市值超千亿港元,市场反响热烈。明势资本通过长期支持,助力中国大模型企业登上全球舞台。

  • 极光祝贺智谱成为全球首家大模型上市公司:继续以全球化消息与认证能力护航 AI 应用规模化

    极光祝贺智谱华章科技股份有限公司(简称“智谱”)在香港联交所主板上市,成为全球首家以通用人工智能(AGI)基座模型为核心业务的上市公司。智谱本次全球发行价为每股116.20港元,募集资金约43.5亿港元。极光表示,随着AI商业化加速,企业对高并发消息触达、身份认证等安全合规能力的需求持续提升。极光将继续通过全球化产品与交付能力,为包括智谱在内的众多AI企业提供用户增长与账号安全支持。

  • 边看边创造,在 PixVerse R1 的实时世界模型里,你真是上帝

    想象一下,用一句话生成一个世界,一句话改变一个世界,一句话无限延伸一个世界。 1月13日晚,爱诗科技正式发布 PixVerse R1,它是“全球首个通用实时世界模型”,支持最高1080P 分辨率,基于原生多模态架构、自回归流式生成和瞬时响应引擎构建。

今日大家都在搜的词: