首页 > AI头条  > 正文

混元开源新方案 MixGRPO:训练效率大幅提升,性能反而更强

2025-08-04 10:49 · 来源: AIbase基地

近日,腾讯的混元基础模型团队发布了一项突破性的图像生成新框架 MixGRPO。这一方案不仅将训练时间缩短了近50%,而且在性能上表现优异,甚至推出了一个名为 MixGRPO-Flash 的变体,进一步将训练时间降低了71%。这一切,得益于他们将随机微分方程(SDE)和常微分方程(ODE)相结合的创新采样策略。

在当前的图像生成技术中,效率与质量常常是一对矛盾的存在。MixGRPO 通过引入混合采样的方法,优化了马尔可夫决策过程(MDP),使得训练效率得到了显著提升。具体而言,该框架通过限制智能体的随机探索范围,减少了优化过程中的计算开销,同时简化了模型的训练流程。

QQ20250804-104805.jpg

与之前的 DanceGRPO 模型相比,MixGRPO 在多个维度上都表现出显著的改善。研究团队在实验证明了,只需对特定的去噪步骤进行优化,就能够保持甚至提升性能。研究还指出,虽然 MixGRPO 在减少训练时间的同时降低了计算开销,但也需要高阶求解器的引入,以加速旧策略模型的采样。

此外,MixGRPO 采用了滑动窗口的策略,让模型能够在去噪的过程中逐渐聚焦于更关键的时间步,从而实现了更高效的优化。这一创新使得模型在图像生成的多样性和质量上都有了不小的进步。

MixGRPO 不仅为图像生成技术的未来开辟了新的方向,也为后续研究提供了宝贵的经验和借鉴。开源代码已在文章末尾提供,期待更多开发者加入到这一激动人心的技术探索中来。

项目地址:https://tulvgengenr.github.io/MixGRPO-Project-Page/

  • 相关推荐
  • 聚焦大模型训练效率提升 北大依托昇腾突破细粒度混合并行技术

    北京大学崔斌教授团队在鹏城实验室支持下,研发了面向大模型的高效分布式训练框架。该框架通过统一训练接口、细粒度模型切分与并行策略搜索算法,解决了训练任务多样性和负载不均问题,实现训练效率提升15%。同时利用昇腾计算资源管理能力,优化硬件通信效率,通过计算通信重叠技术提升流水线效率。研究成果已在NeurIPS等顶会发表3篇论文,展现了国产算力在分布式计算领域的潜力,为AI产业自主化突破提供支撑。

  • 鲁大师7月新机性能/流畅/AI榜:荣耀折叠扛起性能大旗,OPPO中端机上演流畅逆袭

    7月手机市场冷淡,但仍有亮点产品:荣耀Magic V5以143万跑分登顶性能榜,成为全球最薄大折叠;三星Galaxy Z Fold7以215g重量获最轻大折叠称号;OPPO K13 Turbo Pro凭借主动散热风扇跑分127万,成为中端性能黑马。流畅度方面,OPPO双机包揽前三,ColorOS系统优化功不可没。AI榜单仍是骁龙8 Gen3主场,荣耀Magic V5以27.4万分夺冠。折叠屏开始扛起性能旗舰大旗,中端机通过系统优化实现流畅逆袭,骁龙旗舰芯片持续霸榜AI领域。

  • AI日报:混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布

    【AI日报】汇总了最新AI领域动态:1)腾讯开源混元系列小尺寸模型,适用于消费级显卡;2)昆仑万维发布推理大模型MindLink,提升回答透明度;3)B站推出AI原声翻译功能,保留UP主音色;4)谷歌Gemini 2.5在数学奥赛夺金,展现强大推理能力;5)OpenAI展示GPT-5网络信息整合特性;6)苹果组建AI团队挑战ChatGPT;7)高德地图推出全球首个AI原生地图应用;8)Adobe推出AI图像合成工具Harmonize;9)NVIDIA发布革命性视频渲染技术;10)谷歌推出Android Studio免费AI编程助手;11)开源结构化信息提取工具LangExtract;12)Figma开发者模式升级提升设计转代码效率。

  • Matrixport 收购瑞士合规加密资管公司,布局欧洲加密投资市场

    2024年9月30日,Matrixport宣布完成对瑞士持牌加密资产管理公司Crypto Finance(Asset Management)AG(CFAM)的收购。通过此次收购,Matrixport获得FINMA颁发的泛欧洲准入资质,将为欧洲市场提供合规加密资产管理服务。CFAM是瑞士首个面向大众发行加密投资产品的资管公司,2018年获FINMA牌照,2022年成为瑞士资管协会首个专注加密资管服务的成员。此次收购将助力Matrixport快速抢占欧洲合规加密市场,完善其全球合规布局。Matrixport此前已获得香港信托牌照、英国FCA授权等资质,目前管理资产规模达60亿美元。

  • 京东取消外卖超时20分钟免单服务 官方回应:准时率已大幅提升

    近日,社交平台上多位网友发帖称,京东外卖对原有的“超时20分钟免单”服务进行了调整,改为“超时20分钟赔付4元优惠券”。这一变动引发了消费者的广泛关注和讨论。 针对这一疑问,京东方面迅速作出回应。京东表示,自推出超时保障服务以来,平台一直致力于优化配送体验,目前京东外卖订单的准时率已得到显著提升。为了进一步提供更全面的保障,覆盖更多常见场�

  • 北京大学 鲲鹏昇腾科教创新卓越中心突破:自主创新软件SPONGE性能超越国际主流GPU方案

    北京大学杨立江团队在鹏城处理器支持下,成功优化分子模拟软件SPONGE,实现性能超越国际主流GPU水平。该成果通过区域分解并行算法和数学库优化,使并行效率提升80%;利用矩阵加速能力提升模型推理速度,单鹏城处理器性能达国际GPU的102%。优化后的SPONGE已应用于生物大分子相互作用模拟,为生命科学研究提供有力工具。相关代码已部分开源,未来将持续推动国产计算平台在前沿科技领域的创新应用。

  • 腾讯混元3D世界模型在魔搭社区开源首发

    7月27日,腾讯混元3D世界模型1.0在魔搭社区开源首发。这是业界首个开源的沉浸式3D世界生成模型,支持文字/图片输入快速生成完整3D场景,将原本需要数周的建模时间缩短至几分钟。该模型显著提升了游戏开发、VR、数字内容等领域的创作效率,开发者可免费下载体验,还能通过魔搭社区提供的4000+MCP服务和调试工具进行优化训练。作为中国最大AI开源社区,魔搭已汇聚500+机构、7万+模型,覆盖36个国家1600万开发者。此前腾讯开源的混元MoE模型Hunyuan-A13B也在该社区首发。

  • OpenAI发布2款开源模型:gpt-oss系列 能力接近o3和o4-mini

    OpenAI发布开源模型系列GPT-OSS,包含120B和20B两个版本。120B旗舰模型适配单H100 GPU架构,20B轻量版适合边缘计算。两款模型均开放完整推理链监控接口,支持动态参数调节和任务微调优化,性能接近闭源的GPT-O3和O4-mini。该系列突破性地支持代理功能,包括网页交互和Python代码执行,在标准化测试中表现优异。开源策略为开发者提供高性能替代方案,重新定义了AI模型的应用边界。

  • 突破风电运维瓶颈!上交大联合昇腾实现联邦学习训练性能飞跃

    上海交大李艳婷课题组基于昇腾算力平台,开发出轻量级集群联邦学习框架(CFL)和可分离残差网络(LMSRN),显著提升风电故障诊断效率。该方案训练效率较传统方法提升58%,同时保持诊断精度不变,解决了风电行业数据异构和隐私保护难题。昇腾平台的强大算力与硬件优化能力,为模型高效运行提供支撑。这一创新成果为风电智能化运维提供了兼顾性能与安全的新方案,验证了国产算力平台在工业智能领域的适配潜力。

  • Matrixport CEO John 出席 Foresight 2024 年度峰会,表示Matrixport将持续拥抱合规,提供专业资管服务

    Matrixport CEO John Ge在"Foresight2024"峰会上表示,合规化是加密行业主旋律。他指出当前加密市场缺乏新流量入场,资产管理趋向主流资产集中化,BTC、ETH等占比很高。随着加密ETF通过,合规属性增强,跨圈资管开始复苏。Matrixport将持续拥抱合规,为更多用户提供专业资管服务,帮助用户获取理性收益。公司成立于2019年,是亚洲最大的一站式加密金融服务平台,致力于构建�

今日大家都在搜的词:

热文