首页 > AI头条  > 正文

混元开源新方案 MixGRPO:训练效率大幅提升,性能反而更强

2025-08-04 10:49 · 来源: AIbase基地

近日,腾讯的混元基础模型团队发布了一项突破性的图像生成新框架 MixGRPO。这一方案不仅将训练时间缩短了近50%,而且在性能上表现优异,甚至推出了一个名为 MixGRPO-Flash 的变体,进一步将训练时间降低了71%。这一切,得益于他们将随机微分方程(SDE)和常微分方程(ODE)相结合的创新采样策略。

在当前的图像生成技术中,效率与质量常常是一对矛盾的存在。MixGRPO 通过引入混合采样的方法,优化了马尔可夫决策过程(MDP),使得训练效率得到了显著提升。具体而言,该框架通过限制智能体的随机探索范围,减少了优化过程中的计算开销,同时简化了模型的训练流程。

QQ20250804-104805.jpg

与之前的 DanceGRPO 模型相比,MixGRPO 在多个维度上都表现出显著的改善。研究团队在实验证明了,只需对特定的去噪步骤进行优化,就能够保持甚至提升性能。研究还指出,虽然 MixGRPO 在减少训练时间的同时降低了计算开销,但也需要高阶求解器的引入,以加速旧策略模型的采样。

此外,MixGRPO 采用了滑动窗口的策略,让模型能够在去噪的过程中逐渐聚焦于更关键的时间步,从而实现了更高效的优化。这一创新使得模型在图像生成的多样性和质量上都有了不小的进步。

MixGRPO 不仅为图像生成技术的未来开辟了新的方向,也为后续研究提供了宝贵的经验和借鉴。开源代码已在文章末尾提供,期待更多开发者加入到这一激动人心的技术探索中来。

项目地址:https://tulvgengenr.github.io/MixGRPO-Project-Page/

  • 相关推荐
  • 新一代AI存储大幅提升训练效率,断点恢复速度提升

    AI训练频繁中断是行业难题。华为OceanStor A系列存储通过TB级集群带宽和高速读写能力,显著优化断点续训性能。AI大模型集群部署该方案后,恢复时间从15分钟缩短至1分钟,保障GPU/NPU算力资源充分利用。华为强调,高性能存储正成为以“存”强“算”的关键基础架构。

  • 年轻人为啥拥抱“冻门”:快节奏生活新方案

    “冻门”饮食方式在都市青年中兴起,通过周末集中备餐、冷冻保存,工作日简单加热即可快速用餐。这种模式既解决了快节奏生活下的用餐难题,又带来掌控感与心理满足。数据显示,一线城市63%的独居青年厨房不足3平米,长通勤时间进一步压缩烹饪空间。相比外卖,自制预制冷冻餐在食材新鲜度和营养搭配上更具优势,但需注意冷冻不超过7天。营养师建议新手从低风险菜品入手,逐步掌握冷冻规律,让“冻门”成为兼顾效率与品质的生活方式。

  • Matrixport 加密基金获 FCA 营销许可,机构化投资通道加速成型

    2025年9月11日,Matrixport旗下旗舰产品Crypto Market Index Fund获得英国FCA营销许可,成为首个可在英国向专业投资者私募销售的瑞士加密基金。该基金追踪瑞士SIX交易所的CMI10指数,覆盖BTC、ETH等十大主流加密资产,采用合规基金结构,由FINMA监管。此次突破体现了Matrixport"双轮驱动"战略:持续优化产品结构与深化合规运营,为机构提供透明安全的数字资产配置工具。

  • Matrixport 于 Token2049 新加坡期间举办 DAT 高峰论坛,聚焦下一轮市场周期话语权

    在2025年TOKEN2049新加坡峰会期间,Matrixport举办闭门论坛探讨数字资产财库战略。与会专家一致认为,DAT正从风控工具升级为机构战略核心,预计将形成寡头主导格局。Matrixport通过一站式解决方案推动行业标准化,其管理的DATCO持仓规模突破千亿美元。论坛凸显DAT作为华尔街资本入局加密市场的重要通道,未来将在全球金融体系中扮演关键角色。

  • 碾压级GPU性能,3倍光追提升,天玑9500打造手机游戏最强心脏

    2025年9月22日,联发科发布天玑9500旗舰5G芯片,其GPU性能与能效双领先,被媒体称为“最强GPU”。天玑9500搭载G1-Ultra核心,采用全新GPU+Dynamic Cache架构,在3DMark测试中峰值达3402分,功耗仅12.3W,全程超越A19Pro。光追性能提升3倍,支持主机级虚幻引擎5.5 Nanite技术,实现千万级模型渲染,并首发Megalights技术,流畅运行《暗区突围》光追120FPS。实测显示其图形表现达到移动处理器顶尖水平,重构移动端图形性能天花板。

  • 一图看懂OPPO Find X9系列影像系统 OPPO周意保:画质革命

    OPPO Find X9系列9月29日官宣影像系统,负责人周意保称将掀起移动影像画质革命。该系列在五大技术上突破:AOA主动光学校准、第四代徕卡色彩还原镜头、瞬时三曝光、满血版LYT-828传感器、LUMO超像素引擎并行异构计算,并首发3nm算力芯片。支持哈苏2亿像素直出、全焦段8K超清照片、4K超清实况照片及小红书分享链路。针对旅拍优化人像拍摄,配备专业增距镜等配件。视频支持4K 120fps杜比视界HDR、10bit Log格式及哈苏大师影调。10月16日发布,值得期待。

  • 从数字工具到效率员工,AI员工赋能企业营销服务生产力全面提升!多款AI工具口碑推荐,用AI驱动新增长!

    如今,AI赋能业务已非遥不可及,而是切实帮助企业降本增效的新方案。文章以获客、销售、服务、办公四大场景为例,说明AI如何替代重复性工作:营销人员可借助AI工具快速生成高质量素材;销售可将客户跟进、资料更新等琐事交给AI,专注高价值沟通;售后AI能24小时响应基础问题,提升服务效率;办公场景中,AI还能辅助招聘筛选、邮件撰写等日常任务。通过引入具备理解、推理、执行能力的智能工具,企业能以更少人力、更高效率实现业务优化,未来率先布局AI的企业将更具竞争优势。

  • AI日报:蚂蚁开源高性能思考模型Ring-flash-2.0;通义7款模型屠榜Hugging Face;Veo3视觉能力升级

    蚂蚁百灵团队开源高性能思考模型Ring-flash-2.0,在多项基准测试中表现优异;阿里通义7款模型登顶Hugging Face榜单,Qwen3-Omni凭借多模态能力全球第一。谷歌Veo3突破视频生成局限,可自动完成视觉任务;特斯拉推进人形机器人量产,马斯克称其为最重要产品。马斯克第六次起诉OpenAI窃取商业机密,苹果内部测试聊天机器人Veritas优化Siri,YouTube推出AI音乐主播增强互动,LiquidAI发布轻量级模型Liquid Nanos优化边缘计算。

  • 华为云GaussDB将接入全球首个通算超节点 性能提升2.9倍

    华为在第十届全联接大会上发布基于TaiShan950超节点的GaussDB多写架构,性能提升2.9倍,每分钟可处理540万笔事务。该架构实现计算、内存、存储三层资源池化,支持秒级故障恢复,可平滑替代传统数据库。GaussDB已应用于金融、政务等关键行业,在中国数据库市场以13.9%份额首次超越Oracle登顶。华为通过20余年研发实现全栈自主创新,标志着中国数据库技术从跟随到引领的关键跨�

  • OPPO Find X9系列定档:10月16日发布

    OPPO宣布将于10月16日19:00发布Find X9系列,包括X9和X9 Pro两款手机,同时推出OPPO Pad5平板和OPPO Watch S智能手表。Find X9系列采用直屏设计,配备超大弧度边框,提升握持舒适度;首发全场景1nit明眸护眼屏,支持3840Hz超高频PWM调光;搭载哈苏四摄影像系统,大幅提升进光量;核心采用联发科天玑9500处理器,跑分超400万;全系配备7000mAh超大电池,Pro版达7500mAh。此外,Pad5主打流畅耐用,支持多任务处理;Watch S定位轻薄时尚,厚度不足9mm。

今日大家都在搜的词: