首页 > AI头条  > 正文

大模型推理大变革!CMU 与英伟达携手推出 Multiverse,实现超高速并行生成

2025-06-18 09:17 · 来源: AIbase基地

随着人工智能的发展,大型语言模型(LLM)的应用越来越广泛,但目前的推理方式仍然存在不少局限性。传统的自回归生成方式需要逐个生成 token,效率较低且无法充分利用现代硬件的并行计算能力。为了解决这一问题,卡耐基梅隆大学(CMU)与英伟达的研究团队推出了一种名为 Multiverse 的新型生成模型,旨在实现原生并行生成,从根本上改变我们对 LLM 推理的理解。

QQ20250618-091616.jpg

Multiverse 并不仅仅是加快生成速度,而是重新思考了模型的架构。研究者们发现,当前主流的大语言模型在生成过程中其实暗含了一种并行性。通过这一发现,Multiverse 框架采用了类似 MapReduce 的结构,将生成过程分为三个阶段:任务的自适应分解、子任务的并行执行,以及无损结果的合并。这样的设计能够充分发挥计算资源的潜力,实现更高效的推理过程。

image.png

根据实验数据显示,Multiverse-32B 模型在相同的上下文长度下,性能较自回归模型提高了近2%。这表明 Multiverse 不仅在速度上有显著提升,还在扩展性上表现优越,能够在不同的批量大小下实现最高两倍的速度提升。为了让这一成果能够更广泛应用,研究团队还开源了整个 Multiverse 生态系统,包括数据、模型权重和训练细节,方便其他研究者进行进一步探索。

在实际应用中,Multiverse 能够根据生成需求灵活调整,并通过一种专用的控制标签实现顺序与并行生成的动态切换,确保生成内容的连贯性和逻辑性。这项技术的推出无疑为自然语言处理领域注入了新的活力,让我们期待它在实际应用中的表现。

  • 相关推荐
  • OpenAI 提升o3多模态模型推理实力,微美全息(WIMI.US)加速引领产业新变革征程

    OpenAI推出突破性的o3推理模型,首次实现图像直接融入推理过程,在多模态基准测试V* Bench上准确率达95.7%。DeepSeek完成R1模型升级,上下文窗口从12K扩展至23K,幻觉率降低45%-50%。行业呈现开源趋势,DeepSeek开源策略促使多家企业跟进,OpenAI也考虑开源。微美全息加速布局多模态大模型,计划提供实时多模态AI体验。专家指出AI发展重心正从大模型向智能体演进,开源技术显著降低训练门槛,提升泛化能力,为多模态智能探索开辟新路径。企业需紧跟趋势把握机遇,在大模型驱动的新时代找准定位。

  • 姜钧凯:人工智能已经驱动硬件体系大变革

    爱国者集团CEO姜钧凯在2025中国人工智能产业领军论坛上指出,人工智能正推动硬件体系大变革。他回顾30年科技发展规律:每十年软硬件互相促进一次飞跃,从1993年电脑硬件、2003年数码产品到2013年智能穿戴,再到2023年后AI大模型兴起。姜钧凯透露,科学家正在研发基于金刚石芯片和碳基存储的新一代硬件系统,其中同位素电池技术尤为突破——采用碳14同位素衰变原理,可实现百年免充电,且安全无辐射。爱国者已布局强人工智能软硬件体系,包括居家养老系统、数据清洗平台及以金刚石芯片为核心的硬件研发。姜钧凯预测2056年将迎来超级人工智能时代,人类只需从事创造性活动。论坛上,爱国者还展示了针对自闭症儿童的水晶疗愈等创新应用。多位科学家高度评价爱国者对中国科技发展的贡献。(宋洁凡)

  • “全域联动”再现,空气能销售模式迎来重大变革

    太阳雨集团在河北清河县开展"全域联动"空气能促销活动,单场销售273台,创下县域市场新纪录。该模式突破传统门店销售,创新下沉市场零售方式,赋能经销商从压货模式转向卖货模式。当前空气能行业面临内卷困境,需拓展工农业应用场景并多元化渠道。太阳雨借鉴太阳能"城乡联动"经验,升级推出"全域联动"模式,通过政企补贴、高性价比产品和成熟渠道网络实现成功。其空气能产品以7999元惠民价格、0.5㎡超小占地和每月300元低电费三大卖点精准击中乡镇消费痛点。这一已验证的模式为行业突破千亿规模提供了可行路径,值得同业借鉴。

  • 英伟达重夺全球市值第一头衔 再度超越微软

    去年6月19日,英伟达股价曾以135.58美元创下历史新高,当时总市值达3.335万亿美元,一举超越微软和苹果,首次登上全球市值最高上市公司的宝座。此后,在全球市值排名中,英伟达与苹果、微软展开激烈角逐,三者轮番登顶。上一次英伟达成为市值最高的公司是在今年1月24日。 从英伟达自身的财务表现来看,其业绩也相当亮眼。根据英伟达2026财年第一季度财报,该季度公司

  • 英伟达最新高算力芯片上车 雷军:小米YU7全系标配激光雷达

    5月22日,小米正式发布YU7智能汽车,全系标配激光雷达和4D毫米波雷达。新车搭载第三代骁龙8移动平台,采用4nm工艺,显著提升运行速度,OTA升级最快仅需15分钟。配备英伟达Thor计算平台,算力达700TOPS,支持大模型上车。激光雷达探测距离200米,暗光环境下性能更强,能精准识别异形障碍物。同时应用ALD镀膜技术摄像头,有效减少眩光干扰,提升雨雾天气行车安全,实现更智能的辅助驾驶体验。

  • 高速红外热成像系统,高速车辆测温预警的“科技哨兵”

    文章介绍了高速公路车辆自燃事故频发问题及解决方案。针对长下坡、大货车多、高温天气等易发路段,交通部门通过红外热成像技术X640HWF300+构建预警系统,实现4ms快速响应、75Hz帧频精准监测轮胎和刹车片温度。该系统采用"云边端"架构,结合智能分析技术,实时筛查高温车辆并自动报警,有效减少自燃事故。通过实际案例证明,该系统能及时发现异常温度并提醒驾驶员检查,显著提升道路通行安全性。

  • 低成本、高速度、1080p高清 可灵2.1打造视频大模型新标杆

    快手可灵AI推出全新2.1系列视频生成模型,包含标准版(720p)和高品质版(1080p),主打高性价比与高效生成。大师版则提供更卓越的运动表现和语义响应,分辨率提升至1080p。新模型在成本控制方面优势明显,5秒视频生成仅需20-35灵感值,速度不到1分钟,处于行业领先水平。模型质量全面提升,动态细节更丰富、物理模拟更真实、提示词响应更精准。目前可灵AI全球用户突破2200万,累计生成超1.68亿视频,商业化进程加速,2025年Q1营收超1.5亿元。新系列将满足从短视频创作到专业影视制作的多场景需求。

  • 英伟达纵深扩展量子计算版图,微软/微美全息共发力奔赴技术革命新征程!

    英伟达CEO黄仁勋在COMPUTEX2025发表主题演讲,宣布推出企业AI计算平台NVIDIA RTX PRO服务器,搭载RTX PRO6000 Blackwell GPU,专为驱动AI工厂和加速企业AI工作负载设计。同时英伟达布局量子计算,设立全球量子AI技术研发中心G-QuAT,并投资量子计算初创公司PsiQuantum。微软宣布将后量子密码学技术整合到Windows系统,谷歌高管预测量子计算应用或将在五年内实现。微美全息作为量子产业先锋,通过量子计算与AI超算融合实现技术突破。全球科技巨头正加速布局量子计算领域,英伟达引领AI产业向纵深发展,在新竞争格局下进军量子计算,押注下一代技术浪潮。

  • 谷歌推出 250 美元的 AI Ultra 套餐,重新定义“高端”

    谷歌或许想把 AI Ultra 打造成一个精英创作者工具包,但它也可能正在重新定义“高端”:只是贵而已……

  • 全球首款生成式人形机器人运动大模型发布:可根据指令生成跑步、舞蹈等连贯动作

    今日上午,国家地方共建人形机器人创新中心联合复旦大学未来信息创新学院,正式发布了全球首款生成式人形机器人运动大模型 龙跃”(MindLoongGPT)。 龙跃大模型以自然语言驱动”为核心,构建了从多模态输入到高保真动作生成的完整闭环,颠覆传统运动控制范式。 也就是说,用户无需学习专业术语或操作复杂软件,仅需像与人类对话一样发出指令,例如以优雅的姿势递

今日大家都在搜的词: