首页 > AI头条  > 正文

Mercury:首个商用级别的Diffusion LLM,速度快、手机也能部署

2025-02-28 11:43 · 来源: AIbase基地

在人工智能领域,一项颠覆性的技术正在悄然兴起。近日,Inception Labs 宣布推出 Mercury 系列扩散大型语言模型(dLLMs),这是一种新一代的语言模型,旨在快速、高效地生成高质量文本。与传统的自回归大型语言模型相比,Mercury 在生成速度上提高了多达10倍,能够在 NVIDIA H100显卡上实现超过每秒1000个标记的速度,这一速度在以往仅依靠定制芯片才能实现。

QQ_1740714169865.png

Mercury 系列的首款产品 Mercury Coder,已在公共测试中亮相。该模型专注于代码生成,展现了出色的性能,并且在多个编程基准测试中超越了许多现有的速度优化模型,如 GPT-4o Mini 和 Claude3.5Haiku,同时在速度上也快了近10倍。根据开发者反馈,Mercury 的代码完成效果更受欢迎,在 C o p i l o t Arena 的测试中,Mercury Coder Mini 在性能上名列前茅,并且是最快的模型之一。

当前的语言模型大多采用自回归方式,即从左到右逐个生成标记,导致生成过程不可避免地是顺序的,延迟和计算成本较高。而 Mercury 则采用 “粗到细” 的生成方式,从纯噪声开始,经过几次 “去噪” 步骤,逐步精细化输出。这使得 Mercury 模型能够在生成时进行多标记的并行处理,从而实现更好的推理和结构化响应能力。

随着 Mercury 系列的推出,Inception Labs 展示了扩散模型在文本和代码生成领域的巨大潜力。接下来,公司还计划推出适用于聊天应用的语言模型,进一步拓展扩散语言模型的应用场景。这些新型模型将具备更强的智能代理能力,能够进行复杂的规划和长时间的生成。同时,它们的高效性使得在资源受限的设备上也能运行良好,例如智能手机和笔记本电脑。

总的来看,Mercury 的推出标志着人工智能技术的一次重要进步,不仅在速度和效率上大幅提升,也为行业提供了更高质量的解决方案。

官方介绍:https://www.inceptionlabs.ai/news

在线体验:https://chat.inceptionlabs.ai/

划重点:

🌟 Mercury 系列扩散大型语言模型(dLLMs)推出,生成速度提高至每秒1000个标记。

🚀 Mercury Coder 专注于代码生成,在基准测试中超越众多现有模型,表现优异。

💡 扩散模型的创新方式使得文本生成更加高效、精准,为智能代理应用提供新的可能性。

  • 相关推荐
  • 英伟达Blackwell Ultra芯片商用落地,微美全息以“算力+开源”领航AI科技新程

    英伟达与CoreWeave合作推出新一代AI芯片Blackwell Ultra,该芯片已实现商业部署,采用液冷技术,包含72个GPU和36个CPU。Blackwell Ultra的AI内容生成能力是前代产品的50倍,预计今年批量出货。英伟达凭借高性能AI芯片近乎垄断市场,年利润超5000亿元,市值逼近4万亿美元,有望成为全球市值最高公司。微软推迟自研AI芯片发布,转向过渡性设计方案。微美全息专注AI芯片技术布局,构建多元化技术生态,推动产业协同,成为全球AI芯片竞赛重要参与者。当前AI产业进入大规模商业化关键阶段,算力需求持续高涨,推动企业向算力数智化迁移。消费电子领域,AI赋能传统智能终端,新型智能硬件结合AI创造增量需求,关注算力产业链技术创新配套机遇。

  • Neousys宸曜科技亮相2025 Vision China(北京)

    2025年6月19-20日,北京机器视觉助力智能制造创新发展大会暨Vision+China2025在京成功举办。Neousys宸曜科技展示了多款边缘AI计算平台解决方案,包括:1)Nuvo-9160GC强固型AI推理平台,支持行为分析、安防监控等应用;2)NRU-230V-AWP自动驾驶计算平台,具备IP66防护和备用电源;3)基于NVIDIA Jetson的智能采集卡系列;4)Nuvo-10001系列高性价比嵌入式平台。产品覆盖机器视觉、自动驾驶、智能制造等领域,以宽温强固、无风扇设计满足严苛工业环境需求,获得现场观众高度评价。

  • 安卓迎来大变化:ChromeOS将跟安卓合并

    谷歌安卓生态系统总裁Sameer Samat确认,谷歌将会把ChromeOS与安卓系统整合为一个平台,不过Sameer Samat并未透露该计划的更多细节,消息称谷歌的计划是将ChromeOS迁移至安卓系统。 目前安卓系统已经支持大屏设备,提供完善的桌面模式、桌面窗口,还支持外接显示器,同时优化了应用适配,让应用在不同尺寸的屏幕上都能得到较好的适配和体验。 资料显示,ChromeOS是谷歌开

  • 应对VMware转型挑战!腾讯云x Omdia发布业内首个《从VMware到分布式云:企业虚拟化转型实战指南》

    腾讯云联合Omdia发布《从VMware到分布式云:企业虚拟化转型实战指南》,针对博通收购VMware后73%企业加速迁移计划的情况,提出"平替-升级-演进"三阶段路径。方案覆盖IaaS层替换、全栈云升级到云原生演进全场景,提供分布式云与专有云解决方案,支持5000vCPU规模下TCO降低30%。指南包含迁移策略、工具链及金融、制造等行业案例,如某银行8小时完成130套系统迁移并通过三级认证。腾讯云通过热迁移、数据同步等20余种工具,助力企业实现业务连续性保障和平滑过渡。

  • 699元 小米骨传导耳机2发布:游泳也能听音乐了

    时隔3年,小米骨传导耳机终于更新换代,小米骨传导耳机2正式发布,售价699元,将于7月21日10:00全渠道开售。 小米骨传导耳机2可选燕麦白、黑色两款配色,新增全新游泳模式,官方宣称水下旋律也能声声入耳”。 此外,耳机还支持独立音乐播放、颂拓游泳算法。 目前,小米暂未公布小米骨传导耳机2的核心配置,预计开售当天会公布。

  • 当 CODING 宣布其 DevOps 产品停服计划时,国内软件研发工具行业的平静被彻底打破

    腾讯旗下CODING DevOps平台将于2024年9月起逐步停服,极狐GitLab迅速推出专属迁移福利争夺用户。其优惠政策包括:首年订阅超低折扣(SaaS团队版300元/人)、免费代码仓库迁移服务、社区版用户专属折扣及3个月企业版试用权益。此举直击用户迁移痛点,降低经济门槛和操作风险。极狐凭借"中外合作3.0"模式在中国市场快速崛起,已与沃尔玛、理想汽车等企业建立成功合作案例。这场用户争夺战将加速国内研发工具行业洗牌,推动平台提升智能化服务和生态建设,最终使开发者获得更高效的工具选择。

  • 剑指谷歌Chrome!OpenAI即将推出AI浏览器

    据媒体报道,OpenAI即将推出的AI浏览器,利用人工智能技术彻底重塑用户的网络浏览体验,直接向占据市场主导地位的谷歌 Chrome 发起挑战。 凭借庞大的每周4亿活跃ChatGPT用户基础,OpenAI的浏览器若被广泛接纳,将对谷歌的广告生态系统、网络数据流和搜索流量构成实质性威胁。谷歌Chrome长期以来是Alphabet广告业务的基石,为其精准广告投放和将流量导向自家搜索引擎提供了关�

  • 二人利用手机NFC盗走80多万 警方:切记保护好银行卡密码

    ​近日,江西九江警方成功破获了一起利用手机NFC功能复制银行卡并实施异地盗刷的案件,两名犯罪嫌疑人通过非法手段转移资金高达80余万元。据警方透露,这起案件中,犯罪嫌疑人通过下载恶意软件,在受害者毫无察觉的情况下,将受害者的银行卡贴近自己的手机,利用手机的NFC(近场通信)功能,悄无声息地获取了银行卡的关键信息。

  • 雷军为魏建军打call:35周年生日快乐!长城汽车一定会越来越好

    此前,长城董事长魏建军今日发文表示:今天,长城汽车35岁了。35年一路风风雨雨,感谢大家的关注、支持和厚爱。 7月,我们计划了很多的活动,给大家汇报未来的战略规划,也一定努力为全球用户提供更优质的产品。 视频中,魏建军透露,长城汽车拍摄了一个名为《年方三十五》的短片,预计会延期发布。 他表示,未来五年的技术路线、市场路线、公司的发展路线和战

  • 山姆4斤冰块卖22.8元 客服:工艺特殊 融化速度较慢

    近日,山姆会员商店上架的一款“农夫山泉纯透实用冰”引发了消费者的广泛关注与讨论。有消费者指出,这款 2 公斤规格的冰块售价高达22. 8 元,价格偏高。 不过,也有部分消费者持不同看法,他们认为购买这款成品冰比自己买水冻冰块更为省事,而且自己冻制难以达到如此不规则的冰块形态。更有消费者表示,在使用这款冰块

今日大家都在搜的词: