首页 > 业界 > 关键词  > Transformer架构最新资讯  > 正文

腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?

2025-03-24 14:35 · 稿源: 机器之心公众号

在过去的一两年中,Transformer 架构不断面临来自新兴架构的挑战。在众多非 Transformer 架构中,Mamba 无疑是声量较大且后续发展较好的一个。然而,与最初发布时那种仿佛「水火不容」的局面不同,最近一段时间,这两种架构似乎正在走向融合。上周五,腾讯宣布推出自研深度思考模型

......

本文由站长之家合作伙伴自媒体作者“机器之心公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 华为Mate X7外观公布 搭载全新折叠玄武架构

    华为Mate X7折叠屏手机正式亮相,搭载全新超可靠折叠玄武架构,通过80℃热水喷淋、铁球冲击及弯折测试等极限可靠性检测,抗跌落、抗冲击及抗热水性能全面升级。支持IP58/IP59级别防尘抗水,典藏版外屏采用第二代玄武钢化昆仑玻璃,抗摔性能更出色。延续后置四摄与闪光灯布局,影像系统升级至5000万像素可变光圈主摄和潜望长焦镜头,硬件配置麒麟9030芯片,提供12GB/16GB/20GB多种内存版本,满足不同使用需求。

  • 荣耀Magic8 Ultra有望明年1月发布:7000mAh大电池、外观更尊

    今日,数码博主智慧皮卡丘”曝光了一款荣耀新旗舰,结合其配置与定位来看,预计为荣耀Magic8 Ultra。 该博主透露,荣耀Magic8 Ultra暂定明年1月发布,采用更尊贵的外观设计,正面为等深四曲屏,电池容量超过7000mAh。

  • 特斯拉磁悬浮Cybertruck车模上架中国官网 售价999元

    特斯拉磁悬浮Cybertruck车模11月12日在中国官网开售,定价999元。这款1:24比例模型精准还原实车细节,采用银色涂装与可亮车灯,内置14个LED灯,展现科技感。模型重293克,底座重1291克,确保稳定悬浮。使用时只需通电并放置于非金属表面,通过磁力实现悬浮效果,可静置观赏或轻触旋转,为收藏爱好者带来独特视觉体验。

  • 华为Mate X7首发定制20GB内存:本月见

    博主定焦数码爆料,华为Mate X7将会首发定制20GB超大内存,这是华为史上内存最大的折叠屏旗舰。 在AI时代,AI手机需要充足的运行内存,运行内存可以随时读写,其响应速度比硬盘等长期存储介质快得多。因此,若想实现手机快速调用AI功能的效果,最高效的方法是让AI模型一直在运行内存中加载,即时刻准备着”。 这次华为Mate X7配备了20GB超大内存,比安卓阵营普遍采用的1

  • 颠覆Diffusion局限!Utopai双模型耦合架构,攻克AI影视长叙事核心难题

    Utopai Studios推出专为影视制作设计的AI模型与工作流,区别于主流视频生成模型,其核心能力在于理解剧本、规划镜头及生成场景,通过自回归模型负责叙事规划与一致性约束,扩散模型专注高质量画面渲染。该系统能解决跨镜头元素漂移难题,提升制作效率与作品品质。目前工作流仅用于公司自有项目,强调AI作为创作者协作者的角色,并遵循行业道德与版权规范。

  • 2025乌镇峰会:易鑫发布汽车金融行业首个Agentic大模型XinMM-AM1

    易鑫集团在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型具备300亿参数、响应延迟低于200ms等技术优势,能提升获客、风控与运营效率,优化用户体验。通过全链路智能决策能力,推动行业从"单点智能"转向"整体高效"。配套SaaS平台已覆盖超4万家经销商及百余家金融机构,显著提高融资通过率与业务质量,填补领域技术空白,引领汽车金融智能化发展。

  • 华为年度机皇!Mate 80 RS非凡大师亮相:首发20GB内存、双潜望长焦镜头

    今日,华为Mate 80系列宣布定档11月25日发布,目前已在华为商城上架,将于今天中午12:08开启预订。 华为商城显示,作为华为最顶级的高端旗舰,华为Mate 80 RS非凡大师首发20GB内存,这是华为内存最大的旗舰手机,比安卓阵营普遍采用的16GB内存更大。

  • TME们的黄金时代,迎来AI终结者

    过去十年,中国与全球的音乐流媒体平台都在同一套逻辑下运行:依赖庞大的版权曲库、依赖订阅制、依赖“以版权为护城河”的内容供给方式,稳稳地坐在产业链的中心位置。 无论是 TME,还是网易云,平台之间的竞争从本质上都不是产品之争,而是版权之争——谁拥有更完整的曲库、谁能锁定更多独家资源,谁就拥有更牢固的用户粘性。 然而,随着AI音乐过去一年里爆发式

  • 字节旗下AI编程工具TRAE SOLO发布 面向所有用户开放

    字节跳动AI编程工具TRAE SOLO正式版发布,面向国际用户开放。该工具提供IDE和SOLO两种开发模式:IDE模式在保留原有流程基础上增强智能问答、代码补全等AI能力;SOLO模式以AI为主导,能理解开发目标、调度工具并独立完成从需求分析到代码实现的全流程。这标志着AI编程从工具增强迈入流程重构新阶段,实现覆盖软件开发全流程的高度自动化。

  • AI日报:百度发布文心5.0;可灵2.5Turbo模型上线“首尾帧”功能;微博推出 VibeThinker-1.5B

    本期AI日报聚焦多项技术突破:OpenAI推出GPT-5.1,提升对话自然度与响应速度;百度发布原生全模态大模型文心5.0,支持跨文本图像生成;微博开源VibeThinker-1.5B模型,以低成本实现高效推理;可控视频生成模型新增首尾帧控制功能;李飞飞团队推出商用3D世界生成工具Marble;东北大学开源多语言翻译模型支持60种语言;谷歌Gemini语音功能升级实现更自然交互;阿里启动“千问”项目对标ChatGPT,全面布局C端AI应用竞争。

今日大家都在搜的词: