首页 > 传媒 > 关键词  > AI算力最新资讯  > 正文

推理业务大增238.2%,天数智芯领跑AI推理新纪元

2026-03-31 17:47 · 稿源: 站长之家用户

2025年中国AI算力产业进入效率驱动新阶段,大模型竞争从参数比拼转向集群稳定性、推理成本与全场景渗透的综合较量。

高质量增长兑现 毛利率与营收双提升

近日,国内通用GPU龙头天数智芯披露年度数据,全年营收10.34亿元,同比增长91.6%。在国内GPU行业面临供应链与架构迭代挑战的背景下,成功跨越10亿营收门槛,经调整净亏损同比收窄32.1%,展现出强劲经营韧性,也标志着国内通用GPU正式从“跑通模型”迈向“极致能效比”的高质量发展阶段。

财务层面,天数智芯2025年毛利达5.58亿元,同比增长110.5%,毛利增速显著高于营收。得益于规模化量产稀释单片成本、工艺优化提升产品议价能力,企业“技术研发-量产落地-市场变现”的商业化闭环加速成型。截至年末,公司已服务超340家各行业客户,产品及解决方案在互联网、AI大模型、科研、金融、医疗、教育、交通等领域落地超1000项,客户基础与应用场景的双扩容,为业绩增长筑牢根基。其中核心的通用GPU产品收入9.23亿元,同比大增149.6%,占总营收的89.3%,成为业绩支柱。

训推双轮驱动 推理业务暴增238.2%

业绩高增的核心,是天数智芯 “训练+推理+端侧” 全产品矩阵的精准布局。三大产品线踩中大模型产业落地节奏,形成三极支撑。旗舰训练产品天垓系列实现收入5.84亿元,同比增长116.7%,其专为大规模模型训练设计,优化的架构与计算核心可支持多卡集群,解决大规模模型长期训练的可靠性痛点。

恰逢 “大模型推理元年”,面向云边推理的智铠系列迎来爆发,收入3.39亿元,同比猛增238.2%,成为公司增速最快的产品线。针对大模型向MoE架构演进后对带宽、低精度计算的严苛需求,智铠系列通过增强整数计算单元、优化数据渠道,深度适配主流推理引擎,成功在金融、零售等时延敏感场景落地。

全栈技术筑壁垒 云边端布局领跑行业

天数智芯依托现有通用GPU技术积累,推出面向机器人、智能终端等领域的彤央系列端侧算力产品,进行云边端产品全面布局。该系列依托通用GPU技术积累,将云端异构计算、高并发推理能力下沉至端侧,进行云边端产品全面布局,打造第三增长极。

硬件的突破离不开软件生态的坚实支撑。2025年,天数智芯在软件层面实现关键跨越,成功推动国内通用GPU从 “能用” 迈向 “好用” 的核心进阶,尤其在大模型推理PD分离技术领域成效突出 —— 通过解耦推理Prefill与Decoding阶段的计算任务,大幅提升资源利用率,精准契合行业 “降本增效” 的核心需求。

公司同步发布全新软件开发平台,原生兼容主流GPU编程模型,不仅实现代码迁移效率提升80%以上,更达成算子 “分钟级” 快速适配,显著降低客户使用门槛,可深度适配多元应用场景。

依托全栈自研软件栈,公司实现新模型、新算子发布的“Day0”原生支持。无缝匹配大模型快速迭代节奏;搭载无损量化技术的大模型加速工具包,在完全保障模型推理精度前提下,实现长文本处理效率提升50%、算力利用率提升60%、通信开销降低30%。芯片算力利用率(MFU)达到行业领先水平,成功支撑生产级集群部署。其DeepSpark开源社区已完成超610个主流算法模型适配,进一步夯实生态兼容性优势。

天数智芯已形成覆盖芯片设计、基础软件、AI算法的全领域研发能力。公司坚持 “量产一代、设计一代、预研一代”的三位一体研发战略,下一代天垓、智铠产品正针对大规模训练、新兴大模型推理持续优化,保持技术前瞻性。

此次天数智芯的财报亮点,不仅是企业自身的商业里程碑,更向行业传递出明确信号:国内通用GPU的竞争已从“有没有”转向“优不优”的能效与生态较量。从10亿营收的商业突破,到云边端全矩阵构建,再到软件生态核心壁垒形成,天数智芯的发展路径,印证了国内通用GPU正摆脱跟跑,迈入自主创新的高质量发展新纪元,也成为中国AI算力产业自主创新的核心支撑力量。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 北京亦庄设立大模型生态服务站 助力AI产业合规发展

    2026年4月,经北京市网信办认定,亦庄模数世界大模型生态服务站正式成立,为企业提供公益大模型备案辅导、产业生态对接等一站式服务。该站由市网信办授权、经开区信息技术产业局指导、北京国际算力服务公司运营,采用“1对1精准陪跑+集中培训”模式,可将备案周期压缩50%以上,解决企业合规认知不足等行业痛点。同时,经开区对完成备案的优质大模型企业给予100万元专项奖励及1亿元算力、模型、数据券等支持,常态化开展合规培训与产业对接,助力北京经开区加快构建全域人工智能之城。

  • 范式加码算力资源采购 全面提升API业务产能

    范式智能技术集团(6682.HK)宣布以4亿元人民币购买GPU服务器及配件,用于模型推理与训练,并投入API业务以满足市场快速增长需求。其API业务高速增长,2026年Q1客户Token调用量较2025年Q4增长超400%,每月调用量均成倍增长。公司凭借领先vGPU技术与大模型适配经验,提升Token调用效率,此次算力扩容体现中长期布局,将持续加大投入,支撑API业务未来高速增长。

  • 高通发布第五代骁龙4:GPU性能暴增77% 千元机也能90帧游戏

    高通正式推出第五代骁龙4移动平台,主打入门级智能手机,让千元机也能用上更流畅的性能和更好的游戏体验。 这代骁龙4最大的提升就是日常使用更跟手。它搭载了全新的流畅界面技术,应用启动速度比上一代直接提升43%,屏幕卡顿减少25%,平时刷页面、切软件都更顺滑。 游戏方面进步特别明显,GPU性能提升高达77%,并且支持90FPS高帧游戏。以前千元机玩游戏只能开低帧率

  • 砺算宣以方,国产自研GPU商业化答卷如何书写?

    国产GPU赛道竞争激烈,资本狂飙与市场拷问并存。宣以方,30多年GPU行业“活化石”,放弃S3资深研发副总职位,带领团队创立砺算科技,坚持全自研TrueGPU天图架构,四年内实现从创业到产品量产。2025年发布7G100系列,2026年推出Lisuan eXtreme系列显卡,兼容主流游戏、AI大模型及专业应用。公司以人性化管理激发团队,目标在蓝海市场做领航者,参与国际竞争。

  • 破解算力 ROI 困境,智子芯元完成新一轮融资

    智子芯元(深圳)科技公司成立不足8个月即完成数千万元融资,由同创伟业、钧山资本等联合投资。资金将用于加速“AI+运筹”技术路线产品迭代与规模化。当前国产AI芯片供给增加,但企业面临算力集群利用率低、算法工程师跨平台迁移耗时等新痛点。公司创始人丁添提出,行业矛盾已从“有无算力”转向“算力能否高效释放价值”,创新性推出“AI+运筹”路径,通过核心引擎KernelCAT实现自动化适配,已在华为昇腾等国产芯片上验证,并推出Kerminal和KerWork两款产品。投资方看好其计算加速价值,行业认为其运筹优化能力是推动国产芯片从“能用”到“好用”的关键力量。

  • 奇点算力深耕AI算力服务底座建设

    在大模型训练、推理及AIGC等需求持续增长的背景下,真正能立足市场的企业需在具体业务环节中持续投入、打磨并兑现服务承诺。深圳奇点算力正是这样一家深耕AI算力服务的平台型企业,从GPU资源接入、设备部署到IDC托管、运维监控及故障响应,围绕影响客户体验的关键节点持续发力。其扎实的底座能力、强化的交付链路及优化的服务流程,为行业提供了更稳定、可靠、高效的服务样本,不仅服务客户,也推动AI算力行业从“看概念”向“看能力”转变。未来,奇点算力将持续完善平台能力,强化GPU算力交付与场景适配,为下游客户提供更稳定、可持续的算力支持。

  • AI日报:千问PC端上线AI语音输入;字节发布全模态大模型Doubao-Seed-2.0-lite;谷歌更新AI搜索功能

    本期AI日报涵盖多项重要进展:千问PC端上线AI语音输入,提升办公效率;字节跳动发布全模态大模型Doubao-Seed-2.0-lite,实现视频、图像、音频与文本统一理解;腾讯联合多所高校推出开源多模态深度搜索智能体方案OpenSearch-VL;月之暗面申请“KimiClaw”商标,或涉硬件领域;Mininglamp开源Cider和Mano-P,打造本地AI工作站;OpenAI携手硬件巨头发布MRC协议,解决GPU闲置浪费;谷歌升级AI搜索功能,整合Reddit等社交观点;xAI推出Grok Imagine API质量模式,提升图像生成写实度。

  • 百度文心大模型5.1正式发布

    百度正式发布了新一代基础大模型——文心大模型5.1。该模型采用了自主研发的“多维弹性预训练”技术,仅以业界同规模模型约6%的预训练成本,便达到了基础效果领先的水平,并登上LMArena搜索榜国内第一的位置。 在多项行业权威基准测试中,文心5.1在智能体、知识理解、逻辑推理以及深度搜索等核心能力上表现突出。其中,智能体能力提升显著,已超越DeepSeek-V4-Pro;创意�

  • 改写语音交互行规,豆包大模型更稳了

    豆包大模型,又上新了。 2026年4月9日,原生全双工语音大模型Seeduplex正式发布,相比上一代半双工豆包端到端语音模型,新模型基于“边听边说”的全新框架设计,交互体验的自然感、顺畅度大幅提升,目前已在豆包App全量上线。 这意味着,前沿的全双工语音技术,第一次实现商业规模化落地。 而依托全双工语音技术,豆包的语音交互不再是机械式的一问一答,而是收放�

  • 618“换脑”时刻:用AI的商家,正在突破增长困局

    今年的618备战期,电商圈的气氛有些微妙。商家社群里,讨论“模型跑得怎么样”的声音,正在与“优惠券力度怎么设”并驾齐驱。这种变化的背后,藏着一股巨大的推力——AI。 前几天和淘天行业内部人士交流,几个真实案例让人印象深刻。拿国补热销的电子锁来说,在传统电商思维中,房地产、装修是重点客群,按照商家们经典打法,打标签,投关键词,是稳妥的路径,�

今日大家都在搜的词: