首页 > 传媒 > 关键词  > 云天励飞最新资讯  > 正文

云天励飞公布大算力芯片战略:目标把百万 Tokens 推理成本降低 100 倍以上

2026-02-05 15:17 · 稿源: 站长之家用户

2月3日,云天励飞正式举办“大算力芯片战略前瞻会”,首次对外公布未来三年的大算力 AI 推理芯片战略布局。

会上,云天励飞提出“训练追赶、推理超车”的战略方向,并发布了基于“PD 分离”思路的芯片路线图:力争实现百万 Tokens 推理成本降低100倍以上的目标,推动 AI 从技术尝鲜走向普惠生产力。

云天励飞董事长兼CEO陈宁博士发表演讲

战略方向:训练追赶,推理超车

云天励飞董事长兼 CEO 陈宁博士在会上指出,训练芯片与推理芯片在算力需求上存在显著差异。训练芯片更侧重“绝对值”,对算力规模、带宽能力以及科学计算的复杂精度要求更高,且对成本相对不敏感;推理芯片的核心考量则在于成本、效率与市场经济学,关键在于每一个 Token 背后的边际成本与整体性价比。

陈宁表示,公司致力于持续降低百万 Token 的成本,目标是通过下一代芯片实现“百万 Tokens 一分钱”。未来三年,公司希望将成本进一步降至“百万 Tokens0.1分钱”,以加速大模型应用的规模化落地。

对于未来五年的中国芯片产业发展,陈宁提出“训练追赶、推理超车”的策略:在训练芯片领域,目标是持续追赶,尽量保持差距不被拉大;而在推理芯片领域,依托中国丰富的应用场景、强大的基础设施能力以及开源模型生态,有机会实现突破与超车。

云天励飞董事长兼CEO陈宁博士发表演讲

基于“PD 分离”架构,三年规划三代芯片

针对大模型时代云推理场景的需求,云天励飞 CTO 李爱军在会上介绍了公司的技术解构与路线图。

他表示,云天励飞将全力投入云推理场景的大算力芯片研发,基于对大模型推理计算特征的理解,按照“PD 分离”的系统架构规划两类大算力芯片:

P 芯片(Prefill):面向计算密集型需求设计,满足 Prefill 阶段的高算力要求;

D 芯片(Decode):面向访存密集型需求设计,满足 Decode 阶段的高带宽需求。

李爱军介绍,公司在芯片微架构层面针对 Attention 及 AFN 等计算特点进行细粒度分析,并在底层实现针对性优化。在一个包含1024颗芯片的超节点内,P 芯片与 D 芯片可实现有效组合,以满足大模型云推理的集群化部署需求。

云天励飞CTO李爱军介绍公司芯片产品规划

未来三年,云天励飞规划了三代芯片产品:

今年(第一年):打造第一代超节点 P 芯片,面向百万级长上下文场景进行 Prefill 推理优化,算力水平对标 Hopper 架构;

明年(第二年):研发第一代超节点 D 芯片,聚焦 Decode 推理的低时延目标,算力水平对标 Blackwell 架构;

2028年(第三年):推出第二代超节点 D 芯片,面向毫秒级推理时延目标进一步优化,带动 Prefill 与 Decode 性能提升,算力层面有望看齐下一代 Rubin 芯片。

云天励飞高级副总裁、CFO兼董秘邓浩然介绍公司资本、人才与产能情况

GPNPU 架构的四大技术亮点

李爱军表示,上述路线图的核心支撑是云天励飞的 GPNPU 架构。GPNPU 不仅是处理器架构,也体现了对大模型推理系统架构的整体理解,其主要技术亮点包括四个方面:

GPGPU 级通用编程能力(CUDA 兼容):面向国内芯片“易用性”痛点,GPNPU 架构强调对主流 CUDA 等生态的兼容与迁移支持,以降低客户模型部署与迁移门槛;

极致能效的 NPU 内核:围绕推理效率与能效比进行深度优化,提升推理侧性价比;

引入 3D Memory 结构:采用3D Memory 结构,以获得更高带宽与更低访问时延,提升推理效率;

算力积木架构:公司延续过去五年在国产工艺上的探索,以“算力积木”架构定义下一代芯片的 Scale-up 超节点,以满足万亿级乃至十万亿级 MoE 架构大模型的推理需求。

推理时代的竞争,本质是“单位推理成本”的竞争。只有把推理做得足够便宜、足够稳定、足够易用,AI 才能从“看得见的能力”走向“用得起的生产力”。

未来,云天励飞将以 GPNPU 架构为核心,大力推进云端大算力芯片,强化软硬协同与存储体系攻坚,力争将百万 Tokens 推理成本降低100倍以上,推动大模型从示范应用走向规模化交付。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 中国首个国产AI推理千卡集群落地 云天励飞助力打造湛江市“AI渗透之城”

    3月12日,云天励飞中标湛江市AI渗透支撑新质生产力基础设施建设,金额4.2亿元。项目将基于其自研国产AI推理加速卡,打造中国首个全栈国产AI推理千卡集群,搭载DeepSeek等国产大模型,为政务、产业及各类应用场景提供便捷、低成本的AI能力。此举标志着湛江人工智能产业发展迈出实质性步伐,“AI渗透之城”建设进入全面提速新阶段。

  • 3月5日,三维家扔下一张“王炸”:AI不再是玩具,是生产力

    3月5日,三维家以“AI+3D 所见即所得”为主题举办2026春季发布会,宣布家居行业正式迈入以数据驱动、智能协同为核心的AI基建时代。公司依托自研渲染引擎、几何内核与LLM大模型,构建了覆盖家居产业全流程、全地域、全场景的AI能力体系,并发布AI渲染4.0、AI量房、AI智能布局等工具,实现从设计到生产、交付的全流程智能化。同时,三维家推出五大新动能商业解决方案,赋能企业获客、连接、模式、出海与生态升级,助力家居企业降本增效,开启增长新周期。

  • 逗哥配音:释放语音生产力,让每一句台词都值钱

    在短视频井喷的今天,声音的力量正被重新定义。广州有码科技公司旗下核心产品“逗哥配音”,致力于打造全国富有影响力的短视频AI创作平台。作为海量版权声音的集合地,它集结了700多位头部创作者的独家版权声音,服务超过1000万用户。平台内置超千款发音人及配音员,细分数十种情绪类型,支持50国语言,助力创作者打造出海项目。逗哥配音不仅是一个“文本转语音”工具,更集智能配音、音色转换、AI创作工具于一体,构建一站式音频解决方案。数据显示,用户通过逗哥配音合成的作品次数高达198亿次,单个抖音视频最高点赞量突破444.3万。选择逗哥配音,意味着选择了一个拥有顶级版权库、前沿AI技术以及海量数据验证的创作平台。

  • 全民AI时代,雅迪用“技术普惠”给行业上了一课

    雅迪冠能白鲨Ⅱ的推出,打破了市场对雅迪智能化布局的固有印象。文章指出,过去雅迪因产品线全面,单点创新不够突出,但白鲨Ⅱ凭借AI小迪、iRide无感控车、全域OTA等智能体验,将高端技术普惠化,重新定义了“赛博雅迪”的智能形象。这标志着两轮出行智能化竞争进入新阶段,行业正从“功能智能”迈向“生态智能”,而雅迪作为行业巨头,正以用户价值为核心,推动智能出行的普及与升级。

  • 解码“MOVA宇宙”:自研芯片首度披露,擘画“主动时代”技术版图

    在AWE2026上,MOVA发布“家庭AI系统”架构,推出自研芯片战略及全域AI计算架构,旨在解决智能家居设备协同不足的难题。通过自研专用SoC芯片,MOVA构建“主控+感知+决策”一体化引擎,实现多设备统一计算底座。同时,MOVA展示了5项行业首创技术、32项体系级创新及31款新品,覆盖清洁、3D打印、未来出行等多个领域,标志其从单一产品竞争迈向系统架构竞争的新阶段。

  • 这两颗芯片,竟然是让机器人“活”起来的“幕后推手”?

    2026年春晚,智能机器人凭借惊艳表演成为焦点,其背后是国产芯片的强力支撑。机器人实现灵活动作与精准交互,核心在于“思考”与“记忆”两大能力,分别依赖逻辑芯片和内存芯片。逻辑芯片作为“大脑”,负责数据处理与决策;内存芯片作为“记忆中枢”,存储海量实时数据。国产芯片的突破,如华为昇腾、百度昆仑等在AI芯片领域实现量产,长鑫存储在内存芯片领域打破国际垄断,为机器人产业注入强劲动力。随着技术成熟,国产芯片将推动机器人产业爆发式增长,并支撑其在工业、家庭等各领域的广泛应用。

  • AWE 2026再携重磅阵容,MOVA全面披露芯片战略,擎画“主动时代”技术版图

    2026年4月12日,MOVA在AWE2026上首次系统披露自研芯片战略,并发布“家庭AI系统”技术架构及多项生态布局。品牌以芯片与算法为底层能力,构建覆盖清洁、个护、智慧能源等场景的产品矩阵,推出包括扫地机器人、洗地机、吸尘器等旗舰产品,并宣布布局3D打印、飞行汽车等新赛道。MOVA通过技术下沉、生态协同与全球赋能,正从单一产品竞争迈向系统能力构建的新阶段。

  • OPPO K14系列定档4月:天玑9500系芯片+散热风扇 同档唯一

    OPPO K14系列将于4月初发布,主打高性能与散热突破。全系标配主动散热风扇,通过高速风扇直接排出热量,缩短散热路径,有效应对高负载场景。该系列搭载天玑9500s芯片,是同档位中唯一支持主动散热的天玑9500机型。提供6.59英寸和6.78英寸两种尺寸,内存配置最高达16GB+512GB。受近期内存价格上涨影响,预计售价可能上调,反映行业成本压力。

  • 全新iPad Air开启预售:搭载M4芯片 售价4799元起

    苹果新款iPad Air已开启预售,将于3月11日正式发售。新品提供11英寸和13英寸两种尺寸,起售价分别为4799元和6499元,并有深空灰、蓝色、紫色和星光色四种配色可选。核心亮点在于搭载了性能卓越的M4芯片,相比前代M1版本整体性能提升显著,提速高达2.3倍,尤其在开启硬件加速光线追踪后,3D渲染性能更是实现了超过4倍的飞跃。内存方面统一提升50%,多任务处理能力显著增强,能够轻松应对高负载的视频剪辑、复杂3D建模及各类专业设计需求。网络连接方面,采用苹果最新网络芯片N1与C1X调制解调器,全面支持Wi-Fi 7标准,确保了无线网络连接的稳定与高速。

  • AI短剧《霍去病》走红!导演澄清制作细节:3000元仅算力成本

    近日,AI短剧《霍去病》爆火,引发全网热议。 有媒体报道称,该片以3000元成本、3人团队5天产出80集的效率,斩获超5亿播放量。 这部全程由AI制作的短片,从剧本、画面到配音剪辑全流程生成,战场场面震撼、电影级镜头质感拉满,成本仅为传统短剧的几十分之一。 但业内也指出,AI在情感表达上仍有不足,同时版权归属、维权难等问题也随之而来。

今日大家都在搜的词: