11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
MiniMax M3正式上线,京东云JoyBuilder模型开发平台已第一时间接入MiniMax M3模型并同步开放服务。 依托京东云自研推理框架,JoyBuilder采用了PD分离部署、KV Cache缓存、投机采样等先进推理优化技术,显著提升了模型推理吞吐量与响应效率。 MiniMax M3在编程、智能体等专业任务上达到了前沿水平。其采用全新的MiniMax稀疏注意力架构(MSA),最高支持100万token的超长上下文。作为一款�
慧荣科技推出SM2524XT,专为AI推理和KV Cache密集型负载设计的PCIe Gen5 DRAM-less SSD主控芯片。采用四核处理器、TSMC 6nm制程,连续读取达14GB/s,随机访问性能达250万IOPS,每瓦性能提升25%。该芯片针对高碎片化、低延迟敏感的AI工作负载优化,集成SCA、FTL调度及NANDXtend技术,确保持续负载下稳定性能。
小艺Claw上线30天内完成10余次架构迭代与20余项核心能力交付,成为首个获国家级智库认证的终端厂商Claw类智能体。4月29日重磅更新引入自进化能力,可记忆用户偏好与技能,越用越懂你;同时接入DeepSeek+V4模型,实现百万级超长上下文处理与逻辑推理跃迁。此外,Skills市场不断丰富,涵盖金融、生活、开发等场景,并基于鸿蒙星盾架构确保数据安全。用户无需部署,在HarmonyOS 6及以上设备上打开小艺APP即可预约体验。
2026年3月,谷歌研究院发布TurboQuant压缩算法,旨在解决大模型推理中KV Cache内存占用过高的问题。该技术可压缩KV缓存,实现内存占用降低6倍、推理速度提升8倍的潜力。面对KV Cache随上下文窗口扩大而指数级膨胀的挑战,产业界正从算法压缩与硬件优化两方面寻求突破。作为国内企业级存储方案提供商,忆联创新性地将高效压缩技术融入AI推理场景,打造兼具高性能与成本优势的硬件级KV Cache存储优化方案,为行业破解“内存墙”困局提供新路径。
4月2日,在2026 ODCC春季全会上,超擎数智获授“ODCC AI存储实验室”,标志着AI存储产业迈向标准化、规模化发展的新阶段。该实验室将聚焦AI存储与推理场景的关键技术演进,推动行业标准建设与生态协同发展,为产业高质量发展提供有力支撑。超擎数智凭借在AI应用全栈方案领域的技术积累与实践能力,成为实验室的运营方,未来将联合产业头部力量,共建开放协同生态,加速技术成果转化与标准落地,为AI推理与千行百业应用创新发展提供关键支撑。
2025年中国AI算力产业进入效率驱动新阶段,大模型竞争从参数比拼转向集群稳定性、推理成本与全场景渗透的综合较量。国内通用GPU龙头天数智芯披露年度数据,全年营收103.4亿元,同比增长91.6%,毛利率与营收双提升。其通用GPU产品收入92.3亿元,同比增长149.6%,成为业绩支柱。公司依托全栈自研软件栈,实现新模型、新算子的“Day0”原生支持,并推出面向云边端全面布局的端侧算力产品。天数智芯坚持“量产一代、设计一代、预研一代”的三位一体研发战略,下一代产品正针对大规模训练、新兴大模型推理持续优化,保持技术前瞻性。此次财报亮点不仅标志着企业自身商业里程碑,更向行业传递明确信号:国内通用GPU的竞争已从“有没有”转向“优不优”的能效与生态较量,成为中国AI算力产业自主创新的核心支撑力量。
《诡秘之主》官方卡牌RPG新作《代号:愚者》正式官宣。文章指出,卡牌RPG品类近年虽显沉寂,但其能承载策略玩法与剧情内容,且适配移动端碎片化体验,对拥有庞大世界观的IP而言仍是优选。新作将原著“非凡途径”体系与卡牌职业体系结合,22条途径对应不同职业定位与克制关系,提供清晰养成路径。叙事结构契合卡牌RPG的单元剧模式,能通过独立剧情关卡补全角色故事。祖龙娱乐的研发经验为游戏视觉氛围提供保障。此次合作被视为顶级IP与实力厂商的双向奔赴,有望为卡牌赛道注入新变量。
3月15日,百度智能云联合vLLM社区、红帽共同主办的“vLLM-Kunlun:大模型推理工程化实践分享”Meetup成功举办。活动汇聚9位技术专家,围绕国产芯片与vLLM框架适配,从架构设计、性能优化、生态落地三大维度展开深度分享,全面展现百度智能云在国产大模型推理领域的技术积累与生态布局。百度百舸拥抱开源生态,打造“高性能、易开发、全生态兼容”的国产芯片推理方案。vLLM-Kunlun已完成对Qwen、DeepSeek、GLM等50余款主流大模型的推理适配,为开发者提供高效易用的国产芯片推理支持。多位专家还从编译、算子、框架、量化等维度,系统展示了百度智能云在释放昆仑芯硬件性能上的全栈攻坚成果,并通过实战案例验证了国产芯片在真实业务场景中的可用性。未来,百度百舸将持续深耕国产芯片推理生态,推动国产芯片大模型推理从“可用”走向“好用”。
3月12日,云天励飞中标湛江市AI渗透支撑新质生产力基础设施建设,金额4.2亿元。项目将基于其自研国产AI推理加速卡,打造中国首个全栈国产AI推理千卡集群,搭载DeepSeek等国产大模型,为政务、产业及各类应用场景提供便捷、低成本的AI能力。此举标志着湛江人工智能产业发展迈出实质性步伐,“AI渗透之城”建设进入全面提速新阶段。
云天励飞于2月3日举办“大算力芯片战略前瞻会”,首次公布未来三年大算力+AI推理芯片战略布局。公司提出“训练追赶、推理超车”战略方向,并发布基于“PD分离”思路的芯片路线图,目标将百万Tokens推理成本降低100倍以上,推动AI从技术尝鲜走向普惠生产力。未来三年,云天励飞规划三代芯片产品,聚焦云推理场景,通过P芯片(Prefill)和D芯片(Decode)组合满足大模型集群化部署需求,并依托GPNPU架构提升兼容性、能效与带宽,加速大模型规模化落地。