首页 > 业界 > 关键词  > 高性能计算最新资讯  > 正文

清华团队开源大模型推理引擎“赤兔Chitu”:硬件成本削减50%

2025-03-14 17:27 · 稿源: 快科技

快科技3月14日消息,据报道,清华大学高性能计算研究所翟季冬教授团队与清华系科创企业清程极智联合宣布,开源大模型推理引擎赤兔Chitu”。这一突破性技术为国产AI芯片的广泛应用和生态建设带来了新的机遇。

赤兔Chitu”首次实现在非英伟达Hopper架构GPU及各类国产芯片上原生运行FP8精度模型,解决了FP8精度模型对英伟达Hopper架构(如H100/H200)的硬件依赖。

在A800集群的测试中,赤兔引擎在GPU使用量减少50%的情况下,推理速度提升了3.15倍,显著降低了企业的硬件成本,同时提高了性能输出。

赤兔引擎的智能优化技术能够快速适配不同芯片架构,使国产厂商无需重复开发软件,专注于硬件升级。目前,清程极智已与沐曦、燧原等厂商合作,推出开箱即用”的推理一体机,广泛应用于金融、医疗等行业。

清程极智CEO汤雄超表示,当前国内在推理引擎这一核心环节仍缺乏生产级开源产品。开源赤兔”引擎是推动国内AI生态建设的重要一步,将为行业提供更高效、更灵活的技术支持。

举报

  • 相关推荐
  • 小米自动驾驶模型Xiaomi OneVL开源:业内率先统一VLA、世界模型路线

    今日,小米正式发布并开源Xiaomi OneVL自动驾驶模型。 该模型在业内率先实现VLA、世界模型、潜空间推理等多个技术路线的统一,在具备XLA模型强悍推理能力的基础上,大幅提升了推理的速度和精度,是行业内具备开创性的方案。 其在精度上超越显式CoT、在速度上对齐仅答案”预测的潜空间CoT方案。过去,VLA和世界模型是自动驾驶领域两条相对独立的技术路线:VLA专注于理解�

  • 小米自研AI大模型!Xiaomi MiMo再次登顶全球第一

    小米官方今天发文宣布,小米技术官方宣布,在OpenRouter平台最新数据中,Hermes Agent登顶全球调用量榜首,日Token调用量达2910亿,周调用量超1.75万亿。 小米自研MiMo模型成为第一大贡献模型,近一个月累计贡献1.45万亿Token调用量。

  • 智算新纪,引航未来 国产AI智算生态创新突破(北京)交流会圆满举办

    2026年5月9日,国产AI智算生态创新突破交流会在北京举办,聚焦国产智算自主创新与场景落地。大会响应国家算力基础设施建设号召,汇聚政府、科研院所、企业等600余位代表,共同探讨技术突破与生态协同。会上成立AGC生态共同体,发布AGC系列智算产品,包括AGC-64F、AGC-64L等,旨在解决国产GPU通信瓶颈与算力损耗问题,推动国产智算从“可用”向“好用、普惠”迈进,助力数字中国建设。

  • 普渡机器人正式发布具身智能大模型PuduFM 1.0

    2026年5月11日,普渡机器人发布具身智能大模型PuduFM1.0,构建三维空间深度感知、物理状态预测和持续进化学习三大技术维度,实现从“简单执行”向“物理认知”的跨越。该模型通过分层架构和虚实双数据闭环,解决行业在协作、操作和异构数据复用上的困境,支持超长程任务和异构机器统一运行,推动具身智能规模化落地。

  • 告别价格战,大模型共迎通胀时代

    眼下,涨价成为大模型的关键词。 迈入2026年,大模型不再是优惠缩水,而是毫不掩饰地开启了涨价模式,大大小小的厂商纷纷入局,智普甚至在短短三个月之内两次提价。 以至于,国产大模型定价首次与海外头部厂商对齐。 大模型涨价,是昙花一现还是旷日持久?降价争夺市场的打法,是否走到了尽头?价值战会成为未来竞争的核心叙事吗?

  • 百度文心大模型5.1正式发布

    百度正式发布了新一代基础大模型——文心大模型5.1。该模型采用了自主研发的“多维弹性预训练”技术,仅以业界同规模模型约6%的预训练成本,便达到了基础效果领先的水平,并登上LMArena搜索榜国内第一的位置。 在多项行业权威基准测试中,文心5.1在智能体、知识理解、逻辑推理以及深度搜索等核心能力上表现突出。其中,智能体能力提升显著,已超越DeepSeek-V4-Pro;创意�

  • 北京亦庄设立大模型生态服务站 助力AI产业合规发展

    2026年4月,经北京市网信办认定,亦庄模数世界大模型生态服务站正式成立,为企业提供公益大模型备案辅导、产业生态对接等一站式服务。该站由市网信办授权、经开区信息技术产业局指导、北京国际算力服务公司运营,采用“1对1精准陪跑+集中培训”模式,可将备案周期压缩50%以上,解决企业合规认知不足等行业痛点。同时,经开区对完成备案的优质大模型企业给予100万元专项奖励及1亿元算力、模型、数据券等支持,常态化开展合规培训与产业对接,助力北京经开区加快构建全域人工智能之城。

  • 改写语音交互行规,豆包大模型更稳了

    豆包大模型,又上新了。 2026年4月9日,原生全双工语音大模型Seeduplex正式发布,相比上一代半双工豆包端到端语音模型,新模型基于“边听边说”的全新框架设计,交互体验的自然感、顺畅度大幅提升,目前已在豆包App全量上线。 这意味着,前沿的全双工语音技术,第一次实现商业规模化落地。 而依托全双工语音技术,豆包的语音交互不再是机械式的一问一答,而是收放�

  • 模型即审美:生图模型们正建起自己的“视觉方言”

    ​最近在测试各种AI生图模型的时候,我们发现了一个现象:同样一个提示词,丢给不同的模型,出来的图片风格差异大到像是出自不同摄影流派。 Image-2生成的图就像我昨天随手拍的,但Nano Banana生成的图感觉像某个家居品牌的广告大片。有些模型执着于捕捉现实的每一丝瑕疵,有些则痴迷于把日常场景变成精致的艺术品。这背后反映的不是能力差别,而是每个模型对"什么

  • 2026年分解技术横评:新房专用除甲醛高性能空气净化器

    新房装修甲醛超标困扰业主,释放周期长达3-15年且难以清除。文章以“分解技术”为核心,依据国标筛选8款除醛空气净化器,通过标准化参数测试、业主实测及成本核算,打造权威选购指南。核心结论:优先选择高甲醛CADR值+主动分解技术+低长期使用成本的机型,如斯帝沃A9升级款(四重分解技术、5年0耗材、母婴安全),避免仅依赖活性炭吸附的“伪除醛”产品。

今日大家都在搜的词: