清华团队开源大模型推理引擎“赤兔Chitu”：硬件成本削减50%

2025-03-14 17:27 · 稿源：快科技

快科技3月14日消息，据报道，清华大学高性能计算研究所翟季冬教授团队与清华系科创企业清程极智联合宣布，开源大模型推理引擎赤兔Chitu”。这一突破性技术为国产AI芯片的广泛应用和生态建设带来了新的机遇。

赤兔Chitu”首次实现在非英伟达Hopper架构GPU及各类国产芯片上原生运行FP8精度模型，解决了FP8精度模型对英伟达Hopper架构（如H100/H200）的硬件依赖。

在A800集群的测试中，赤兔引擎在GPU使用量减少50%的情况下，推理速度提升了3.15倍，显著降低了企业的硬件成本，同时提高了性能输出。

赤兔引擎的智能优化技术能够快速适配不同芯片架构，使国产厂商无需重复开发软件，专注于硬件升级。目前，清程极智已与沐曦、燧原等厂商合作，推出开箱即用”的推理一体机，广泛应用于金融、医疗等行业。

清程极智CEO汤雄超表示，当前国内在推理引擎这一核心环节仍缺乏生产级开源产品。开源赤兔”引擎是推动国内AI生态建设的重要一步，将为行业提供更高效、更灵活的技术支持。

（举报）

相关推荐

关键词：

荐AI日报：阿里云开源通义DeepResearch；夸克推医师考试大模型；迪士尼将起诉MiniMax

本期AI日报聚焦多项前沿动态：阿里云开源轻量级AI代理DeepResearch，性能媲美OpenAI；夸克推出国内首个全阶段医师考试大模型测试集；微软Copilot将上线类ChatGPT记忆管理功能；迪士尼等巨头起诉MiniMax侵犯版权；OpenAI提升ChatGPT搜索准确性；Notion推出个性化AI助手；谷歌发布更小巧高效的时间序列预测模型TimesFM-2.5；Figma推出AI设计功能简化创作流程。整体展现AI技术在开源、医疗、版权、开发工具等领域的快速演进与应用创新。

AI 开源轻量级
美团也开源了大模型，但我觉得他们的野心是通用生活Agent。

也有线上体验地址:https://longcat.ai 我自己去体验了一下，整体模型能力，中规中矩，但是快，是真的快，能把560B的模型，在推理的时候搞得这么快，是真的有点牛逼的。我直接录了个屏给大家看一下。这里我们可以直观对比一下LongCat和DeepSeek V3的输出速度，他俩都是MoE架构，而且总参数量差不太多。为了更公平的竞争，用了同一个问题，并关闭了联网搜索来避免搜索干扰�

美团 AI模型开源
荐AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃发布语音大模型Step-Audio 2 mini

AI日报栏目每日更新AI领域热点内容，聚焦开发者需求。本期重点包括：阶跃星辰发布端到端语音大模型Step-Audio2 mini，在多项基准测试中表现优异；9月1日起AI生成内容需强制标识；美团推出开源大模型LongCat；上海AI实验室发布多模态大模型InternVL3.5；腾讯ARC团队推出音频生成模型AudioStory；OpenAI发布实时语音模型GPT-realtime；Meta与UCSD合作推出DeepConf技术；xAI代码库遭窃事件；阿里巴巴Qwen团队发布GUI自动化框架；微软推出Copilot Labs实验中心；小红书自动化工具xiaohongshu-mcp上线。

AI 语音大模型 Step-Audio2mini
小度发布多模态智能摄像机，AI大模型重塑家庭看护体验

小度科技推出首款多模态智能摄像机C800，搭载800万像素4K超清摄像头，支持AI大模型技术。该产品不仅能实现高清监控，还具备智能行为识别、语音交互等功能，可自定义看护提醒。结合视觉与语音交互，支持复杂语义查询和家庭设备联动，扩展智能家居应用场景。目前产品已全网发售，年底还将推出三摄版本，持续探索AI硬件创新。

AI大模型智能硬件小度科技
直击企业AI安全痛点，百度智能云发布《千帆大模型平台安全白皮书》为大模型落地护航

百度智能云千帆大模型平台4.0发布《千帆大模型平台安全白皮书》，系统阐述企业级AI安全框架。白皮书聚焦平台安全、模型安全、数据安全、内容合规等六大维度，提出覆盖全生命周期的防护方案，包括混合云部署、数据加密传输、模型防窃取及内容过滤机制，助力企业安全使用大模型技术，推动AI在合规可信环境下赋能业务创新。

大模型平台企业级安全数据安全
荐AI日报：快手推出AI视频制作助手Kwali；字节跳动推出USO模型；OpenAI推出ChatGPT开发者模式

本文介绍了AI日报栏目，聚焦AI领域最新动态。快手推出Kwali视频助手，简化视频制作流程；字节跳动发布USO模型，解决图像生成中风格与主题的矛盾；微软推出Copilot Audio音频模式，提供个性化语音交互；Stability AI升级Stable Audio 2.5，支持高质量音频生成；阿联酋推出开源大模型K2 Think，拥有320亿参数；微信上线智能回复功能，提升公众号运营效率；OpenAI推出ChatGPT开发者模式，支持AI控制外部工具；字节跳动Seed团队发布AgentGym-RL框架，提升语言模型决策能力；月之暗面开源Checkpoint Engine中间件，优化LLM推理效率；B站开源IndexTTS-2.0文本转语音系统，支持情感与时长控制；Replit推出Agent 3编程助手，自主性提升10倍。

AI视频制作快手Kwali 多Agent框架
腾讯全面适配主流国产芯片提供超高性价比AI算力

9月16日，2025腾讯全球数字生态大会在深圳举行。会上腾讯全面开放AI落地能力，发布多项AI技术产品升级，包括混元3D模型、智能体开发平台ADP3.0等，并宣布腾讯云智能体战略全景图。数据显示，腾讯ToB营收实现双位数增长达555亿元，海外客户规模同比翻番。腾讯将通过“智能化”与“全球化”双引擎，助力企业提升效率与增长，推动AI在千行百业加速落地。

腾讯全球数字生态大会 AI技术腾讯云智能体
荐AI日报：小红书发布对话合成模型 FireRedTTS-2；百度文心新模型登顶Hugging Face榜首；xAI将裁员500人

AI日报今日聚焦七大热点：小红书发布FireRedTTS-2语音合成模型，显著提升自然度；百度文心ERNIE-4.5登顶Hugging Face榜单；谷歌Gemini应用登顶美国免费榜；马斯克xAI裁员500人并战略转型；OpenAI拟大幅降低与微软分成比例；DeepMCPAgent开源框架提升AI代理生产力；蚂蚁发布AI开源全景图2.0；北京1400多所中小学推行人工智能通识课程。

AI 对话合成模型小红书
苹果Apple Watch高血压通知功能上线

苹果公司宣布将在全球150多个市场推出Apple Watch高血压通知功能，该功能将随watchOS 26和iOS 26系统更新正式推送。目前英国、法国、德国等地区用户已可体验，但加拿大等部分市场尚未开放，中国大陆地区仍需等待监管审批。该功能依托光学心率传感器，可实时监测用户血管对心跳的反应，识别慢性高血压迹象，并在检测到异常时发出提醒。系统会分析用户最近30天的数据，通过先进算法判断是否需要发出通知。

苹果 Apple Watch
全球第一！腾讯混元翻译模型Hunyuan-MT-7B登顶开源热榜

腾讯混元翻译模型Hunyuan-MT-7B登顶Hugging Face趋势榜首位，并在ACL WMT2025比赛中以30项第一的成绩领先。该模型支持33种语言，包括5种汉语言方言互译，在Flores200评测中表现卓越，超越同尺寸模型，与超大模型效果相当。腾讯提出完整训练范式，覆盖预训练到强化学习全链条，实现业界最优翻译效果。

腾讯混元 Hunyuan-MT-7B 翻译模型

今日大家都在搜的词：

热文

3 天
7天

清华团队开源大模型推理引擎“赤兔Chitu”：硬件成本削减50%

荐AI日报：阿里云开源通义DeepResearch；夸克推医师考试大模型；迪士尼将起诉MiniMax

美团也开源了大模型，但我觉得他们的野心是通用生活Agent。

荐AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃发布语音大模型Step-Audio 2 mini

小度发布多模态智能摄像机，AI大模型重塑家庭看护体验

直击企业AI安全痛点，百度智能云发布《千帆大模型平台安全白皮书》为大模型落地护航

荐AI日报：快手推出AI视频制作助手Kwali；字节跳动推出USO模型；OpenAI推出ChatGPT开发者模式

腾讯全面适配主流国产芯片提供超高性价比AI算力

荐AI日报：小红书发布对话合成模型 FireRedTTS-2；百度文心新模型登顶Hugging Face榜首；xAI将裁员500人

苹果Apple Watch高血压通知功能上线

全球第一！腾讯混元翻译模型Hunyuan-MT-7B登顶开源热榜

今日大家都在搜的词：

热文

小米17 Pro系列外观公布：搭载“妙享背屏”

理想i6定档9月26日上市：官方定义新形态五座SUV

AI日报：腾讯发布混元3D 3.0模型；昆仑万维上线Agent Studio功

谣言！王腾并非因泄密小米16改名小米17遭辞退

苹果回应iOS 26掉电快：正常现象几天内恢复

联发科天玑9500定档9月22日发布：安兔兔跑分破400万

抖音副总裁回应字节离职赛道：虚假宣传企图引流卖课

苹果Apple Watch高血压通知功能上线

AI日报：阿里云开源通义DeepResearch；夸克推医师考试大模型；

卢伟冰：9月19日将直播在线解答小米17系列17个问题

上市没几天iPhone 17已跌破发售价部分机型降幅高达千元

小米17 Pro Max官宣雷军：全面对标iPhone 正面迎战

小米16改名小米17 本月发布：现已上架开启预约

小米17 Pro系列外观公布：搭载“妙享背屏”

AI日报：小红书发布对话合成模型 FireRedTTS-2；百度文心新模型

小米手机官博头像上热搜：泄密17 Pro系列或配备背屏

小米17官宣本月发布卢伟冰称有信心直面iPhone17

尚界H5小订突破10万台预售16.98万起

魅族22今日发布：小屏影像旗舰、行业唯一白面板

西贝致歉上热搜：启动全国门店透明化改造

站长商机