首页 > 业界 > 关键词  > 正文

专为大模型打造!摩尔线程发布智算加速卡MTT S4000:支持48GB显存

2023-12-19 21:14 · 稿源: 快科技

快科技12月19日消息,今天,摩尔线程发布了全新智算加速卡MTT S4000,训推兼顾专为大模型打造,单卡支持48GB显存。

据介绍,MTT S4000采用了第三代MUSA内核,单卡支持48GB显存和768GB/s的显存带宽,FP32性能为25TFLOPs、TF32性能为50TFLOPs、INT8性能为200TFLOPs。

基于摩尔线程自研MTLink1.0技术,MTT S4000还可以支持多卡互联,片间互联可达240GB/s,助力千亿大模型的分布式计算加速。

同时,MTT S4000还提供96路1080P硬件解码,先进的图形渲染能力和超高清8K HDR显示能力,助力AI计算、图形渲染、多媒体等综合应用场景的落地。

最重要的是,通过摩尔线程自研MUSIFY开发工具,MTT S4000计算卡可以充分利用现有CUDA软件生态,实现CUDA代码零成本迁移到MUSA平台。

摩尔线程还同时发布了国内首个以国产全功能GPU为底座的大规模算力集群。

基于MTT S4000和双路8卡GPU服务器MCCX D800,该算力集群支持从单机多卡到多机多卡,从单卡到千卡集群的无缝扩展,未来还将推出更大规模的集群。

举报

  • 相关推荐
  • 摩尔线程新方法优化AI交互:显存节省最多82%

    摩尔线程科研团队近日发布了一项新的研究成果《RoundAttention:以轮次块稀疏性开辟多轮对话优化新范式》,使得端到端延迟低于现在主流的FlashAttention推理引擎,kv-cache显存占用节省最多82%。AI大型语言模型的进步,推动了语言模型服务在日常问题解决任务中的广泛应用。RoundAttention的端到端延迟低于现在主流的FlashAttention推理引擎,kv-cache显存占用则节省55-82%,并且在主观评测和客观评测两个数据集上,模型推理准确率基本未受影响。

  • Steam在线人数突破4000万 《怪物猎人:荒野》贡献不小

    3月2日,根据Steam平台及其相关数据统计机构SteamDB的数据显示,Steam的同时在线用户数再次刷新了历史记录,成功突破了4000万大关。这一里程碑式的成就标志着Steam作为全球领先的游戏分发平台,其影响力和用户基础持续扩大。我们有理由相信,在未来的日子里,Steam将继续引领游戏产业的潮流,为全球玩家带来更多惊喜和欢乐。

  • 30天销售额近4000万,章小蕙“复制”章小蕙

    2023年5月,香港初代名媛@章小蕙在小红书开启了自己的首场直播。整场直播持续近6个小时,涵盖护肤、彩妆、护发等品类,共计超过150个商品,其中三分之一售罄,累计销售额突破5000万元。@章小蕙这样的IP或许难以复制,但@玫瑰是玫瑰的许多运营策略却依然能为行业带来诸多启发和思考。

  • 亚马逊开源5级通用AI Agent:自动查询航班、天气,超4000颗星

    全球云计算巨头亚马逊云开源了5级通用AIAgent框架——Multi-AgentOrchestrator。该框架能通过多层级AIAgent来处理各种复杂任务,将用户的请求找到最适合的Agent来执行,并在整个交互过程中保持上下文的一致性和连贯性。Multi-Agent开源不久,但非常火很快就突破4000颗星。

  • 仅仅2小时:摩尔线程GPU火速支持阿里通义千问QwQ-32B开源模型

    3月6日一早,阿里云正式发布并开源全新推理模型通义千问QwQ-32B”在仅仅2个小时后,摩尔线程就迅速、高效地完成了适配,实现了Day0级支持!基于大语言模型高速推理框架vLLM、MTTransformer推理引擎部署的QwQ-32B,在摩尔线程GPU上的实际运行中,展现出了卓越的推理性能与稳定性,再次印证了摩尔线程MUSA架构的强大生态兼容性。从官方发布的benchmark测试对比图中可以清晰地看到,QwQ-32B在各项测试中成绩显著高于OpenAI-o1-mini、Deepseek的各个蒸馏版本,在LiveBench、BFCL测试中甚至击败了满血版的Deepseek-R1-671B。

  • 拼多多2024年营收近4000亿 增长59% 净利润大涨80%

    快科技3月20日消息,拼多多公布财报,第四季度营收1106.1亿元,同比增长24%;调整后净利润298.5亿元,同比增长17%。2024年全年,拼多多总收入为3938.361亿元人民币,同比增长59%。归属于普通股股东的非GAAP净利润为1223.436亿元人民币,同比2023年的678.993亿元大增80%。过去一年,拼多多的高质量发展战略进入全面深化阶段,超千万的商家在百亿减免”政策下实现提质增效。此外,电�

  • 特斯拉涨超7% 市值大增4000亿元:特朗普8万美金选购特斯拉

    美东时间3月12日,美股市场收盘后,三大指数呈现出涨跌不一的态势,其中大型科技股多数实现了上涨。值得注意的是,特斯拉股价在美国总统特朗普的强势支持下,迅速回升并收涨7.59%,市值一夜之间大增563亿美元。马斯克为了感谢特朗普的支持,当即承诺特斯拉将在两年内将汽车产量翻一番。

  • 小伙开2元面包店最高日入4000元:将继续坚持平价路线

    山东青岛的一位00后小伙刘硕,因其开设的2元面包店备受当地居民关注。这家面包店以其亲民的价格和多样的口味,迅速在当地走红。他也希望能够通过自己的努力,为更多年轻人提供创业的机会和平台。

  • 国产显卡动作神速!摩尔线程全面支持DeepSeek开源周成果

    日前摩尔线程宣布,随着DeepSeek开源周收官,摩尔线程在短时间内,成功实现对DeepSeek各个开源项目的全面支持,涵盖FlashMLA、DeepEP、DeepGEMM、DualPipe以及Fire-Flyer文件系统。摩尔线程表示,这一成果充分验证了MUSA架构和全功能GPU在生态兼容与快速适配方面的强大优势。摩尔线程在一天内完成了高性能分布式文件系统3FS的搭建,并高效开发了存储插件,成功实现与夸娥智算集群的无缝集成,为AI训练、AI推理、科学计算等场景提供全栈存储加速方案。

  • 联发科发布天玑7400、天玑7400X:只有AI提升15%

    联发科今天正式发布了新款移动处理器天玑7400”、天玑7400X”,基本规格和上代天玑7300、天玑7300X相差无几,X版本还是针对折叠屏适配优化。天玑7400系列定位中高端,可提供出色的游戏和AI技术、性能,基本规格参数延续了天玑7300系列:台积电4nm工艺,四个A782.6GHz+四个A552.0GHzCPU核心,Mali-G615MC2GPU核心。搭载天玑7400、天玑7400X的终端将在一季度内上市。