首页 > AI头条  > 正文

摩尔线程 MUSA 架构强势适配 llama.cpp,助力 AI 推理新纪元!

2025-08-07 17:46 · 来源: AIbase基地

在全球人工智能技术飞速发展的今天,摩尔线程(Moore Threads)又有了新的突破!其自主研发的通用并行计算架构 MUSA(Meta-computing Unified System Architecture)日前宣布,成功适配了开源推理框架 llama.cpp。这一成就不仅展示了摩尔线程在 AI 生态系统中的进一步布局,也为广大开发者提供了更为高效的推理工具。


llama.cpp 是一个以纯 C/C++ 实现的大语言模型推理框架,以其轻量化的部署方式和跨硬件的兼容性备受瞩目。它不仅支持流行的 LLaMA 和 Mistral 等模型,还能够应用于多种多模态场景。这次适配意味着用户可以在摩尔线程的 MTT S80、S3000 和 S4000 系列 GPU 上,通过官方容器镜像高效地进行 AI 推理工作,极大提升了用户体验。


值得一提的是,今年 4 月,MUSA SDK 4.0.1 已经扩展到了 Intel 处理器以及国产海光平台,这次与 llama.cpp 的联动,更是为开发者们降低了部署大模型的门槛。开发者们只需简单配置,就能在本土 AI 硬件上轻松运行各种复杂的推理任务,为整个国内 AI 硬件生态注入了新的活力。


随着 AI 技术的不断演进,摩尔线程正以其创新的技术实力不断推动行业前行,进一步加速了 AI 推理框架的普及与应用。可以预见,未来在摩尔线程的推动下,AI 将会在各个领域展现出更加广泛的应用潜力,为用户带来更多的便利与可能。


  • 相关推荐
  • 强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

    2025年9月29日,深度求索公司发布新一代模型架构DeepSeek-V3.2,引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本,在V3.1-Terminus基础上引入稀疏注意力机制,优化长文本训练和推理效率。目前官方应用端已同步更新,API大幅降价。此次模型体积达671GB,下载需8-10小时。业内专家指出,此次快速适配表明双方早有深度技术协�

  • 技嘉2025发布会:“从心出发 我们的主张”,迈向AI新纪元

    技嘉今日举办“从心出发,我们的主张”主题产品发布会,聚焦PC硬件领域,围绕用户需求发布全新主板、整机及软件工具。发布会展示了技嘉在极限性能、美学设计、AI算力及装机体验等方面的技术实力,推出多款支持AMD和Intel平台的主板产品,并重点演示了液氮超频、D5黑科技2.0内存优化及AI算力全家桶等创新技术。通过软硬件协同与用户体验优化,技嘉传递了“始于需求,�

  • ChatExcel重磅发布:基于AMD锐龙AI MAX+ 395处理器的数据分析Mini AI 工作站

    ChatExcel发布搭载AMD锐龙AI MAX+395处理器的Mini AI工作站,重构数据全链路,打造“找数-做数-分析数-看数-用数”的商业闭环平台。依托处理器96GB超大显存和统一内存架构,实现本地流畅运行GPT-oss-120B等大型模型,保障数据安全的同时显著提升分析效率。该方案以财务场景为例,支持多任务并行处理,将原本需1天完成的月度报表压缩至2小时,解决“数据不外发”与“高效处理”的核心矛盾。

  • 小米汽车:苹果授权Apple Music安卓版将陆续推送

    小米汽车高度重视苹果生态支持,调研发现SU7车主中超半数为苹果用户。针对苹果用户用车痛点,小米与苹果深度合作,通过系统级整合实现账号永久同步和无缝音乐续播,并特别适配授权版Apple Music安卓应用,提供无损音质体验。目前相关更新已通过OTA向全系车型推送,显著提升苹果用户的用车便捷性和音乐品质。

  • 锐舞电动牙刷重塑口腔护理行业格局,开启气泡净齿新纪元

    2025年中国电动牙刷市场迎来爆发式增长,渗透率显著提升。全球市场持续扩张,预计未来数年保持可观复合增长率。行业经历调整期后,技术驱动二次增长,锐舞推出颠覆性气泡电动牙刷2.0,突破传统物理摩擦局限,通过超能气泡技术实现高效清洁与极致护龈双重突破。产品配备三款专业刷头,满足多样化需求,并引入全新交互系统与时尚设计。中国品牌崛起重塑全球市场格局,技术普惠与高端创新并存。锐舞凭借自主创新实现从追随者到引领者的跨越,展现中国智造实力。

  • 云天励飞“算力积木”联手OISA,突破万亿级MoE大模型推理集群的Scale up瓶颈

    云天励飞近日加入OISA生态,携手产业伙伴共建国产AI芯片互联体系,为中国算力生态注入新动力。OISA是中国移动提出的开放互联标准体系,旨在打造全向、对等、智能的互联新范式,解决智算集群内存互访难题,为大规模并行计算提供技术基石。云天励飞凭借在AI芯片与算力架构的长期积累,将依托“算力积木”架构的模块化优势,在大规模推理集群中实现高效互联,助力突破万级MoE大模型推理瓶颈,推动国产算力生态发展。

  • 美团发布高效推理模型LongCat-Flash-Thinking:部分性能接近GPT5

    9月23日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时,性能更强大、更专业,在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力,扩展了形式化定理证明能力,成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出,多项基准测试成绩领先开源及闭源顶尖模型,已在HuggingFace、Github全面开源。

  • AI日报:美团发布推理大模型LongCat-Flash-Thinking;阿里Wan-Animate开源;字节推豆包翻译大模型

    AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking;阿里开源Wan-Animate模型革新AI视频生成;字节跳动发布豆包翻译模型,支持28种语言互译;华为与浙大联合推出安全大模型DeepSeek-R1-Safe;阿里云即将发布跨模态模型Qwen3-Omni;xAI推出计算成本降低98%的Grok4Fast模型;YouTube发布多项AI创作辅助功能;IBM推出轻量级文档处理模型Granite-Docling-258M;中科院发布类脑大模型SpikingBrain实现百倍速度突破;OpenAI将推出仅限Pro用户的计算密集型新功能。

  • AI日报:豆包大模型1.6-vision发布;DeepSeek发布V3.2-exp模型;Claude Sonnet4.5发布

    本期AI日报聚焦多项技术突破:DeepSeek发布V3.2-exp模型,通过稀疏注意力机制降低API成本50%;Anthropic推出Claude Sonnet 4.5,在编码任务表现卓越;ChatGPT新增即时结账功能,实现对话界面直接购物;OpenAI将推出AI版TikTok,所有内容由Sora2模型生成;百度地图升级小度想想2.0,提供智能出行服务;蚂蚁集团开源万亿参数模型Ring-1T-preview;DeepMind提出“帧链”概念,推动视频模型实现全面�

  • DNS.COM重磅发布全球化基础设施安全服务战略 开创❝一站式安全❞基础设施新纪元

    知名网络基础设施服务商DNS.COM今日宣布战略调整,定位升级为“全球化一站式基础设施安全服务商”。此次转型标志着公司从传统DNS服务向综合性安全服务迈进,创新提出“一站式安全”架构,将安全能力深度融入DNS解析、云计算等基础设施层面。新战略以智能DNS解析、全球安全节点部署、专业服务保障为三大支柱,通过AI驱动技术提升威胁防护能力,最高支持6T级DDoS防护。公司计划2026年前在全球部署超100个安全节点,助力企业降低安全管理成本,推动行业向主动安全治理演进。这一调整有望为数字化转型中的企业提供更高效、全面的安全解决方案。

今日大家都在搜的词: