大型推理模型

云天励飞近日加入OISA生态，携手产业伙伴共建国产AI芯片互联体系，为中国算力生态注入新动力。OISA是中国移动提出的开放互联标准体系，旨在打造全向、对等、智能的互联新范式，解决智算集群内存互访难题，为大规模并行计算提供技术基石。云天励飞凭借在AI芯片与算力架构的长期积累，将依托“算力积木”架构的模块化优势，在大规模推理集群中实现高效互联，助力突破万级MoE大模型推理瓶颈，推动国产算力生态发展。...

特别声明：本页面标签名称与页面内容，系网站系统为资讯内容分类自动生成，仅提供资讯内容索引使用，旨在方便用户索引相关资讯报道。如标签名称涉及商标信息，请访问商标品牌官方了解详情，请勿以本站标签页面内容为参考信息，本站与可能出现的商标名称信息不存在任何关联关系，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述反馈文件后，将会依法依规核实信息，第一时间沟通删除相关内容或断开相关链接。

与“大型推理模型”的相关热搜词：

相关“大型推理模型” 的资讯10篇

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
云天励飞“算力积木”联手OISA，突破万亿级MoE大模型推理集群的Scale up瓶颈

云天励飞近日加入OISA生态，携手产业伙伴共建国产AI芯片互联体系，为中国算力生态注入新动力。OISA是中国移动提出的开放互联标准体系，旨在打造全向、对等、智能的互联新范式，解决智算集群内存互访难题，为大规模并行计算提供技术基石。云天励飞凭借在AI芯片与算力架构的长期积累，将依托“算力积木”架构的模块化优势，在大规模推理集群中实现高效互联，助力突破万级MoE大模型推理瓶颈，推动国产算力生态发展。

云天励飞 OISA生态 AI芯片互联
美团发布高效推理模型LongCat-Flash-Thinking：部分性能接近GPT5

9月23日，美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时，性能更强大、更专业，在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平（SOTA），部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力，扩展了形式化定理证明能力，成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出，多项基准测试成绩领先开源及闭源顶尖模型，已在HuggingFace、Github全面开源。

高效推理模型 LongCat-Flash-Thinking 开源模型
荐 AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-Animate开源；字节推豆包翻译大模型

AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking；阿里开源Wan-Animate模型革新AI视频生成；字节跳动发布豆包翻译模型，支持28种语言互译；华为与浙大联合推出安全大模型DeepSeek-R1-Safe；阿里云即将发布跨模态模型Qwen3-Omni；xAI推出计算成本降低98%的Grok4Fast模型；YouTube发布多项AI创作辅助功能；IBM推出轻量级文档处理模型Granite-Docling-258M；中科院发布类脑大模型SpikingBrain实现百倍速度突破；OpenAI将推出仅限Pro用户的计算密集型新功能。

AI日报美团大模型 LongCat-Flash-Thinking
昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

中国科学技术大学张燕咏团队在昇腾算力支持下，成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略，有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题，显著提升推理性能。实验显示，该方案在多项指标上较主流方案提升超30%，为昇腾技术优化MoE模型推理提供了宝贵借鉴，将加速其在各领域的落地应用。

人工智能大模型 MoE稀疏大模型
荐 AI日报：智谱视觉推理模型GLM-4.5V开源；达摩院开源三项具身智能核心技术；360智脑推出Light-IF系列模型

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱GLM-4.5V开源发布:全球100B级最佳视觉推理模型智谱宣布推出并开源了全球100B级效果最佳的开源视觉推理模型GLM-4.5V，这是该公司在通向通用人工智能（AGI）道路上的又一重要探
荐 AI日报：混元推四款小尺寸开源模型；昆仑万维发布新推理大模型MindLink；谷歌Gemini 2.5 Deep Think发布

【AI日报】汇总了最新AI领域动态：1)腾讯开源混元系列小尺寸模型，适用于消费级显卡；2)昆仑万维发布推理大模型MindLink，提升回答透明度；3)B站推出AI原声翻译功能，保留UP主音色；4)谷歌Gemini 2.5在数学奥赛夺金，展现强大推理能力；5)OpenAI展示GPT-5网络信息整合特性；6)苹果组建AI团队挑战ChatGPT；7)高德地图推出全球首个AI原生地图应用；8)Adobe推出AI图像合成工具Harmonize；9)NVIDIA发布革命性视频渲染技术；10)谷歌推出Android Studio免费AI编程助手；11)开源结构化信息提取工具LangExtract；12)Figma开发者模式升级提升设计转代码效率。

人工智能开源模型腾讯混元
北大张牧涵团队依托昇腾突破推理效率瓶颈大模型推理百万tokens 成本仅 1 元

北京大学张牧涵团队在昇腾算力支持下，研发出一套高效大模型训练推理架构，实现百万tokens输入成本低至1元。该成果包含三项关键技术：1）通过分离注意力头中的位置与非位置信息，仅用3%位置信息即可维持模型性能；2）采用联合KV低秩压缩方法，仅保留12.5%的KV Cache；3）基于昇腾硬件并行计算能力，实现Recurrent Decoding技术提升训练数据利用率。该架构显著降低AI大模型应用成本，验证了昇腾算力平台支撑尖端科研的实力。

大语言模型算力支持高效训练
模型推理协作正式开启，魔乐社区让模型跑遍“中国芯”

魔乐社区启动"模型推理适配协作计划"，旨在解决国产算力平台与大模型间的适配难题。该计划通过开源协作模式，联合开发者、芯片厂商等生态伙伴，构建从工具链到知识库的全栈支持体系，打造适配成果共享平台。重点支持开源大模型在国产硬件及多样化推理引擎上的高效运行，提供模型转换工具和优化指南，降低开发门槛。目前已有文心大模型4.5等首批适配成果�

人工智能大模型国产算力平台
有道14B低成本轻量模型“子曰3”开源，数学推理性能超越大模型

网易有道6月23日开源国内首个专注数学教育的"子诳3"大模型系列数学模型(Confucius3-Math)。该模型在单块消费级GPU上高效运行，在多项数学推理任务中性能超越更大规模的通用模型，高考数学题测试得分达98.5分。其训练成本仅2.6万美元，推理性能是DeepSeek+R1的15倍，服务成本低至每百万token0.15美元，大幅降低教育AI应用门槛。该开源模型为教育公平提供低成本、高性能的AI�

子曰3 开源大模型数学教育
荐 MiniMax深夜开源首个推理模型M1，这次是真的卷到DeepSeek了。

不知道还有多少人记得，AI行业的六小虎。行业内都在说，他们已经寂静好久了。上一次相关的项目发布，还是前一段时间我写的MiniMax声音模型的更新，Speech-02。而昨晚凌晨将近12点的时候，又是MiniMax，居然在X上，预告了他们一整周的发布计划。

AI行业 MiniMax推理模型声音模型更新

热文

3 天
7天

大型推理模型

与“大型推理模型”的相关热搜词：

相关“大型推理模型” 的资讯10篇

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

云天励飞“算力积木”联手OISA，突破万亿级MoE大模型推理集群的Scale up瓶颈

美团发布高效推理模型LongCat-Flash-Thinking：部分性能接近GPT5

荐 AI日报：美团发布推理大模型LongCat-Flash-Thinking；阿里Wan-Animate开源；字节推豆包翻译大模型

昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

荐 AI日报：智谱视觉推理模型GLM-4.5V开源；达摩院开源三项具身智能核心技术；360智脑推出Light-IF系列模型

荐 AI日报：混元推四款小尺寸开源模型；昆仑万维发布新推理大模型MindLink；谷歌Gemini 2.5 Deep Think发布

北大张牧涵团队依托昇腾突破推理效率瓶颈大模型推理百万tokens 成本仅 1 元

模型推理协作正式开启，魔乐社区让模型跑遍“中国芯”

有道14B低成本轻量模型“子曰3”开源，数学推理性能超越大模型

荐 MiniMax深夜开源首个推理模型M1，这次是真的卷到DeepSeek了。

热文

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能

荣耀500系列开启预约：Pro版外观首次亮相

微信小程序将在iOS端支持接入虚拟支付苹果抽成15%

iPhone Pocket正式开售：联名三宅一生售价1299元起

1899元苹果手机包卖完了！iPhone Pocket在吐槽声中销售火爆

苹果回应输入法宁死不屈：具备记忆功能与学习机制

AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

雷军回应小米双11战绩：谢谢大家支持

卢伟冰：小米手机双11连续三年国产销量第一

AI日报：广电整治AI动画乱象；360发布大模型安全白皮书；百度推

OPPO Reno15系列定档11月17日发布

AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.

腾讯回应QQ群最早是为了员工约饭：是一个朴实无华的需求

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

站长商机