首页 > AI头条  > 正文

​蚂蚁集团开源全球首个万亿参数大模型 Ring-1T-preview,代码生成能力超越 GPT-5

2025-09-30 11:44 · 来源: AIbase基地

近日,蚂蚁集团宣布开源其自研的万亿参数推理大模型 Ring-1T-preview,这一模型成为全球首个开源的万亿参数推理大模型。虽然目前仅为预览版,Ring-1T-preview 在自然语言推理方面表现出色,多个测试的结果显示其能力令人瞩目。

image.png

根据官方消息,Ring-1T-preview 在 AIME25测试中获得了92.6分,超越了所有已知的开源模型,包括 Gemini2.5Pro,接近 GPT-5的94.6分。在 CodeForces 测试中,Ring-1T-preview 以94.69分的高分展现出强大的代码生成能力,领先于 GPT-5。这一成绩也使得它在 LiveCodeBench 及 ARC-AGI-v1等权威榜单中名列开源模型之首。

蚂蚁百灵团队还对 Ring-1T-preview 进行了国际奥林匹克数学竞赛(IMO25)的推理能力测试。测试结果显示,该模型能够一次性正确解答第三题,并在一、二、四、五题中推理出部分正确答案。这表明 Ring-1T-preview 在复杂推理任务中同样表现不俗。

目前,蚂蚁百灵团队正在对 Ling2.0家族1T 语言基座进行后训练,旨在进一步挖掘这一万亿参数模型在自然语言推理方面的潜力。与此同时,Ring-1T 的正式版也在积极训练中,预计将于未来发布。

这一新进展标志着人工智能领域的一次重要突破,尤其是在开源模型的发展方面。通过开放源代码,蚂蚁集团希望为 AI 技术的研究和应用提供更多可能性,推动行业的共同进步。

划重点:  

🌟 蚂蚁集团推出了全球首个开源的万亿参数推理大模型 Ring-1T-preview。  

🚀 Ring-1T-preview 在多项测试中表现优异,超越了多个已知开源模型,接近 GPT-5。  

🧠 团队正在对模型进行后续训练,以最大程度挖掘其自然语言推理能力。

  • 相关推荐
  • 云栖大会智舱黑科技:全球首个全模态端侧大模型解决方案,斑马智行首发

    9月24日,2025云栖大会在杭州开幕,主题为“云智一体·碳硅共生”,汇聚全球50多国2000余位嘉宾探讨AI、云计算与产业应用趋势。阿里云发布7款通义大模型,其中Qwen3-Omni作为行业首个端到端全模态AI大模型,在36项基准测试中实现22项SOTA,性能全面突破。大会聚焦多模态技术,斑马智行宣布率先接入Qwen3-Omni,并与阿里云、高通联合推出端到端全模态端侧大模型方案Auto+Omni,具备主动智能、断网可用、隐私无忧三大特点,推动汽车智能座舱从指令交互向Always-on主动服务升级。首批搭载方案车型将于2026年量产,标志着汽车智能化迈入“自主行动”新阶段。大会将持续至26日,预计更多创新技术将亮相。

  • AI日报:蚂蚁开源高性能思考模型Ring-flash-2.0;通义7款模型屠榜Hugging Face;Veo3视觉能力升级

    蚂蚁百灵团队开源高性能思考模型Ring-flash-2.0,在多项基准测试中表现优异;阿里通义7款模型登顶Hugging Face榜单,Qwen3-Omni凭借多模态能力全球第一。谷歌Veo3突破视频生成局限,可自动完成视觉任务;特斯拉推进人形机器人量产,马斯克称其为最重要产品。马斯克第六次起诉OpenAI窃取商业机密,苹果内部测试聊天机器人Veritas优化Siri,YouTube推出AI音乐主播增强互动,LiquidAI发布轻量级模型Liquid Nanos优化边缘计算。

  • 统一全球保鲜标准后,海尔又制定全球首个冰箱声音舒适度标准

    海尔冰箱连续17年全球销量第一,持续引领行业标准创新。针对用户对家居静音需求提升,海尔牵头制定全球首个《家用冰箱声音舒适度评价方法》,从分贝数值竞争升级至听觉体验优化。其首创多维声屏障科技,通过低、中、高频分段降噪,实现运行噪音低至31分贝,达“一米外听不见”的静音效果。9月26日,搭载该技术的麦浪冰箱9系新品通过德国VDE最高A级认证并正式发布。海尔联合多家权威机构填补行业标准空白,推动冰箱从“功能合格”迈向“体验优秀”,巩固全球引领地位。

  • AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

    近日AI领域迎来多项重要更新:阿里夸克发布AI创作平台“造点”,整合通义万相Wan2.5与Midjourney V7,支持音画同步视频生成;Wan2.5-Preview实现多模态输入与电影级视频同步生成,提升视觉创作能力;可灵AI推出视频生成模型2.5Turbo并降价30%,降低使用门槛;阿里通义推出Qwen3-ASR-Toolkit,实现小时级音视频转录;谷歌相册AI编辑功能扩展至安卓用户,支持语音修图;谷歌Mixboard工具助力创意设计,生成情绪板;Qwen发布Qwen3-Max模型,在代码生成与智能体能力表现突出;Figma推出MCP服务器,实现设计到代码的一键转换,提升开发效率。

  • 破解海外旅游语言困境,时空壶新T1以端侧模型开启全球畅行

    国庆假期临近,海外旅游热度攀升,语言沟通成为游客面临的主要障碍。网络不稳定更使依赖在线翻译工具的旅行者陷入困境。时空壶新T1翻译机通过端侧AI模型,实现无网或弱网环境下的流畅翻译,支持31种语言互译,覆盖全球98%主流旅游地。其离线翻译准确率达90%,响应迅速,并具备拍照翻译和降噪功能,有效解决机场、餐厅等嘈杂场所的沟通难题。新T1助力游客跨越语言壁垒,尽享无忧旅程,真正实现“无网也能畅行全球”。

  • 小米17 1TB版明日开售 售价5299元

    小米17系列新增16GB+1TB版本,将于10月5日全渠道开售,售价5299元。该版本提供黑、白、雪山粉、冰融蓝四色可选。小米联合创始人卢伟冰透露,该系列上市以来销量已突破100万台,增速超越往代产品。小米正全力提升生产效率,增加备货量,以满足火爆市场需求。官方数据显示,小米17全系开售仅5分钟便刷新2025年国产智能手机全价位段新机首销纪录。

  • 小米 17 标准版1TB版本 5299 元开售 全系列销量同比增超20%

    小米17标准版1TB版本今日正式开售,售价5299元。该机型搭载16GB内存与1TB超大存储,配备7000mAh电池,被网友誉为"最强标准版旗舰"。卢伟冰透露,小米17全系销量同比增长超20%,Pro系列表现尤为突出。新机采用6.3英寸屏幕,重191克,支持IP68防尘防水,首发高通第五代骁龙8至尊版平台,内置5000万像素双摄,堪称小米史上最强小尺寸全能旗舰。

  • 苹果A19单核性能登顶全球第一!超越一众PC CPU:功耗仅4W

    苹果A19芯片在PassMark单核性能测试中表现卓越,以5149分登顶榜首,超越英特尔Core Ultra 9 285K和AMD EPYC等桌面处理器。其仅依靠被动散热,功耗约4瓦,能效优势显著。尽管多线程性能受限于核心数量,但作为移动设备芯片,这一成绩已足够亮眼。

  • 美团发布高效推理模型LongCat-Flash-Thinking:部分性能接近GPT5

    9月23日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时,性能更强大、更专业,在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力,扩展了形式化定理证明能力,成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出,多项基准测试成绩领先开源及闭源顶尖模型,已在HuggingFace、Github全面开源。

  • AI日报:美团发布推理大模型LongCat-Flash-Thinking;阿里Wan-Animate开源;字节推豆包翻译大模型

    AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking;阿里开源Wan-Animate模型革新AI视频生成;字节跳动发布豆包翻译模型,支持28种语言互译;华为与浙大联合推出安全大模型DeepSeek-R1-Safe;阿里云即将发布跨模态模型Qwen3-Omni;xAI推出计算成本降低98%的Grok4Fast模型;YouTube发布多项AI创作辅助功能;IBM推出轻量级文档处理模型Granite-Docling-258M;中科院发布类脑大模型SpikingBrain实现百倍速度突破;OpenAI将推出仅限Pro用户的计算密集型新功能。

今日大家都在搜的词: