AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠榜Hugging Face；Veo3视觉能力升级

2025-09-29

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

1、蚂蚁百灵团队全新开源高性能思考模型 Ring-flash-2.0

蚂蚁百灵团队开源了高性能思考模型 Ring-flash-2.0，该模型在多个高难度基准测试中表现出色，具有强大的计算能力和资源效率。其创新的两阶段强化学习训练流程提升了模型的推理能力，并且所有模型权重和训练方案都将完全开源。

【AiBase提要:】

🧠 Ring-flash-2.0 是基于 Ling-flash-2.0-base 的高性能思考模型，参数总量为100亿，但每次推理仅激活6.1亿。

🚀 在数学竞赛、代码生成和逻辑推理等任务中，Ring-flash-2.0 的性能超越了同类40亿参数模型，甚至可与更大规模的开源稀疏模型媲美。

🔧 团队设计了创新的两阶段强化学习训练流程，包括 Long-CoT SFT、RLVR 和 RLHF，以提升模型的推理和通用能力。

详情链接:https://huggingface.co/inclusionAI/Ring-flash-2.0 https://modelscope.cn/models/inclusionAI/Ring-flash-2.0

2、阿里通义7款模型屠榜Hugging Face!全模态大模型Qwen3-Omni登顶全球第一

阿里通义7款模型在Hugging Face全球开源模型榜单中表现卓越，其中Qwen3-Omni作为全模态大模型，凭借强大的音视频处理能力和稳定的文本与图像性能，成功登顶全球第一

【AiBase提要:】

🧠 Qwen3-Omni是阿里最新开源的全模态大模型，可处理文本、图片、语音和视频四种数据类型。

🎧 Qwen3-Omni在音视频能力上取得32项开源最佳性能SOTA，同时保持文本与图像性能稳定。

🚀 阿里通义7款模型包揽Hugging Face全球前十开源模型榜单，Qwen3-Omni登顶全球第一

3、不只是生成视频:谷歌 Veo3视觉能力升级，可自动玩数独、解迷宫

谷歌研究部门最新披露，其视频生成模型 Veo3 在视觉AI领域取得了突破性进展，被誉为达到了‘GPT-3’时刻。Veo3不仅限于视频生成，还能在无需额外训练的情况下，自动完成多项复杂的视觉任务，包括寻找物体、修复照片、玩迷宫、解决数独等，标志着视觉AI进入新的发展阶段。

【AiBase提要:】

🧠 理解图像:自动识别图像中的边缘、轮廓、物体位置、颜色和形状等基本视觉元素。

🧪 理解物理原理:具备基本的物理认知，例如能够分辨出哪些物体会漂浮，哪些会下沉，并理解光的反射方式。

🎨 进行手动编辑:像“自动版 Photoshop”一样，Veo3可以执行复杂的图片编辑任务，如去除背景、添加文字，甚至将照片转换为油画风格。

4、特斯拉全力推进“擎天柱”规模化生产，马斯克称其将成公司最重要产品

特斯拉正在全力推进其人形机器人“擎天柱”的规模化生产，并将其视为公司最重要的产品。尽管在研发过程中面临一些技术挑战，如手部设计问题，但特斯拉仍致力于克服这些障碍以实现量产目标。

【AiBase提要:】

🤖 特斯拉正全力推进‘擎天柱’的规模化生产。

💡 马斯克认为‘擎天柱’将成为特斯拉最重要的产品。

🔧 机器人手部设计是当前研发中的主要技术挑战之一。

5、马斯克再发怒！第六次起诉 OpenAI，指控窃取商业机密

马斯克再次起诉 OpenAI，指控其窃取商业机密并挖角核心员工，双方竞争加剧，可能影响 AI 行业未来走向。

【AiBase提要:】

🧠 OpenAI 被指控系统性挖角 xAI 核心员工并窃取商业机密。

🔒 诉状指出 OpenAI 诱导员工违反保密协议，获取源代码和数据中心战略计划。

⚖️ 马斯克称 OpenAI 的行为威胁 xAI 的创新与未来发展。

6、苹果悄然测试 “聊天机器人”，但暂不向公众开放！

苹果正在内部测试代号为 'Veritas' 的聊天机器人应用，用于验证新一代 Siri 技术。尽管苹果在 AI 领域已有布局，但其策略并未获得预期反响，用户对 Siri 的表现不满。苹果组建了新团队 AKI，专注于开发 AI 驱动的网页搜索工具，同时计划推出结合外部模型和自研技术的新 Siri（Project Linwood）。然而，苹果尚未计划将 Veritas 推向消费者市场。

【AiBase提要:】

🍎 苹果正在测试名为 'Veritas' 的聊天机器人应用，用于验证新一代 Siri 技术。

🤖 苹果组建了 'AKI' 团队，专注于开发 AI 驱动的网页搜索工具，以接近 ChatGPT 等竞争对手。

📈 新一代 Siri（Project Linwood）预计明年3月亮相，将结合外部模型和自研技术。

7、YouTube 音乐推出 AI 主播，打破音乐聆听的沉默

YouTube 音乐推出了名为 'Beyond the Beat' 的 AI 主播，旨在提升用户的聆听体验。该功能在播放音乐时插入相关的故事、趣闻和评论，增加互动性。尽管存在生成不准确信息的风险，但其潜力仍值得期待。

【AiBase提要:】

🎧 YouTube 音乐推出 AI 主播 'Beyond the Beat'，提升用户聆听体验。

🗣️ AI 主播在播放音乐时插入故事、趣闻和评论，增强互动性。

⚠️ 该技术可能生成不准确信息，但仍有潜力带来惊喜体验。

8、LiquidAI 推出 Liquid Nanos 系列轻量级 AI 模型，优化边缘设备应用

LiquidAI 发布了专为边缘计算设备设计的轻量级 AI 模型 'Liquid Nanos'，支持多种应用场景，如翻译、抽取、RAG、工具调用和数学推理。该系列提供350M 和1.2B 两种参数版本，并支持 GGUF 量化格式，优化性能与资源利用。首批12款任务专用模型已在 Hugging Face 上线，为开发者提供了丰富的工具选择。

【AiBase提要:】

🌟 LiquidAI 推出了专为边缘设备设计的轻量级 AI 模型 'Liquid Nanos'。

📊 提供350M 和1.2B 两种参数版本，支持 GGUF 量化格式以优化性能。

🚀 首批12款任务专用模型已在 Hugging Face 上线，涵盖多种应用场景。

详情链接:https://huggingface.co/collections/LiquidAI/liquid-nanos-68b98d898414dd94d4d5f99a

