AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠榜Hugging Face；Veo3视觉能力升级

2025-09-29 16:27 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://app.aibase.com/zh

蚂蚁百灵团队开源了高性能思考模型 Ring-flash-2.0，该模型在多个高难度基准测试中表现出色，具有强大的计算能力和资源效率。其创新的两阶段强化学习训练流程提升了模型的推理能力，并且所有模型权重和训练方案都将完全开源。

【AiBase提要:】
🧠 Ring-flash-2.0 是基于 Ling-flash-2.0-base 的高性能思考模型，参数总量为100亿，但每次推理仅激活6.1亿。
🚀 在数学竞赛、代码生成和逻辑推理等任务中，Ring-flash-2.0 的性能超越了同类40亿参数模型，甚至可与更大规模的开源稀疏模型媲美。
🔧 团队设计了创新的两阶段强化学习训练流程，包括 Long-CoT SFT、RLVR 和 RLHF，以提升模型的推理和通用能力。
详情链接:https://huggingface.co/inclusionAI/Ring-flash-2.0 https://modelscope.cn/models/inclusionAI/Ring-flash-2.0

2、阿里通义7款模型屠榜Hugging Face!全模态大模型Qwen3-Omni登顶全球第一

阿里通义7款模型在Hugging Face全球开源模型榜单中表现卓越，其中Qwen3-Omni作为全模态大模型，凭借强大的音视频处理能力和稳定的文本与图像性能，成功登顶全球第一。

【AiBase提要:】
🧠 Qwen3-Omni是阿里最新开源的全模态大模型，可处理文本、图片、语音和视频四种数据类型。
🎧 Qwen3-Omni在音视频能力上取得32项开源最佳性能SOTA，同时保持文本与图像性能稳定。
🚀 阿里通义7款模型包揽Hugging Face全球前十开源模型榜单，Qwen3-Omni登顶全球第一。

3、不只是生成视频:谷歌 Veo3视觉能力升级，可自动玩数独、解迷宫

谷歌研究部门最新披露，其视频生成模型 Veo3 在视觉AI领域取得了突破性进展，被誉为达到了‘GPT-3’时刻。Veo3不仅限于视频生成，还能在无需额外训练的情况下，自动完成多项复杂的视觉任务，包括寻找物体、修复照片、玩迷宫、解决数独等，标志着视觉AI进入新的发展阶段。

【AiBase提要:】
🧠 理解图像:自动识别图像中的边缘、轮廓、物体位置、颜色和形状等基本视觉元素。
🧪 理解物理原理:具备基本的物理认知，例如能够分辨出哪些物体会漂浮，哪些会下沉，并理解光的反射方式。
🎨 进行手动编辑:像“自动版 Photoshop”一样，Veo3可以执行复杂的图片编辑任务，如去除背景、添加文字，甚至将照片转换为油画风格。

4、特斯拉全力推进“擎天柱”规模化生产，马斯克称其将成公司最重要产品

特斯拉正在全力推进其人形机器人“擎天柱”的规模化生产，并将其视为公司最重要的产品。尽管在研发过程中面临一些技术挑战，如手部设计问题，但特斯拉仍致力于克服这些障碍以实现量产目标。

马斯克、特斯拉机器人

【AiBase提要:】
🤖 特斯拉正全力推进‘擎天柱’的规模化生产。
💡 马斯克认为‘擎天柱’将成为特斯拉最重要的产品。
🔧 机器人手部设计是当前研发中的主要技术挑战之一。

5、马斯克再发怒！第六次起诉 OpenAI，指控窃取商业机密

马斯克再次起诉 OpenAI，指控其窃取商业机密并挖角核心员工，双方竞争加剧，可能影响 AI 行业未来走向。

【AiBase提要:】
🧠 OpenAI 被指控系统性挖角 xAI 核心员工并窃取商业机密。
🔒 诉状指出 OpenAI 诱导员工违反保密协议，获取源代码和数据中心战略计划。
⚖️ 马斯克称 OpenAI 的行为威胁 xAI 的创新与未来发展。

6、苹果悄然测试 “聊天机器人”，但暂不向公众开放！

苹果正在内部测试代号为 'Veritas' 的聊天机器人应用，用于验证新一代 Siri 技术。尽管苹果在 AI 领域已有布局，但其策略并未获得预期反响，用户对 Siri 的表现不满。苹果组建了新团队 AKI，专注于开发 AI 驱动的网页搜索工具，同时计划推出结合外部模型和自研技术的新 Siri（Project Linwood）。然而，苹果尚未计划将 Veritas 推向消费者市场。

【AiBase提要:】
🍎 苹果正在测试名为 'Veritas' 的聊天机器人应用，用于验证新一代 Siri 技术。
🤖 苹果组建了 'AKI' 团队，专注于开发 AI 驱动的网页搜索工具，以接近 ChatGPT 等竞争对手。
📈 新一代 Siri（Project Linwood）预计明年3月亮相，将结合外部模型和自研技术。

7、YouTube 音乐推出 AI 主播，打破音乐聆听的沉默

YouTube 音乐推出了名为 'Beyond the Beat' 的 AI 主播，旨在提升用户的聆听体验。该功能在播放音乐时插入相关的故事、趣闻和评论，增加互动性。尽管存在生成不准确信息的风险，但其潜力仍值得期待。

【AiBase提要:】
🎧 YouTube 音乐推出 AI 主播 'Beyond the Beat'，提升用户聆听体验。
🗣️ AI 主播在播放音乐时插入故事、趣闻和评论，增强互动性。
⚠️ 该技术可能生成不准确信息，但仍有潜力带来惊喜体验。

8、LiquidAI 推出 Liquid Nanos 系列轻量级 AI 模型，优化边缘设备应用

LiquidAI 发布了专为边缘计算设备设计的轻量级 AI 模型 'Liquid Nanos'，支持多种应用场景，如翻译、抽取、RAG、工具调用和数学推理。该系列提供350M 和1.2B 两种参数版本，并支持 GGUF 量化格式，优化性能与资源利用。首批12款任务专用模型已在 Hugging Face 上线，为开发者提供了丰富的工具选择。

【AiBase提要:】
🌟 LiquidAI 推出了专为边缘设备设计的轻量级 AI 模型 'Liquid Nanos'。
📊 提供350M 和1.2B 两种参数版本，支持 GGUF 量化格式以优化性能。
🚀 首批12款任务专用模型已在 Hugging Face 上线，涵盖多种应用场景。
详情链接:https://huggingface.co/collections/LiquidAI/liquid-nanos-68b98d898414dd94d4d5f99a

（举报）

相关推荐

关键词：

荐AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功能；百度“文心”5.0重磅回归

本期AI日报聚焦多领域技术突破：美团发布全模态交互模型LongCat-Flash-Omni；阿里通义千问Qwen3-Max上线深度思考功能；百度文心5.0升级多模态生成能力；谷歌确认Gemini3年内发布并整合至苹果Siri；OpenAI向多国开放Sora2视频工具；云存储与AI开发工具持续优化，展现行业加速迭代态势。

AI 多模态实时交互
开发者必看！2025开放原子开发者大会：解锁开源鸿蒙&开源欧拉实践、Rust实战与AI开源新机遇

2025年11月21日至22日，北京亦庄将举办2025开放原子开发者大会，主题为“AI共治，开源共享”。大会汇聚全球开源项目、技术专家与开发者，探讨开源技术与AI融合的未来路径，覆盖操作系统、人工智能、数据库、量子计算等前沿领域。通过主题论坛、技术分论坛及项目展示，为开发者提供技术交流、生态共建及职业成长平台，助力开源社区发展。

开源技术 AI共治开发者大会
荐AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异常致全球宕机；百度Q3 AI收入96亿元

谷歌发布Gemini 3大模型及Antigravity AI开发平台，支持参数灵活调整；Cloudflare因配置异常致全球服务中断6小时；微软测试AI文件连接器，允许Claude直接读取本地文件；百度Q3 AI收入96亿元，萝卜快跑订单激增；小米AI眼镜新增直播与语音控制功能；TikTok推出AI内容推荐调节选项；微软将Copilot全面集成至Office应用；谷歌推出实时生成交互界面的Generative UI技术；Manus发布Browser Operator，将浏览器升级为全功能AI代理。

AI Gemini 3
荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

本期AI日报聚焦多项技术突破：月之暗面开源AI代理框架Kosong，支持异步编排与插件化设计；Replit推出AI集成功能，可一键调用300+模型；商汤发布空间智能模型SenseNova-SI，性能超越GPT-5；百度推出多模态模型ERNIE-4.5-VL，新增图像思考能力；谷歌地图全面AI化，集成Gemini实现智能交互；ChatTutor上线可视化教学系统，覆盖多学科实时推演；新版Google Finance引入AI深度搜索与财报追踪；OpenAI低调上线Polaris Alpha模型，支持256K上下文并更新知识库至2024年10月。

AI代理开源框架异步编排
“超级秘书”来了！界环AI音频眼镜特别版首发搭载VUI2.0

2025年11月18日，蜂巢科技发布界环AI音频眼镜特别版，含钛无框、钛眉框、钛半框三款，售价1699元起。产品搭载全新Superhexa VUI2.0系统，实现从“响应指令”到“理解意图”的升级，支持连续对话与主动播报。核心功能包括全场景录音转写总结、跨应用实时翻译，覆盖会议、学习等多场景，并免费开放。即日起可在京东等平台预约购买。

蜂巢科技界环AI音频眼镜 Superhexa
解锁开源算力管理密码！2025开源算力设备管理分论坛重磅来袭

文章指出算力设备智能化管理与开源技术融合正驱动行业变革。openUBMC作为开源算力管理新力量，致力于打造开放易用的管理软件开发平台。2025年开放原子开发者大会将举办开源算力管理软件分论坛，从基础设施部署、组件优化到商业落地等多维度探讨开源算力管理的技术密码与产业机遇。论坛汇聚互联网、运营商、整机商等权威阵容，将分享商业案例、技术突破及生态实践，共探开源设备管理软件未来路径，赋能行业智能化转型。

开源算力设备管理 openUBMC
这家公司造了一颗「蛋」！猴哥跳跳开启智慧育儿2.0时代

妈妈网推出的“猴哥跳跳AI智慧蛋”是一款专为3-8岁儿童设计的智能陪伴产品。它不仅是能对话、解答问题的AI，更具备情感识别、启发式引导和共创能力，覆盖天文地理到生活科普的知识引擎。通过个性化互动方案、情绪陪伴功能和创意工坊，培养孩子探索思维。家长可通过专属APP查看成长报告，所有内容100%适龄健康，数据加密保障安全。该产品在公测阶段获95%家长好评，旨在以智慧方式延伸父母的爱，而非替代亲情。

育儿 AI早教儿童陪伴
AI共智开源共享｜2025开放原子开发者大会开源鸿蒙技术分论坛即将启幕

2025开放原子开发者大会开源鸿蒙技术分论坛将于11月21日在北京举行，聚焦AI与操作系统融合创新。论坛将发布开源鸿蒙跨平台框架进展，展示端边云协同实践案例及年度商用成果，覆盖金融、工业、医疗等多元场景。目前社区已汇聚超9500名贡献者、70余家共建单位，迭代至6.0版本，推动智能终端生态发展。活动同步推出开发者激励计划，通过高校对话、人才授牌等机制构建&quo

开源鸿蒙 AI技术操作系统
AI共治，开源共享：2025开放原子开发者大会邀您共筑新生态

2025年11月21日至22日，2025开放原子开发者大会将在北京亦庄举行，主题为“AI共治，开源共享”。大会汇聚全球顶尖开发者与企业领袖，通过主题演讲、技术论坛及赛事路演等形式，探讨开源操作系统、AI与开源融合、量子计算等前沿技术，并设置开源教育、社区建设与互动体验环节，旨在构建开源技术交流平台，推动开发者生态繁荣。预计超700家单位参与，共120余场演讲，助�

开源技术开发者大会 AI共治
小米超级小爱AI大模型推出随心修图功能

小米宣布超级小爱AI大模型推出随心修图功能，用户只需一句话即可轻松修出具有大片质感的照片。该功能有两种使用方式：在相册大图页面直接唤醒AI或通过应用上传照片并输入指令。使用需满足版本要求：超级小爱需v7.8.50及以上，相册编辑功能需v2.1及以上，相册本身需v4.3.0.30及以上。目前仅限Xiaomi HyperAI机型支持在相册大图页使用。超级小爱于2024年12月面向正式版用户开放升级，支持全局多模态交互和自然语音搜索，提升使用体验。

小米超级小爱 AI大模型

今日大家都在搜的词：

热文

3 天
7天

AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠榜Hugging Face；Veo3视觉能力升级

荐AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功能；百度“文心”5.0重磅回归

开发者必看！2025开放原子开发者大会：解锁开源鸿蒙&开源欧拉实践、Rust实战与AI开源新机遇

荐AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异常致全球宕机；百度Q3 AI收入96亿元

荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

“超级秘书”来了！界环AI音频眼镜特别版首发搭载VUI2.0

解锁开源算力管理密码！2025开源算力设备管理分论坛重磅来袭

这家公司造了一颗「蛋」！猴哥跳跳开启智慧育儿2.0时代

AI共智开源共享｜2025开放原子开发者大会开源鸿蒙技术分论坛即将启幕

AI共治，开源共享：2025开放原子开发者大会邀您共筑新生态

小米超级小爱AI大模型推出随心修图功能

今日大家都在搜的词：

热文

华为Mate X7外观公布搭载全新折叠玄武架构

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

董明珠再回应玫瑰空调：创新尝试打造家电艺术品

华为Mate X7今日开启预订搭载第二代红枫影像等配置

苹果回应iPhone17PM被湿巾擦掉色：高浓度酒精或是诱因

参与开发iPhoneAir设计师离职转投AI初创公司

AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异

华为FreeBuds Pro 5悦彰耳机价格公布：1449元支持星闪音频

小米端到端辅助驾驶“Xiaomi HAD增强版”将于11月12日发布

小米AI眼镜推出1.4.16.0固件版本支持英语口语陪练

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

华为Mate X7外观公布搭载全新折叠玄武架构

阿里巴巴回应千问崩了：状态良好欢迎来问

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

荣耀500系列官宣将于11月24日发布

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

小米超级小爱AI大模型推出随心修图功能

站长商机