AI日报：生数科技推出Vidu Q2；火山引擎推出炉米Lumi；通义千问开源300+模型

2025-09-25 15:51 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解：https://app.aibase.com/zh

1、生数科技推出 Vidu Q2，细微表情生成让AI演绎更真实！

生数科技推出的Vidu Q2模型在图生视频领域实现了重大突破，尤其在细微表情生成方面表现出色，为AI演绎提供了更加真实和生动的视觉体验。

【AiBase提要:】
🎭 Vidu Q2能够精准捕捉细微表情变化，提升视频生成的自然度和情感表达。
🎥 支持多种视频模式选择，包括图生视频、首尾帧视频以及可调时长选项，满足多样化需求。
💡 生数科技致力于通过AI技术推动创意产业发展，为用户带来更高质量的影像创作体验。

2、火山引擎推出炉米 Lumi 平台支持视觉模型 Lora 微调

火山引擎推出的炉米 Lumi 平台，首次支持豆包、即梦等同款视觉模型的 Lora 微调功能，旨在帮助企业高效定制独特的视觉风格，满足市场需求。

【AiBase提要:】
🧠 炉米 Lumi 平台支持视觉模型的 Lora 微调功能，帮助企业定制独特的视觉风格。
🚀 该平台提供从图片生成到视频生成的全流程服务，满足企业专业场景的 AIGC 需求。
💡 炉米 Lumi 平台助力企业高效构建定制化 AIGC 生产能力，提升用户体验。

3、阿里云CTO透露：通义千问开源300+模型下载量破6亿大关

阿里云在2025云栖大会上展示了通义千问项目的显著成就，包括开源超过300个模型和下载量突破6亿次。这表明了阿里云在AI领域的强大影响力和技术实力，并且通过开源模型推动技术创新和应用落地。

【AiBase提要:】
🚀 通义千问项目已开源300多个模型，展示出强大的技术实力。
📊 下载总量突破6亿次，体现了用户对阿里云AI技术的高度认可。
🖼️ 通义万象生成超3.9亿张图片和7000多万视频，彰显数字内容生成能力。

4、百度 Qianfan-VL 开源发布，昆仑芯助力多模态 AI 新突破

百度正式开源了其最新视觉理解模型 Qianfan-VL，包含3B、8B和70B三个版本，适用于不同场景。该模型具备强大的多模态能力，尤其在OCR和教育领域表现突出，并且训练依赖于自研的昆仑芯P800芯片。

【AiBase提要:】
🧠 Qianfan-VL 是一个强大的多模态大模型，能够同时处理图像和文本信息。
💡 昆仑芯 P800 芯片支撑模型训练，功耗低且效率高，优化大规模计算性能。
🚀 Qianfan-VL 系列已在 GitHub 和 Hugging Face 上开源，供开发者自由使用。
详情链接:https://github.com/baidubce/Qianfan-VL

5、微软引入 Anthropic AI 模型，拓展 Copilot Assistant 功能

微软宣布在 Copilot 助手中引入 Anthropic 的 AI 模型，标志着其在生成式人工智能领域的多元化战略迈出新一步。尽管与 OpenAI 的合作依然密切，微软开始引入 Anthropic 的技术以满足商业客户的需求。企业用户现在可以使用 Anthropic 的模型构建 AI 代理，并且这些模型将在亚马逊和谷歌云中运行。

【AiBase提要:】
🤖 微软在 Copilot 助手中引入 Anthropic 的 AI 模型，推动产品多元化。
🔄 Microsoft 与 OpenAI 的关系虽然仍然紧密，但逐渐使用 Anthropic 技术。
🚀 企业用户可选择 Anthropic 模型构建 AI 代理，需管理员启用后使用。

6、OpenAI 在美国新建五个数据中心，推动 Stargate 项目快速发展

OpenAI 宣布将在美国新建五个数据中心，以提升 Stargate 项目的计算能力。该项目由多家公司共同发起，总投资额高达5000亿美元，旨在推动生成式人工智能的发展。

【AiBase提要:】
🌐 OpenAI 将在美国新建五个数据中心，Stargate 项目总计算能力将达到近7GW。
💼 Oracle 将负责三个新数据中心的建设，阿比林数据中心将扩建并增加600MW 计算能力。
🚀 OpenAI 计划未来每周增加1GW 的人工智能基础设施，以推动 AI 技术的进一步发展。

7、英伟达开源 Audio2Face 模型，AI 助力实时面部动画生成

英伟达开源了其生成式 AI 面部动画模型 Audio2Face，提供了 SDK 和训练框架，支持离线和实时处理，适用于游戏、影视等多个领域。该技术已被多家游戏开发商采用，提升了角色的真实感和沉浸体验。

【AiBase提要:】
🔊 英伟达开源 Audio2Face 模型，提升虚拟角色的面部动画生成技术。
🎮 支持离线渲染和实时流式处理，适用于多种场景。
🌟 已被多个游戏开发商采用，简化制作流程并提升角色真实感。
详情链接:https://build.nvidia.com/nvidia/audio2face-3d

8、Meta 发布代码世界模型 CWM:具备沙箱推演能力的32B AI

Meta 推出的 Code World Model (CWM) 是一个拥有 32B 参数的 AI 系统，能够通过沙箱环境进行代码模拟和推演，从而减少错误并提高调试效率。该模型对硬件要求极高，需要双 H100 GPU 和 RDMA 技术支持。

【AiBase提要:】
🧠 CWM 在生成代码前会进行沙箱模拟，预测代码运行后果。
🔍 能快速定位代码错误，提升调试效率。
🚨 可在执行命令前预警潜在风险，增强安全性。
详情链接:https://github.com/facebookresearch/cwm

（举报）

相关推荐

关键词：

爱诗科技下注的AI视频，正在比它预期的更「快」落地

「我们决定全力投入视频生成领域，因为我们坚信视频生成一旦能够落地，其产品化和商业化的潜力可能不亚于大语言模型。」爱诗科技创始人兼CEO王长虎在2025年6月的一场演讲中，这样解释为什么要在2023年就坚定地选择AI视频生成这个非共识赛道作为自己的创业方向。短短两年后，视频大模型的产品化和商业化潜力已经如王长虎判断的那样，在快速落地，形成自己的创作生�

AI视频生成视频大模型产品化
菁彩Vivid搭载车量超百万，携手车企迎来车载应用新里程碑！

2025年11月5日，世界超高清视频产业联盟在深圳举办UWA+峰会，宣布中国自主三维音频标准“菁彩声”（Audio Vivid）车载应用装机量突破100万台。该标准基于AI技术，支持7阶HOA渲染与128轨实时处理，解码延迟低于80ms，实现三维空间精准定位与“黄金听音位”个性化体验。已覆盖鸿蒙智行、奇瑞等十余家车企29款车型，获IEC国际标准认证，与Dolby AC-4等并列全球四大三维音频标准。通过构建“标准-内容-终端”生态，推动中国音频产业从技术领先迈向市场引领。

菁彩声 Audio Vivid
百度Q3财报：AI业务增长超50% 萝卜快跑季度单量增长212%

今日，百度发布2025年第三季度财报显示，该季度总营收312亿元，核心营收247亿元。三季度，百度首次披露AI业务收入，显示同比增长超50%。

百度财报 AI业务收入萝卜快跑
荐AI表格纷争，钉钉率先卷出千万热行

又是一年双11。人们总是习惯把双11当成消费现象来讨论，GMV、主播战报、尾款人段子，总能被讨论许久，但这场已经持续十余年的全民购物，其实还有一个总被忽视的关键角色:它是诸多对今天商业世界和人们日常生活至关重要技术的试炼场。 2009年第一个双11，支付宝核心数据库差点被巨量交易额击垮，催生了后来的自主数据库以及影响了整个云计算进程的去IOE运动，2013�

双11 技术试炼场商业世界
专业创作者之选：佳能R50V在视频、Vlog与直播领域的全能表现

佳能R50V相机专为视频创作者设计，集专业视频制作、Vlog记录与高质量直播于一体。支持6K超采样4K视频录制，配备10-bit 4:2:2色彩与Canon Log3，保障画质细腻且后期空间大。机身仅323克，便携性强，优化自拍与竖拍操作，内置美颜与智能对焦功能。直播时可通过USB直连电脑，实现4K 60P高清输出。它融合专业性能与易用性，是应对多种创作需求的理想选择。

视频制作 Vlog记录高质量直播
百度搜索AI API全面开放绝大多数结果由AI生成

11月13日，百度创始人李彦宏在2025百度世界大会上宣布，百度搜索已实现绝大多数结果由AI生成，首条结果富媒体覆盖率高达70%。他强调，百度正通过AI技术深度重构搜索结果页，从传统文字链接模式转向以图片、视频等富媒体内容为核心的AI应用。李彦宏指出，百度是全球搜索引擎中对AI化改造最激进的，正引领行业进入全新时代。他还表示，企业需善用AI方能立于不败之地，个人也需掌握AI技能以掌控未来。目前，百度已通过AI+API开放搜索能力，与三星、荣耀、vivo等主流厂商建立合作，共同探索AI搜索的无限可能。

百度世界大会 AI生成富媒体
小米发布2025Q3财报：营业收入1131.21亿元同比增长22.3%

小米集团2025年第三季度财报显示：营收1131.21亿元，同比增长22.3%，连续四季破千亿；净利润113.11亿元，激增80.9%。智能电动汽车及AI业务首次单季盈利，收入达290亿元。高端战略深化，手机国内销量第二，4000-6000元价位市占率提升至18.9%。全球化稳步推进，手机出货量居全球前三，拉美、中东排名升至第二。研发投入持续加大，前三季度累计235亿元，全年预计超300亿元。小米正以技术为本，构建全场景智能生态。

小米财报智能电动汽车 AI业务
京东Q3财报：外卖、京喜、京东国际正在发生关键变化

这是《窄播Weekly》的第72期，本期我们关注:京东Q3财报及财报体现的其业务逻辑变化。整体上，Q3财报及电话会呈现出:京东找增长的路径又在发生变化。具体来讲，集团总营收增速，核心零售业务的收入增速、经营利润率同比都在提升:2025年Q3京东总营收2991亿元，同比增长14.9%（去年Q3的同比增速为5.1%）。京东零售营收为2505.77亿元，同比增长11.4%(去年Q3的同比增速为6.1%);经营�

京东Q3财报京东零售新业务
荐AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异常致全球宕机；百度Q3 AI收入96亿元

谷歌发布Gemini 3大模型及Antigravity AI开发平台，支持参数灵活调整；Cloudflare因配置异常致全球服务中断6小时；微软测试AI文件连接器，允许Claude直接读取本地文件；百度Q3 AI收入96亿元，萝卜快跑订单激增；小米AI眼镜新增直播与语音控制功能；TikTok推出AI内容推荐调节选项；微软将Copilot全面集成至Office应用；谷歌推出实时生成交互界面的Generative UI技术；Manus发布Browser Operator，将浏览器升级为全功能AI代理。

AI Gemini 3
荐长视频，要MCN化？

过去十多年，长视频平台习惯用头部综艺与大剧撬动增长:内容够强，自然破圈，声量带动会员与广告。这套“内容中心逻辑”曾行之有效。但短视频重写了注意力分配。用户不再愿意投入整段时间追一个叙事，三十秒的情绪刺激就足以满足娱乐需求。内容生命周期被压缩，哪怕是重金制作，也可能上线当周见顶、难以延展。在这种环境下，平台不得不寻找新的增长方式。�

文章搜索核心标签长视频平台

今日大家都在搜的词：

热文

3 天
7天

AI日报：生数科技推出Vidu Q2；火山引擎推出炉米Lumi；通义千问开源300+模型

爱诗科技下注的AI视频，正在比它预期的更「快」落地

菁彩Vivid搭载车量超百万，携手车企迎来车载应用新里程碑！

百度Q3财报：AI业务增长超50% 萝卜快跑季度单量增长212%

荐AI表格纷争，钉钉率先卷出千万热行

专业创作者之选：佳能R50V在视频、Vlog与直播领域的全能表现

百度搜索AI API全面开放绝大多数结果由AI生成

小米发布2025Q3财报：营业收入1131.21亿元同比增长22.3%

京东Q3财报：外卖、京喜、京东国际正在发生关键变化

荐AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异常致全球宕机；百度Q3 AI收入96亿元

荐长视频，要MCN化？

今日大家都在搜的词：

热文

华为Mate X7外观公布搭载全新折叠玄武架构

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

董明珠再回应玫瑰空调：创新尝试打造家电艺术品

华为Mate X7今日开启预订搭载第二代红枫影像等配置

苹果回应iPhone17PM被湿巾擦掉色：高浓度酒精或是诱因

参与开发iPhoneAir设计师离职转投AI初创公司

AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异

华为FreeBuds Pro 5悦彰耳机价格公布：1449元支持星闪音频

小米端到端辅助驾驶“Xiaomi HAD增强版”将于11月12日发布

小米AI眼镜推出1.4.16.0固件版本支持英语口语陪练

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

华为Mate X7外观公布搭载全新折叠玄武架构

阿里巴巴回应千问崩了：状态良好欢迎来问

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

荣耀500系列官宣将于11月24日发布

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

小米超级小爱AI大模型推出随心修图功能

站长商机