AI日报：阿里千问APP公测；Veo 3.1上线多图参考；小爱AI大模型“随心修图”上线

2025-11-17 16:02 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

1、阿里千问APP公测，与ChatGPT展开全面竞争

阿里巴巴推出的千问APP，基于Qwen3模型，旨在与ChatGPT展开全面竞争。千问APP公测版已在各大应用商店上线，并计划推出国际版。此外，Qwen3-Max的性能已超越GPT5等国际模型，成为全球前三。

【AiBase提要:】

🧠 阿里巴巴推出千问APP，基于Qwen3模型与ChatGPT竞争。

🚀 千问APP公测版已上线，并计划推出国际版争夺海外市场。

📈 Qwen3-Max性能超越GPT5等国际模型，成为全球前三。

2、Gemini Veo 3.1上线多图参考 一次合成三元素视频

谷歌向Gemini Pro/Ultra订阅用户推送Veo 3.1视频模型，新增“Ingredients to Video”模式，支持同时上传三张参考图，分别提取人物、场景与风格特征并融合为8秒1080p视频。该功能提升了视频生成的多样性和质量，同时保持了角色一致性和光影连贯。

【AiBase提要:】

🌟 新增“Ingredients to Video”模式，支持三张参考图生成视频。

🎨 视频内容自带SynthID隐形水印，提升版权保护。

🔊 同步输出原生环境音，增强视频沉浸感。

3、超级小爱AI大模型“随心修图”上线：一句话秒出大片

小米推出v7.8.50版本的超级小爱更新，新增‘随心修图’功能，用户可通过自然语言指令调用相册AI模型完成自动修图。该功能支持全局多模态交互，可识别屏幕与摄像头画面并执行复杂操作链。

【AiBase提要:】

📱 超级小爱新增‘随心修图’功能，用户通过自然语言指令即可实现自动修图。

📷 支持全局多模态交互，可识别屏幕与摄像头画面并执行复杂操作链。

🖼️ 功能基于7B多模态大模型，可在本地完成推理，默认输出带水印，并保留原图备份。

4、小米开源7B多模态模型MiMo-VL 推AI管家Miloco

小米在Hugging Face与GitHub同步发布了7B参数多模态大模型‘Xiaomi-MiMo-VL-Miloco-7B-GGUF’，并推出了基于该模型的智能管家‘Xiaomi Miloco’。Miloco能够通过米家摄像头识别用户活动和手势，并自动联动智能家居设备，同时兼容Home Assistant协议。该模型采用非商用开源许可，用户可在配备NVIDIA GPU与Docker环境的Windows或Linux主机一键部署。

【AiBase提要:】

🚀 小米发布7B参数多模态大模型‘Xiaomi-MiMo-VL-Miloco-7B-GGUF’。

💡 智能管家‘Xiaomi Miloco’可识别用户活动及手势，联动智能家居设备。

🔒 模型采用非商用开源许可，支持在NVIDIA GPU与Docker环境下部署。

5、Google Flow集成Nano Banana模型 一键抠图直出视频素材

谷歌为AI电影工具Flow新增图像编辑模块，深度集成Gemini2.5Flash图像模型（代号Nano Banana），支持自然语言一键去背景、主体分离与场景替换，并可直接拖入时间线生成8秒动态镜头。该功能面向Gemini免费版及以上用户开放，定价0.039美元/张，企业级Vertex AI同步上线。

【AiBase提要:】

🔥 集成Gemini2.5Flash图像模型，实现自然语言控制图像编辑。

💡 支持一键去背景、主体分离与场景替换，提升视频制作效率。

🌐 提供API批量接口，目标覆盖短视频、电商海报等高产出场景。

6、新一代多模态 AI DeepEyesV2：智能工具助力超越更大模型

DeepEyesV2是一款由研究人员推出的多模态AI模型，能够分析图像、执行代码并进行网络搜索。它通过智能利用外部工具，在多个任务中表现出色，甚至在某些情况下超越了更大的模型。

【AiBase提要:】

🌟 DeepEyesV2利用智能工具提升多模态任务的表现，超越大型模型。

🔧 采用两阶段训练流程，结合图像理解与工具使用。

📈 在多个基准测试中表现优秀，展现出较小模型的潜力。

详情链接:https://arxiv.org/abs/2511.05271

7、NotebookLM升级支持图像导入 板书秒变可检索知识库

谷歌推出NotebookLM新功能，支持用户上传黑板板书、教科书扫描页或街拍表格，并通过OCR与语义解析实现自然语言检索。该功能面向全平台免费，未来将增加本地处理选项以保护敏感数据。

【AiBase提要:】

📷 支持图像数据源，提升笔记管理效率

🧠 多模态模型识别手写与印刷内容，提取表格结构

🔍 实现图像内容的自然语言检索，增强信息获取能力

8、JetBrains 推出 AI 编码智能体基准测试平台 DPAI Arena

JetBrains 推出了 DPAI Arena，这是首个开放式、多语言、多框架和多工作流的 AI 编码智能体基准测试平台。该平台旨在评估 AI 工具在软件开发中的效率，并支持多种编程语言和工作流程，能够公平、可重复地比较 AI 工具的性能。

【AiBase提要:】

🌟 DPAI Arena 是业内首个开放式 AI 编码智能体基准测试平台，旨在评估 AI 工具在软件开发中的效率。

🛠️ 该平台支持多种编程语言和工作流程，能够公平、可重复地比较 AI 工具的性能。

🤝 JetBrains 计划将该项目交给 Linux Foundation，以促进更广泛的技术指导和未来发展。

详情链接:https://dpaia.dev/

