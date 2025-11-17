欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

1、阿里千问APP公测，与ChatGPT展开全面竞争

阿里巴巴推出的千问APP，基于Qwen3模型，旨在与ChatGPT展开全面竞争。千问APP公测版已在各大应用商店上线，并计划推出国际版。此外，Qwen3-Max的性能已超越GPT5等国际模型，成为全球前三。

2、Gemini Veo 3.1上线多图参考 一次合成三元素视频

谷歌向Gemini Pro/Ultra订阅用户推送Veo 3.1视频模型，新增“Ingredients to Video”模式，支持同时上传三张参考图，分别提取人物、场景与风格特征并融合为8秒1080p视频。该功能提升了视频生成的多样性和质量，同时保持了角色一致性和光影连贯。

3、超级小爱AI大模型“随心修图”上线：一句话秒出大片

小米推出v7.8.50版本的超级小爱更新，新增‘随心修图’功能，用户可通过自然语言指令调用相册AI模型完成自动修图。该功能支持全局多模态交互，可识别屏幕与摄像头画面并执行复杂操作链。

4、小米开源7B多模态模型MiMo-VL 推AI管家Miloco

小米在Hugging Face与GitHub同步发布了7B参数多模态大模型‘Xiaomi-MiMo-VL-Miloco-7B-GGUF’，并推出了基于该模型的智能管家‘Xiaomi Miloco’。Miloco能够通过米家摄像头识别用户活动和手势，并自动联动智能家居设备，同时兼容Home Assistant协议。该模型采用非商用开源许可，用户可在配备NVIDIA GPU与Docker环境的Windows或Linux主机一键部署。

5、Google Flow集成Nano Banana模型 一键抠图直出视频素材

谷歌为AI电影工具Flow新增图像编辑模块，深度集成Gemini2.5Flash图像模型（代号Nano Banana），支持自然语言一键去背景、主体分离与场景替换，并可直接拖入时间线生成8秒动态镜头。该功能面向Gemini免费版及以上用户开放，定价0.039美元/张，企业级Vertex AI同步上线。

6、新一代多模态 AI DeepEyesV2：智能工具助力超越更大模型

DeepEyesV2是一款由研究人员推出的多模态AI模型，能够分析图像、执行代码并进行网络搜索。它通过智能利用外部工具，在多个任务中表现出色，甚至在某些情况下超越了更大的模型。

7、NotebookLM升级支持图像导入 板书秒变可检索知识库

谷歌推出NotebookLM新功能，支持用户上传黑板板书、教科书扫描页或街拍表格，并通过OCR与语义解析实现自然语言检索。该功能面向全平台免费，未来将增加本地处理选项以保护敏感数据。

8、JetBrains 推出 AI 编码智能体基准测试平台 DPAI Arena

JetBrains 推出了 DPAI Arena，这是首个开放式、多语言、多框架和多工作流的 AI 编码智能体基准测试平台。该平台旨在评估 AI 工具在软件开发中的效率，并支持多种编程语言和工作流程，能够公平、可重复地比较 AI 工具的性能。

