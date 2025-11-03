首页 > 原创 > 关键词  > AI最新资讯  > 正文

AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功能；百度“文心”5.0重磅回归

2025-11-03

欢迎来到【AI日报】栏目!

1、美团LongCat-Flash-Omni 正式发布，开启全模态实时交互新时代

美团推出的LongCat-Flash-Omni模型在全模态实时交互方面实现了重大突破，采用了最新ScMoE技术，并在多个领域表现出色，为开发者提供了高效的多模态应用场景解决方案。

QQ20251103-102218.png

【AiBase提要:】

🧠 集成高效的多模态感知模块和语音重建模块

🚀 采用Shortcut-Connected MoE技术，实现低延迟的实时音视频交互能力

🌐 支持全模态任务，文本、图像、视频理解及语音感知与生成均表现优异

详情链接:https://huggingface.co/meituan-longcat/LongCat-Flash-Omni

2、阿里通义千问Qwen3-Max 在官网上线深度思考功能

阿里通义千问最新旗舰语言模型Qwen3-Max正式上线了‘深度思考’模式，显著提升了处理复杂任务的效率。该模型参数量突破1万亿，预训练数据达到36T tokens，在多个基准测试中表现出色，展现了强大的推理和编程能力。

【AiBase提要:】

🧠 Qwen3-Max 是阿里通义团队推出的最新旗舰语言模型，参数量突破1万亿。

🔍 新上线的‘深度思考’模式提升了推理链分析与多步骤问题拆解能力。

🏆 Qwen3-Max-Thinking 版本在高难度推理基准测试中实现了100% 的准确率。

3、百度“文心”5.0重磅回归！一键生成漫画、修图、视频，全能AI助手全面升级

文章详细介绍了百度旗下AI助手‘文心’5.0版本的多项功能升级，包括魔法漫画、创意修图、‘放心写’、全模态交互、视频生成与多语种通话等，展示了其作为全能型AI平台的强大能力。

image.png

【AiBase提要:】

🎨 魔法漫画：用户上传照片并输入描述即可生成连贯漫画

🖼️ 创意修图：智能修图引擎支持艺术滤镜和风格迁移

🎥 视频生成：静态图片可转化为动态视频并支持多语种通话

4、云存储加速:百度网盘核心API兼容MCP协议，赋能开发者一键接入

百度网盘通过兼容MCP协议升级其核心API，显著简化了开发者接入流程，并增强了文件管理与检索能力，为云存储行业注入了新的活力。

【AiBase提要:】

📎 百度网盘核心API全面兼容MCP协议，简化开发者接入流程。

🔍 提供高效文件检索功能，支持语义搜索和多种文件操作。

🔄 强化上传方式，满足不同场景下的数据接入需求。

详情链接:https://github.com/baidu-netdisk/mcp

5、OpenAI 开放 Sora2视频工具，面向美国、加拿大、日本和韩国用户

OpenAI宣布取消Sora2的邀请码限制，正式向美国、加拿大、日本和韩国用户开放下载，标志着其首次大规模扩展并进入亚洲市场。同时，为应对资源紧张问题，推出了4美元的“点数包”以增加生成额度，并计划构建“Sora经济”，对版权角色和知名人物的出镜进行按次收费，回应了关于“默认采集”的争议。

【AiBase提要:】

🌍 OpenAI 开放 Sora2视频工具，面向美国、加拿大、日本和韩国用户。

💰 推出4美元 “点数包”，加快商业化进程，并提供额外生成次数。

📜 未来将构建 “Sora 经济”，计划对版权角色和知名人物的出镜进行收费。

6、谷歌CEO确认:Gemini3年内发布，AI Agent能力或成突破口

谷歌首席执行官桑达尔·皮查伊在财报电话会上确认，公司计划在年内推出下一代人工智能模型Gemini3。该模型将着重提升处理复杂、多模态任务的‘智能体’能力，以缩小与OpenAI GPT-5等竞争对手的差距。同时，Alphabet的季度营收首次突破千亿美元，显示出AI技术对业务增长的重要推动作用。

【AiBase提要:】

🚀 Gemini3将专注于提升多模态任务和智能体能力，以增强性能。

💰 Alphabeta的季度营收首次突破千亿美元，AI成为核心增长动力。

🤝 合作深化：Anthropic计划调用100万个谷歌TPU进行模型训练，显示谷歌AI基础设施的吸引力。

7、Siri要翻身了？苹果明年三月推“Apple Intelligence”大改版，竟用上谷歌Gemini！

苹果计划于2026年推出全新一代Siri，引入谷歌Gemini大模型技术，并配合新型智能家居显示屏设备，同时在WWDC上全面展示Apple Intelligence战略，以实现智能跃迁。

【AiBase提要:】

🍎 引入谷歌Gemini大模型技术，提升Siri的网页理解与实时信息检索能力。

🏠 推出新型智能家居显示屏设备，成为家庭AI交互的核心入口。

📅 2026年WWDC将全面集成Apple Intelligence能力，构建端到端的个人智能生态。

8、一句话生成AI Agent！Pokee AI零代码引爆自动化革命，OpenAI和n8n危险了？

Pokee AI通过自然语言指令实现零代码AI Agent开发，极大简化了传统复杂流程，推动自动化革命。

image.png

【AiBase提要:】

🤖 通过自然语言指令创建智能工作流，无需编程技能。

🧠 自研“提示到工作流”引擎支持交互式逻辑预览和调整。

🌐 兼容数千款主流应用，实现跨平台自动化操作。

