欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
新鲜AI产品点击了解:https://app.aibase.com/zh
1、美团LongCat-Flash-Omni 正式发布,开启全模态实时交互新时代
美团推出的LongCat-Flash-Omni模型在全模态实时交互方面实现了重大突破,采用了最新的ScMoE技术,并在多个领域表现出色,为开发者提供了高效的多模态应用场景解决方案。

【AiBase提要:】
🧠 集成高效的多模态感知模块和语音重建模块
🚀 采用Shortcut-Connected MoE技术,实现低延迟的实时音视频交互能力
🌐 支持全模态任务,文本、图像、视频理解及语音感知与生成均表现优异
详情链接:https://huggingface.co/meituan-longcat/LongCat-Flash-Omni
2、阿里通义千问Qwen3-Max 在官网上线深度思考功能
阿里通义千问最新旗舰语言模型Qwen3-Max正式上线了‘深度思考’模式,显著提升了处理复杂任务的效率。该模型参数量突破1万亿,预训练数据达到36T tokens,在多个基准测试中表现出色,展现了强大的推理和编程能力。
【AiBase提要:】
🧠 Qwen3-Max 是阿里通义团队推出的最新旗舰语言模型,参数量突破1万亿。
🔍 新上线的‘深度思考’模式提升了推理链分析与多步骤问题拆解能力。
🏆 Qwen3-Max-Thinking 版本在高难度推理基准测试中实现了100% 的准确率。
3、百度“文心”5.0重磅回归!一键生成漫画、修图、视频,全能AI助手全面升级
文章详细介绍了百度旗下AI助手‘文心’5.0版本的多项功能升级,包括魔法漫画、创意修图、‘放心写’、全模态交互、视频生成与多语种通话等,展示了其作为全能型AI平台的强大能力。

【AiBase提要:】
🎨 魔法漫画:用户上传照片并输入描述即可生成连贯漫画
🖼️ 创意修图:智能修图引擎支持艺术滤镜和风格迁移
🎥 视频生成:静态图片可转化为动态视频并支持多语种通话
4、云存储加速:百度网盘核心API兼容MCP协议,赋能开发者一键接入
百度网盘通过兼容MCP协议升级其核心API,显著简化了开发者接入流程,并增强了文件管理与检索能力,为云存储行业注入了新的活力。
【AiBase提要:】
📎 百度网盘核心API全面兼容MCP协议,简化开发者接入流程。
🔍 提供高效文件检索功能,支持语义搜索和多种文件操作。
🔄 强化上传方式,满足不同场景下的数据接入需求。
详情链接:https://github.com/baidu-netdisk/mcp
5、OpenAI 开放 Sora2视频工具,面向美国、加拿大、日本和韩国用户
OpenAI宣布取消Sora2的邀请码限制,正式向美国、加拿大、日本和韩国用户开放下载,标志着其首次大规模扩展并进入亚洲市场。同时,为应对资源紧张问题,推出了4美元的“点数包”以增加生成额度,并计划构建“Sora经济”,对版权角色和知名人物的出镜进行按次收费,回应了关于“默认采集”的争议。
【AiBase提要:】
🌍 OpenAI 开放 Sora2视频工具,面向美国、加拿大、日本和韩国用户。
💰 推出4美元 “点数包”,加快商业化进程,并提供额外生成次数。
📜 未来将构建 “Sora 经济”,计划对版权角色和知名人物的出镜进行收费。
6、谷歌CEO确认:Gemini3年内发布,AI Agent能力或成突破口
谷歌首席执行官桑达尔·皮查伊在财报电话会上确认,公司计划在年内推出下一代人工智能模型Gemini3。该模型将着重提升处理复杂、多模态任务的‘智能体’能力,以缩小与OpenAI GPT-5等竞争对手的差距。同时,Alphabet的季度营收首次突破千亿美元,显示出AI技术对业务增长的重要推动作用。
【AiBase提要:】
🚀 Gemini3将专注于提升多模态任务和智能体能力,以增强性能。
💰 Alphabeta的季度营收首次突破千亿美元,AI成为核心增长动力。
🤝 合作深化:Anthropic计划调用100万个谷歌TPU进行模型训练,显示谷歌AI基础设施的吸引力。
7、Siri要翻身了?苹果明年三月推“Apple Intelligence”大改版,竟用上谷歌Gemini!
苹果计划于2026年推出全新一代Siri,引入谷歌Gemini大模型技术,并配合新型智能家居显示屏设备,同时在WWDC上全面展示Apple Intelligence战略,以实现智能跃迁。
【AiBase提要:】
🍎 引入谷歌Gemini大模型技术,提升Siri的网页理解与实时信息检索能力。
🏠 推出新型智能家居显示屏设备,成为家庭AI交互的核心入口。
📅 2026年WWDC将全面集成Apple Intelligence能力,构建端到端的个人智能生态。
8、一句话生成AI Agent!Pokee AI零代码引爆自动化革命,OpenAI和n8n危险了?
Pokee AI通过自然语言指令实现零代码AI Agent开发,极大简化了传统复杂流程,推动自动化革命。

【AiBase提要:】
🤖 通过自然语言指令创建智能工作流,无需编程技能。
🧠 自研“提示到工作流”引擎支持交互式逻辑预览和调整。
🌐 兼容数千款主流应用,实现跨平台自动化操作。
(举报)
