首页 > 原创 > 关键词  > AI最新资讯  > 正文

AI日报:美团LongCat-Flash-Omni发布;Qwen3-Max上线深度思考功能;百度“文心”5.0重磅回归

2025-11-03 16:14 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、美团LongCat-Flash-Omni 正式发布,开启全模态实时交互新时代

美团推出的LongCat-Flash-Omni模型在全模态实时交互方面实现了重大突破,采用了最新ScMoE技术,并在多个领域表现出色,为开发者提供了高效的多模态应用场景解决方案。

QQ20251103-102218.png

【AiBase提要:】

🧠 集成高效的多模态感知模块和语音重建模块

🚀 采用Shortcut-Connected MoE技术,实现低延迟的实时音视频交互能力

🌐 支持全模态任务,文本、图像、视频理解及语音感知与生成均表现优异

详情链接:https://huggingface.co/meituan-longcat/LongCat-Flash-Omni

2、阿里通义千问Qwen3-Max 在官网上线深度思考功能

阿里通义千问最新旗舰语言模型Qwen3-Max正式上线了‘深度思考’模式,显著提升了处理复杂任务的效率。该模型参数量突破1万亿,预训练数据达到36T tokens,在多个基准测试中表现出色,展现了强大的推理和编程能力。

【AiBase提要:】

🧠 Qwen3-Max 是阿里通义团队推出的最新旗舰语言模型,参数量突破1万亿。

🔍 新上线的‘深度思考’模式提升了推理链分析与多步骤问题拆解能力。

🏆 Qwen3-Max-Thinking 版本在高难度推理基准测试中实现了100% 的准确率。

3、百度“文心”5.0重磅回归!一键生成漫画、修图、视频,全能AI助手全面升级

文章详细介绍了百度旗下AI助手‘文心’5.0版本的多项功能升级,包括魔法漫画、创意修图、‘放心写’、全模态交互、视频生成与多语种通话等,展示了其作为全能型AI平台的强大能力。

image.png

【AiBase提要:】

🎨 魔法漫画:用户上传照片并输入描述即可生成连贯漫画

🖼️ 创意修图:智能修图引擎支持艺术滤镜和风格迁移

🎥 视频生成:静态图片可转化为动态视频并支持多语种通话

4、云存储加速:百度网盘核心API兼容MCP协议,赋能开发者一键接入

百度网盘通过兼容MCP协议升级其核心API,显著简化了开发者接入流程,并增强了文件管理与检索能力,为云存储行业注入了新的活力。

【AiBase提要:】

📎 百度网盘核心API全面兼容MCP协议,简化开发者接入流程。

🔍 提供高效文件检索功能,支持语义搜索和多种文件操作。

🔄 强化上传方式,满足不同场景下的数据接入需求。

详情链接:https://github.com/baidu-netdisk/mcp

5、OpenAI 开放 Sora2视频工具,面向美国、加拿大、日本和韩国用户

OpenAI宣布取消Sora2的邀请码限制,正式向美国、加拿大、日本和韩国用户开放下载,标志着其首次大规模扩展并进入亚洲市场。同时,为应对资源紧张问题,推出了4美元的“点数包”以增加生成额度,并计划构建“Sora经济”,对版权角色和知名人物的出镜进行按次收费,回应了关于“默认采集”的争议。

【AiBase提要:】

🌍 OpenAI 开放 Sora2视频工具,面向美国、加拿大、日本和韩国用户。

💰 推出4美元 “点数包”,加快商业化进程,并提供额外生成次数。

📜 未来将构建 “Sora 经济”,计划对版权角色和知名人物的出镜进行收费。

6、谷歌CEO确认:Gemini3年内发布,AI Agent能力或成突破口

谷歌首席执行官桑达尔·皮查伊在财报电话会上确认,公司计划在年内推出下一代人工智能模型Gemini3。该模型将着重提升处理复杂、多模态任务的‘智能体’能力,以缩小与OpenAI GPT-5等竞争对手的差距。同时,Alphabet的季度营收首次突破千亿美元,显示出AI技术对业务增长的重要推动作用。

【AiBase提要:】

🚀 Gemini3将专注于提升多模态任务和智能体能力,以增强性能。

💰 Alphabeta的季度营收首次突破千亿美元,AI成为核心增长动力。

🤝 合作深化:Anthropic计划调用100万个谷歌TPU进行模型训练,显示谷歌AI基础设施的吸引力。

7、Siri要翻身了?苹果明年三月推“Apple Intelligence”大改版,竟用上谷歌Gemini!

苹果计划于2026年推出全新一代Siri,引入谷歌Gemini大模型技术,并配合新型智能家居显示屏设备,同时在WWDC上全面展示Apple Intelligence战略,以实现智能跃迁。

【AiBase提要:】

🍎 引入谷歌Gemini大模型技术,提升Siri的网页理解与实时信息检索能力。

🏠 推出新型智能家居显示屏设备,成为家庭AI交互的核心入口。

📅 2026年WWDC将全面集成Apple Intelligence能力,构建端到端的个人智能生态。

8、一句话生成AI Agent!Pokee AI零代码引爆自动化革命,OpenAI和n8n危险了?

Pokee AI通过自然语言指令实现零代码AI Agent开发,极大简化了传统复杂流程,推动自动化革命。

image.png

【AiBase提要:】

🤖 通过自然语言指令创建智能工作流,无需编程技能。

🧠 自研“提示到工作流”引擎支持交互式逻辑预览和调整。

🌐 兼容数千款主流应用,实现跨平台自动化操作。

举报

  • 相关推荐
  • 【AI 智惠季】全模态大模型齐发优惠,GPU新客包月2.8折起

    阿里云启动双十一“AI智慧季”大型优惠活动,聚焦企业多元AI场景落地需求,推出7000万tokens大模型免费体验、GPU新客特惠等政策,助力企业降低开发成本。同时提供标准化AI产品与解决方案,覆盖内容创作、智能客服等高频应用场景,并举办系列技术分享活动,携手企业拥抱AI新时代。

  • 荣耀Magic 8系列上新,火山引擎助力“YOYO助理”多模态升级

    10月15日,荣耀发布搭载全新MagicOS 10系统的Magic8系列手机、MagicPad3 Pro平板及荣耀手表5 Pro等年度旗舰新品。智能语音助手“YOYO助理”升级多模态交互能力,结合火山引擎与豆包大模型技术,支持联网问答、识图、修图、闲陪伴、口语练习、出行规划等场景,提供图文、语音、视频等多种输入输出形式,实现秒级响应与沉浸式交互体验,成为用户“口袋里的万能管家”。

  • 1024数百场活动致敬鸿蒙开发者,鸿蒙如何与开发者“双向奔赴”

    在1024程序员节之际,华为鸿蒙生态发起"星光不负 码向未来"致敬活动,通过全国超百场开发者交流,展现鸿蒙生态的蓬勃活力。目前HarmonyOS 5终端设备数已突破2300万,上架应用超3万款,鸿蒙游戏超1.2万款,近400款政务应用完成鸿蒙适配。华为每年投入超60亿元激励创新,并启动"鸿蒙天工计划"投入10亿元支持AI生态建设。从HarmonyOS 5到HarmonyOS 6,鸿蒙生态正从"破冰"走向深度融合创新,这离不开千万开发者的智慧与汗水。

  • 荣耀年度旗舰上新,火山引擎助力“YOYO助理”多模态智慧再升级

    10月15日,荣耀发布搭载全新MagicOS 10系统的Magic8系列手机、MagicPad3 Pro平板及荣耀手表5 Pro等旗舰新品。智能语音助手“YOYO助理”升级多模态交互能力,支持图文、语音、视频输入及多样化内容输出,结合火山引擎的豆包大模型技术,提供联网问答、智能识图、创意修图、出行规划等场景服务,实现“有问必答、答则精准”的智慧体验,成为用户贴身的“万能管家”。

  • 网易云信10周年宣布品牌升级,从“基础通信管道”到“AI交互引擎”

    10月22日,网易云信在成立十周年之际于北京举办品牌升级及秋季产品发布会,以“Hello,AI‘新’生”为主题,宣布品牌定位升级,并发布智能融合通信能力全景图及一系列AI产品和应用。网易云信旨在通过AI技术重塑融合通信能力边界,从“基础通信管道”向“AI交互落地关键引擎”转型,为千行百业客户交付更显性价值。会上重点展示了情感陪伴Agent、嵌入式实时对话解决方案、协同办公数字员工、AI投标审查助手等细分场景应用,推动AI从功能工具向情感伙伴转型,助力企业沉淀知识库、优化工作流程。此次升级标志着网易云信将更大程度拥抱AI,深化人机协同与价值共创。

  • 如何利用AI搜索引擎实时监测品牌声誉?一文了解AIbase GEO品牌监控新方法

    在AI搜索时代,品牌需关注在ChatGPT等平台的可发现性与声誉表现。传统SEO虽重要,但品牌更需监测AI问答中的提及频率、情感倾向及引用来源,避免被误解或忽视。建议通过专业工具实时追踪关键指标,优化官网与权威内容,主动管理品牌在AI生态中的可见度与信任度。

  • 快手进军AI Coding,开发工具、模型和Maas平台齐登场

    10月23日,快手StreamLake发布全新AI编程产品矩阵,以“工具+模型+平台”三位一体战略布局AI Coding领域。核心产品包括智能开发助手CodeFlicker、自研高性能编码模型KAT-Coder系列及企业级服务平台快手万擎。CodeFlicker提供全流程开发支持,KAT-Coder在权威测试中性能超越GPT-5,平台保障99.95%服务可用性。该生态旨在通过技术普惠,为企业与开发者提供颠覆性研发体验,推动AI编程普及。

  • 霍涛推动开放战略落地,白山云接入快手KAT-Coder赋能开发者

    白山云科技与快手StreamLake合作,在其“白山智算”平台上线闭源编程大模型KAT-Coder。该模型在SWE-Bench测试中解决率达73.4%,性能媲美全球顶尖模型,支持端到端代码生成。白山云通过“顶尖模型能力+全球边缘算力”整合,为开发者提供低于300ms超低延时代码生成服务,仅需一行代码即可调用,大幅降低AI开发门槛。此次合作是白山云完善AI工具链布局的关键一步,未来将持续深化开放协作,优化模型与边缘算力服务模式。

  • RTE&对话式 AI 产品论坛开启报名 探索人机交互的下一代范式

    生成式AI与多模态大模型推动实时互动行业变革,从人人互动迈向人机、人物交互。Convo AI & RTE2025大会将于10月31日在北京举办,聚焦AI与RTE深度融合,设20余场论坛探讨对话式AI场景实践。声网将发布对话引擎2.0及零代码智能体工厂,商汤、MiniMax等企业将分享数字人、语音大模型等创新应用。大会免费报名,扫描文章二维码即可参与。

  • 玄武云通过DCMM三级认证 数据管理能力获国家级权威认可

    玄武云科技(02392.HK)近日通过国家数据管理能力成熟度(DCMM)稳健级(三级)认证。该认证依据国家标准GB/T36073-2018,标志着公司在数据战略、治理、安全、质量等八大能力域达到国家权威标准。公司建立了覆盖数据标准管理、安全管理、质量管理的完整体系,将数据管理融入产品研发与业务流程,为云通信与AI业务发展奠定坚实基础。未来将持续深化数据能力建设,探索数据要素创新应用,助力行业数字化转型。

今日大家都在搜的词: