AI日报：谷歌推AI全家桶Google AI Ultra；腾讯混元宣布模型矩阵全面升级；豆包·语音播客模型发布

2025-05-21 15:54 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、每月249.99美元!谷歌推出 AI Ultra 订阅计划，畅享最强大 AI 模型与高级功能

谷歌推出了全新的 AI Ultra 订阅计划，提供最高级别的 AI 模型访问和丰富的高级功能，适合电影制作人、开发者及创意专业人士。计划包含最新的 Gemini 应用、Flow 工具、30TB 存储空间等，订阅费用为每月249.99美元。

【AiBase提要:】
🌟 提供最高级别的 AI 模型访问和丰富的高级功能，适合追求最佳 AI 体验的用户。
🎥 Flow 工具支持高质量视频生成，掌握高级摄影控制并体验 Veo3功能。
💾 提供30TB 存储空间，确保用户创作和文件的安全性。
详情链接:https://blog.google/products/google-one/google-ai-ultra/

2、腾讯混元宣布模型矩阵全面升级，新推视觉推理模型T1-Vision和语音通话模型混元Voice

腾讯混元全面升级其模型矩阵，推出T1-Vision和混元Voice等新模型，TurboS在国际评测中表现优异，多模态技术取得新进展，同时推动开源技术发展。

【AiBase提要:】
🚀 混元推出T1-Vision和混元Voice，增强视觉和语音处理能力。
🏆 TurboS模型在全球评测中跻身前八，理科推理能力提升超10%。
🌐 腾讯混元开源多模态技术，支持行业创新与合作伙伴发展。

3、美图与阿里巴巴达成战略合作获得2.5亿美元投资

美图公司与阿里巴巴达成战略合作，阿里巴巴通过可转债形式投资2.5亿美元，双方将在电商、AI技术、云计算等领域展开深度合作。

【AiBase提要:】
阿里巴巴以可转债形式投资美图2.5亿美元，助力其AI技术和电商业务发展。
美图与阿里巴巴将在电商工具开发及云服务采购上深化合作，提升商家运营效率。
合作需满足政府审批条件，旨在推动技术创新和业务增长。

4、豆包·语音播客模型发布将在豆包APP及PC端、扣子等上线

火山引擎推出的豆包·语音播客模型通过流式模型构建，实现了文本到播客的快速转化，带来高效、互动性强的创作体验。

【AiBase提要:】
🌟对话自然流畅，模拟真人播客口语习惯，提升听感真实度。
⚡端到端便捷链路，从创作到成品仅需秒级时间，极大提高效率。
🔍支持深度搜索与超长文本转播客，随时紧跟热点并丰富内容。

5、百度文心 X1Turbo 大放异彩，斩获信通院最高评级!

百度文心大模型 X1Turbo 在信通院评估中获国内首个“4+ 级”最高评级，展示出卓越的技术实力。

【AiBase提要:】
🚀 文心 X1Turbo 在24项能力评估中表现突出，16项能力满分，特别是在逻辑推理和代码推理方面。
🌟 基于文心大模型4.5升级，X1Turbo 性能更强、成本更低，且安全可靠度得到认可。
🌐 百度在AI技术研发中持续创新，X1Turbo 的成功标志着国内AI技术的重要突破。

6、谷歌发布Flow AI剪辑工具:Veo3与 Imagen4驱动、镜头控制与场景扩展

在2025年的Google I/O开发者大会上，谷歌推出了面向影视创作者的全新AI剪辑工具Flow，集成了Veo3、Imagen4和Gemini三大AI模型，通过自然语言提示和模块化工作流简化视频创作过程，为专业人士和初学者提供电影级视觉叙事能力。

【AiBase提要:】
🎥 Flow整合Veo3、Imagen4和Gemini，通过简单文本提示生成高质量AI视频片段，支持角色对话和环境音效。
🎥 Scenebuilder与Camera Controls功能赋予创作者对视频片段的无缝编辑和镜头控制能力。
🎥 内置Asset Management与Flow TV平台，优化素材管理和提供学习资源，助力创意社区发展。
详情链接:https://labs.google/flow/about

7、从文本到电影!谷歌Veo3震撼发布:4K画质、音视频一体生成

谷歌发布的Veo3视频生成模型，不仅支持音视频一体化生成，还具备超高分辨率和多样化风格支持，为创作者提供强大工具的同时，也强调了安全性与责任性。

【AiBase提要:】
🎥 Veo3可同时生成高清视频与匹配音频，简化创作流程，物理模拟和口型同步效果出色。
🌍 支持4K分辨率，捕捉细微描述，适应多种风格需求，适合专业及教育领域使用。
🔒 仅限特定用户开放，集成安全功能如数字水印与筛选器，未来将扩展应用场景。

8、谷歌Imagen4图像模型震撼发布:2K画质与精准文本渲染重塑AI创作

谷歌推出了最新一代图像生成模型Imagen4，具有超高分辨率、精准文本渲染和多种风格支持，为创作者提供强大工具。

【AiBase提要:】
✨超高分辨率与细节表现力:支持2K分辨率，细节捕捉显著提升，满足专业设计需求。
🌟改进的文本渲染与风格多样性:生成清晰文字，支持多种艺术风格，扩展创作者表达空间。
🚀快速生成模式与生态整合:速度提升10倍，集成多个平台，确保内容可追溯，降低误用风险。

9、谷歌Gemini2.5Pro Deep Think发布:并行推理重塑AI复杂问题解决

谷歌DeepMind在2025年Google I/O开发者大会上推出Gemini2.5Pro Deep Think模式，采用并行推理技术，大幅提升数学、编码和多模态推理能力，支持开发者灵活调整推理质量和成本。

【AiBase提要:】
💎 Deep Think模式通过并行推理技术，显著提升复杂任务表现，如数学、编码和多模态推理。
⚙️ 引入思考预算功能，开发者可平衡响应质量、延迟和成本，适应不同场景需求。
🔒 当前仅对受信任测试者开放，未来几周将逐步扩展至更广泛的应用领域。

10、谷歌虚拟试衣间重磅上线!上传照片秒变时尚模特，AI一键比价+自动下单

谷歌在I/O2025大会上推出了全新的AI虚拟试衣工具，用户上传照片即可快速生成逼真的穿搭效果图，同时支持多条件搜索、比价分析和自动下单，极大提升了在线购物的个性化和便利性。

【AiBase提要:】
✨ 使用AI虚拟试衣工具，上传照片后几秒内就能生成逼真的穿搭效果图，体验高度个性化。
🔍 集成多条件搜索、实时比价和自动下单功能，简化购物流程，提升购物效率。
🌍 基于Gemini2.5和Shopping Graph技术，精准捕捉服装细节，支持多种体型和品牌。

11、谷歌公测AI编码助手Jules:Gemini2.5Pro驱动，挑战OpenAI的Codex

谷歌推出的AI编码助手Jules进入全球公测阶段，基于Gemini2.5Pro模型，通过异步任务处理和GitHub集成提升开发者效率，透明工作流和免费配额吸引用户，未来扩展潜力巨大。

【AiBase提要:】
🌟 异步任务处理与GitHub无缝集成，修复Bug、编写测试等任务自动化。
📝 透明工作流，生成详细计划和代码变更差异，确保代码质量与团队规范。
🚀 支持Python和JavaScript，未来扩展至更多语言，挑战OpenAI Codex和GitHub Co pilot。
详情链接:https://jules.google/

12、苹果计划在 iOS19中向第三方开发者开放 AI 模型

苹果计划在 iOS19中向第三方开发者开放其 AI 模型，促进应用创新并增强硬件吸引力。初期将开放能在本地设备上运行的小型 AI 模型，开发者可通过新工具包利用 Apple Intelligence 创建新功能。

【AiBase提要:】
🍎 苹果计划在 iOS19中开放 AI 模型，推动应用创新与硬件吸引力提升。
💻 开发者可利用 Apple Intelligence 创建新功能，初期仅开放本地小型 AI 模型。
🌟 苹果目标是通过简化开发流程，将操作系统打造成 AI 软件平台的核心。

13、京东云宣布五大AI营销产品限时免费，助力商家提升销售效率

京东推出五大AI营销产品，包括数字人直播、商家客服智能体、商品图生成服务、视频混剪平台等，免费提供给商家，以提升销售效率和运营能力。

【AiBase提要:】
🌟 京东免费推出五大AI营销产品，助力商家提升销售效率。
🤖 数字人直播可全天候带货，降低直播成本，提高转化率。
📸 京点点平台和视频混剪工具助力商家优化图文和视频营销。

14、字节跳动开源多模态模型 BAGEL:图文生成与编辑的新突破

字节跳动发布了一款名为BAGEL的开源多模态基础模型，拥有70亿个活跃参数，整体参数量达到140亿。该模型在多模态理解、文本到图像生成、图像编辑等方面表现出色，采用了混合变换器专家（MoT）架构，并通过多模态预训练实现了持续性能提升。

【AiBase提要:】
🌟 BAGEL 是一款开源多模态基础模型，拥有70亿个活跃参数，超越多项标准基准测试。
🖼️ 该模型在图像生成和编辑任务中表现出色，能够进行自由形式的图像编辑和世界导航。
📈 通过多模态预训练，BAGEL 展示了持续的性能提升，适应了复杂的多模态推理任务。
详情链接:https://huggingface.co/ByteDance-Seed/BAGEL-7B-MoT

15、英伟达推出新型模型 Cosmos-Reason1，让 AI 更好理解物理世界

英伟达发布的Cosmos-Reason1系列模型，通过物理AI监督微调和强化学习提升AI在物理常识和具身推理上的能力，为机器人和自动驾驶领域带来新可能。

【AiBase提要:】
🌟 英伟达发布Cosmos-Reason1系列模型，增强AI在物理推理中的能力。
🤖 采用双本体系统，结合视频和文本数据进行同步推理。
📈 在物理常识和具身推理基准测试中表现优异。
详情链接:https://github.com/nvidia-cosmos/cosmos-reason1

（举报）

相关推荐

关键词：

享受专属赛道体验服务！雷军：小米Ultra Club对所有Ultra车主开放

小米汽车今日宣布，小米Ultra Club面向所有Ultra车主开放入会。车主入会后可享：赛道服务、赛道专场体验、官方专属活动及专属顾问1对1服务。目前赛道服务已覆盖12个城市，车主们可结合自身需求选择加入。

小米汽车 Ultra Club
厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

10月28日，麒麟信安人工智能孵化器在长沙启动，旨在汇聚AI领域人才、技术与资本，构建开放协同的创新生态。该项目获湖南省多部门支持，已吸引60余个项目入围，组建了首批30余位专家导师团，并与多家顶尖机构共建联合体，通过政策扶持、资本对接等多维度赋能，培育优质AI项目在湘落地发展，助力区域打造人工智能产业创新高地。

人工智能孵化器麒麟信安创新创业
卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力，近日正式加入中国人工智能产业发展联盟（AIIA），成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可，未来将携手联盟推动AI技术研发与产业化，助力中国品牌全球化。依托八年积累的海量电商数据与算法体系，卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案，服务超百万跨境卖家，显著提升运营效率与决策精准度。

人工智能跨境电商 AI大数据
共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

10月28日，AtomGit平台在北京国家会议中心举行升级发布会，正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞，强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源，打造开放中立的基础设施，计划于11月21日正式上线。华为、百度等企业代表分享了开源实践，多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

开源社区人工智能 AtomGit
人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划
京东双十一开门红捷报：酷省电Ultra销量强势破万

2025年双十一期间，美的空调凭借强劲市场表现持续领跑行业。其酷省电系列产品销量破万，无风感、全面风等创新技术实现口碑与销量双增长。背后支撑是长期研发投入，近五年累计超180亿元，转化为80项国际领先科技成果。三季报显示集团营收3647亿元，净利润率提升至10.6%。面对消费决策转向体系化趋势，美的构建“科技创新+技术分层+服务保障”三位一体价值体系，通过差

美的空调双十一大促科技创新
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲，强调高质量数据集是人工智能产业决胜关键。他指出，算力、算法和数据构成AI三大要素，而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施，通过集中管理、分散赋能模式，打通数据采集、治理到AI训练全链路，推动产业智能化升级。该平台已在制造、金融等领域落地，助力企业释放数据要素价值，实现弯道超车。

人工智能数据基础设施数字经济
小米17 Ultra提供双版本：顶配版独占双卫星通信

小米14 Ultra已备案两个版本，型号分别为2512BPNDAC和2512BSPNA1C，全系支持UWB。高配版搭载双卫星通信技术，支持天通一号卫星通话及北斗短报文，可在无地面网络时保持通信。工业设计采用1.5K直屏与超级像素新国屏，后置5000万超大底主摄及2亿像素潜望长焦，支持长焦微距。搭载骁龙8 Gen3平台，支持无线充电、IP68防水，配备大容量金沙江电池，预计春节前发布。

小米17 Ultra 卫星通话
小米最强旗舰！小米17 Ultra春节前登场

博主爆料小米14 Ultra春节前将发布，已获入网许可。该机搭载1.5K新国屏、骁龙8 Gen3平台，影像系统采用无背屏设计，配备1英寸超大底主摄+2亿像素潜望长焦，支持双卫星通信。卢伟冰透露小米与徕卡四年合作推出20余款机型，称新机将突破移动影像新高度。

小米17 Ultra 影像旗舰
口碑验证产品力，权益彰显诚意！问界新M5 Ultra销量稳居高位

问界新M5 Ultra在竞争激烈的智能SUV市场表现亮眼：4月销量突破4000辆后，5-8月持续稳居高位，成为年度黑马。其搭载的HUAWEI ADS智能驾驶系统获用户好评，通勤时能线性减速、预判路况，长途自驾更显轻松。跃影红配色搭配运动套件吸引年轻群体，被称作“移动的荷尔蒙”。安全方面配备多项主动防护系统，车身采用超60%高强度钢。购车权益价值高达37000元，涵盖智能驾驶升级与选配补贴，性价比突出。当前稳健销量印证产品实力，预计在金九银十旺季将实现新突破。

今日大家都在搜的词：

热文

3 天
7天

AI日报：谷歌推AI全家桶Google AI Ultra；腾讯混元宣布模型矩阵全面升级；豆包·语音播客模型发布

享受专属赛道体验服务！雷军：小米Ultra Club对所有Ultra车主开放

厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

人工智能巨头OpenAI拟上市估值或高达1万亿美元

京东双十一开门红捷报：酷省电Ultra销量强势破万

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

小米17 Ultra提供双版本：顶配版独占双卫星通信

小米最强旗舰！小米17 Ultra春节前登场

口碑验证产品力，权益彰显诚意！问界新M5 Ultra销量稳居高位

今日大家都在搜的词：

热文

特斯拉Cybercab不配备方向盘和踏板预计2026年二季度下线

AI日报：美团LongCat-Flash-Omni发布；Qwen3-Max上线深度思考功

DeepSeek崩了上热搜页面显示“服务器繁忙”

OPPO ColorOS 16正式版11月升级机型公布：支持23款机型

何小鹏：小鹏X9超级增程是全球续航最长的大七座车

鸿蒙HarmonyOS 6与iOS数据互传功能预计12月上线

真我GT8 Pro阿斯顿马丁F1限量版将于11月10日正式开售

真我GT8 Pro阿斯顿马丁F1限量版外观公布

卢伟冰评Air手机：大胆创新但极致薄牺牲用户体验

OPPO ColorOS 16正式版推送：首批适配11款机型

AI日报：可复刻音色的MiniMax Speech 2.6发布；TikTok推AI剪辑

微信升级：支持一次撤回全部消息、删好友能保留聊天记录等功能

AI日报：Sora免费额度要缩水；月之暗面发布Kimi Linear架构；C

苹果客服回应iPhone或自动拨号：设置或其他问题

vivo OriginOS 6启动公测招募：支持10款机型

魅族22月白天青配色发布：2999元起

小米随身蓝牙音箱曜石黑配色版本开售：售价299元

iQOO Neo11开售2小时销量超前代全天

REDMI官方：REDMI K90超级像素新国屏比2K屏更强

站长商机