首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:谷歌推AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

2025-05-21 15:54 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、每月249.99美元!谷歌推出 AI Ultra 订阅计划,畅享最强大 AI 模型与高级功能

谷歌推出了全新的 AI Ultra 订阅计划,提供最高级别的 AI 模型访问和丰富的高级功能,适合电影制作人、开发者及创意专业人士。计划包含最新的 Gemini 应用、Flow 工具、30TB 存储空间等,订阅费用为每月249.99美元。

image.png

【AiBase提要:】

🌟 提供最高级别的 AI 模型访问和丰富的高级功能,适合追求最佳 AI 体验的用户。

🎥 Flow 工具支持高质量视频生成,掌握高级摄影控制并体验 Veo3功能。

💾 提供30TB 存储空间,确保用户创作和文件的安全性。

详情链接:https://blog.google/products/google-one/google-ai-ultra/

2、腾讯混元宣布模型矩阵全面升级,新推视觉推理模型T1-Vision和语音通话模型混元Voice

腾讯混元全面升级其模型矩阵,推出T1-Vision和混元Voice等新模型,TurboS在国际评测中表现优异,多模态技术取得新进展,同时推动开源技术发展。

image.png

【AiBase提要:】

🚀 混元推出T1-Vision和混元Voice,增强视觉和语音处理能力。

🏆 TurboS模型在全球评测中跻身前八,理科推理能力提升超10%。

🌐 腾讯混元开源多模态技术,支持行业创新与合作伙伴发展。

3、美图与阿里巴巴达成战略合作 获得2.5亿美元投资

美图公司与阿里巴巴达成战略合作,阿里巴巴通过可转债形式投资2.5亿美元,双方将在电商、AI技术、云计算等领域展开深度合作。

【AiBase提要:】

阿里巴巴以可转债形式投资美图2.5亿美元,助力其AI技术和电商业务发展。

美图与阿里巴巴将在电商工具开发及云服务采购上深化合作,提升商家运营效率。

合作需满足政府审批条件,旨在推动技术创新和业务增长。

4、豆包·语音播客模型发布将在豆包APP及PC端、扣子等上线

火山引擎推出的豆包·语音播客模型通过流式模型构建,实现了文本到播客的快速转化,带来高效、互动性强的创作体验。

image.png

【AiBase提要:】

🌟对话自然流畅,模拟真人播客口语习惯,提升听感真实度。

⚡端到端便捷链路,从创作到成品仅需秒级时间,极大提高效率。

🔍支持深度搜索与超长文本转播客,随时紧跟热点并丰富内容。

5、百度文心 X1Turbo 大放异彩,斩获信通院最高评级!

百度文心大模型 X1Turbo 在信通院评估中获国内首个“4+ 级”最高评级,展示出卓越的技术实力。

image.png

【AiBase提要:】

🚀 文心 X1Turbo 在24项能力评估中表现突出,16项能力满分,特别是在逻辑推理和代码推理方面。

🌟 基于文心大模型4.5升级,X1Turbo 性能更强、成本更低,且安全可靠度得到认可。

🌐 百度在AI技术研发中持续创新,X1Turbo 的成功标志着国内AI技术的重要突破。

6、谷歌发布Flow AI剪辑工具:Veo3与 Imagen4驱动、镜头控制与场景扩展

在2025年的Google I/O开发者大会上,谷歌推出了面向影视创作者的全新AI剪辑工具Flow,集成了Veo3、Imagen4和Gemini三大AI模型,通过自然语言提示和模块化工作流简化视频创作过程,为专业人士和初学者提供电影级视觉叙事能力。

image.png

【AiBase提要:】

🎥 Flow整合Veo3、Imagen4和Gemini,通过简单文本提示生成高质量AI视频片段,支持角色对话和环境音效。

🎥 Scenebuilder与Camera Controls功能赋予创作者对视频片段的无缝编辑和镜头控制能力。

🎥 内置Asset Management与Flow TV平台,优化素材管理和提供学习资源,助力创意社区发展。

详情链接:https://labs.google/flow/about

7、从文本到电影!谷歌Veo3震撼发布:4K画质、音视频一体生成

谷歌发布的Veo3视频生成模型,不仅支持音视频一体化生成,还具备超高分辨率和多样化风格支持,为创作者提供强大工具的同时,也强调了安全性与责任性。

【AiBase提要:】

🎥 Veo3可同时生成高清视频与匹配音频,简化创作流程,物理模拟和口型同步效果出色。

🌍 支持4K分辨率,捕捉细微描述,适应多种风格需求,适合专业及教育领域使用。

🔒 仅限特定用户开放,集成安全功能如数字水印与筛选器,未来将扩展应用场景。

8、谷歌Imagen4图像模型震撼发布:2K画质与精准文本渲染重塑AI创作

谷歌推出了最新一代图像生成模型Imagen4,具有超高分辨率、精准文本渲染和多种风格支持,为创作者提供强大工具。

image.png

【AiBase提要:】

✨超高分辨率与细节表现力:支持2K分辨率,细节捕捉显著提升,满足专业设计需求。

🌟改进的文本渲染与风格多样性:生成清晰文字,支持多种艺术风格,扩展创作者表达空间。

🚀快速生成模式与生态整合:速度提升10倍,集成多个平台,确保内容可追溯,降低误用风险。

9、谷歌Gemini2.5Pro Deep Think发布:并行推理重塑AI复杂问题解决

谷歌DeepMind在2025年Google I/O开发者大会上推出Gemini2.5Pro Deep Think模式,采用并行推理技术,大幅提升数学、编码和多模态推理能力,支持开发者灵活调整推理质量和成本。

【AiBase提要:】

💎 Deep Think模式通过并行推理技术,显著提升复杂任务表现,如数学、编码和多模态推理。

⚙️ 引入思考预算功能,开发者可平衡响应质量、延迟和成本,适应不同场景需求。

🔒 当前仅对受信任测试者开放,未来几周将逐步扩展至更广泛的应用领域。

10、谷歌虚拟试衣间重磅上线!上传照片秒变时尚模特,AI一键比价+自动下单

谷歌在I/O2025大会上推出了全新的AI虚拟试衣工具,用户上传照片即可快速生成逼真的穿搭效果图,同时支持多条件搜索、比价分析和自动下单,极大提升了在线购物的个性化和便利性。

image.png

【AiBase提要:】

✨ 使用AI虚拟试衣工具,上传照片后几秒内就能生成逼真的穿搭效果图,体验高度个性化。

🔍 集成多条件搜索、实时比价和自动下单功能,简化购物流程,提升购物效率。

🌍 基于Gemini2.5和Shopping Graph技术,精准捕捉服装细节,支持多种体型和品牌。

11、谷歌公测AI编码助手Jules:Gemini2.5Pro驱动,挑战OpenAI的Codex

谷歌推出的AI编码助手Jules进入全球公测阶段,基于Gemini2.5Pro模型,通过异步任务处理和GitHub集成提升开发者效率,透明工作流和免费配额吸引用户,未来扩展潜力巨大。

image.png

【AiBase提要:】

🌟 异步任务处理与GitHub无缝集成,修复Bug、编写测试等任务自动化。

📝 透明工作流,生成详细计划和代码变更差异,确保代码质量与团队规范。

🚀 支持Python和JavaScript,未来扩展至更多语言,挑战OpenAI Codex和GitHub Co pilot。

详情链接:https://jules.google/

12、苹果计划在 iOS19中向第三方开发者开放 AI 模型

苹果计划在 iOS19中向第三方开发者开放其 AI 模型,促进应用创新并增强硬件吸引力。初期将开放能在本地设备上运行的小型 AI 模型,开发者可通过新工具包利用 Apple Intelligence 创建新功能。

【AiBase提要:】

🍎 苹果计划在 iOS19中开放 AI 模型,推动应用创新与硬件吸引力提升。

💻 开发者可利用 Apple Intelligence 创建新功能,初期仅开放本地小型 AI 模型。

🌟 苹果目标是通过简化开发流程,将操作系统打造成 AI 软件平台的核心。

13、京东云宣布五大AI营销产品限时免费,助力商家提升销售效率

京东推出五大AI营销产品,包括数字人直播、商家客服智能体、商品图生成服务、视频混剪平台等,免费提供给商家,以提升销售效率和运营能力。

【AiBase提要:】

🌟 京东免费推出五大AI营销产品,助力商家提升销售效率。

🤖 数字人直播可全天候带货,降低直播成本,提高转化率。

📸 京点点平台和视频混剪工具助力商家优化图文和视频营销。

14、字节跳动开源多模态模型 BAGEL:图文生成与编辑的新突破

字节跳动发布了一款名为BAGEL的开源多模态基础模型,拥有70亿个活跃参数,整体参数量达到140亿。该模型在多模态理解、文本到图像生成、图像编辑等方面表现出色,采用了混合变换器专家(MoT)架构,并通过多模态预训练实现了持续性能提升。

【AiBase提要:】

🌟 BAGEL 是一款开源多模态基础模型,拥有70亿个活跃参数,超越多项标准基准测试。

🖼️ 该模型在图像生成和编辑任务中表现出色,能够进行自由形式的图像编辑和世界导航。

📈 通过多模态预训练,BAGEL 展示了持续的性能提升,适应了复杂的多模态推理任务。

详情链接:https://huggingface.co/ByteDance-Seed/BAGEL-7B-MoT

15、英伟达推出新型模型 Cosmos-Reason1,让 AI 更好理解物理世界

英伟达发布的Cosmos-Reason1系列模型,通过物理AI监督微调和强化学习提升AI在物理常识和具身推理上的能力,为机器人和自动驾驶领域带来新可能。

image.png

【AiBase提要:】

🌟 英伟达发布Cosmos-Reason1系列模型,增强AI在物理推理中的能力。

🤖 采用双本体系统,结合视频和文本数据进行同步推理。

📈 在物理常识和具身推理基准测试中表现优异。

详情链接:https://github.com/nvidia-cosmos/cosmos-reason1

举报

  • 相关推荐
  • 谷歌推出 250 美元的 AI Ultra 套餐,重新定义“高端”

    谷歌或许想把 AI Ultra 打造成一个精英创作者工具包,但它也可能正在重新定义“高端”:只是贵而已……

  • AI日报:腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

    本文介绍了AI领域最新动态:1)腾讯开源混元3D2.1大模型,提升3D生成质量;2)OpenAI Codex升级,优化代码生成功能;3)字节跳动AI Lab负责人李航卸任;4)微软发布700个AI应用案例;5)微软推出Code Researcher工具,解决58%系统崩溃问题;6)Observer AI实现屏幕操作自动化;7)Genspark发布AI浏览器;8)麻省理工用AI技术3.5小时修复15世纪名画;9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni;10)MagicTryOn视频换衣框架;11)字节跳动发布实时互动AI视频生成模型Seaweed APT2;12)ChatGPT搜索功能升级;13)字节跳动与老凤祥合作开发AI智能眼镜。

  • 三筒!明牌! 海信棉花糖Ultra全家筒开启洗衣“空间自由”时代

    海信洗衣机推出三筒系列新品,满足消费者对分区洗护的健康需求。5月30日,海信在青岛发布"棉花糖Ultra全家筒"系列,包含旗舰版、轻享版和青春版三款产品。旗舰版是全球首款4合1热泵洗烘一体机,支持13kg洗涤+9kg热泵烘干,配备双mini筒独立洗烘;轻享版搭载专利活水洗4.0技术,毛屑去除率达90%;青春版主打高性价比基础分区洗护。产品通过物理分区方式解决母婴、�

  • iQOO 15 Ultra首曝:首款骁龙8 Elite 2 Ultra旗舰

    iQOO将于年底推出iQOO 15系列旗舰手机,包含标准版和Ultra版。iQOO 15 Ultra将采用2K LIPO直屏,首批搭载骁龙8 Elite 2平台,配备潜望长焦镜头,支持无线充电和IP68防尘防水。相比上代,Ultra版回归直屏设计,新增主动散热风扇和潜望长焦,影像和性能大幅提升。采用全新LIPO封装工艺,通过优化显示驱动芯片和电路布局,大幅收窄边框。LIPO技术采用高密度连接设计,减少信号传输通道数量和长度,在保证信号稳定性的同时缩小边框宽度。iQOO 15 Pro预计10月亮相,将成为行业首款骁龙8 Elite 2 Ultra旗舰机型。

  • AI触控云台浩瀚V3 Ultra发布,首发AI多模态追踪模块,定义手机云台轻旗舰标准!

    6月6日,浩翰V3 Ultra智能影像稳定器正式发布。作为旗舰级产品,它搭载行业首创AI多模态万物原生跟拍技术,支持10米远程触控彩屏、AI可视化构图、360°无死角跟拍及三轴稳拍等功能。新品采用第九代iSteady增稳系统,折叠后体积小巧便携。配备22英寸触控彩屏,支持5米手势控制和隔空补光功能。售价999元起,同步推出含无线麦克风的创作者套装。浩翰深耕稳定器行业11年,产�

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • AI日报:Midjourney重磅推出视频生成模型V1;OpenAI将在今年夏季发布GPT-5;谷歌推Search Live语音搜索功能

    本期AI日报聚焦多项AI领域重要进展:1) Midjourney推出首款视频生成模型V1,支持21秒视频生成;2) OpenAI CEO确认GPT-5将于今夏发布;3) Google上线语音对话搜索功能Search Live;4) OpenAI开源客户服务代理框架;5) MiniMax发布智能代理Agent;6) 恶意工具WormGPT出现新变种;7) OpenAI推出企业版ChatGPT折扣;8) DeepSite V2支持3D网页动画生成;9) AI工具可秒变PPT;10) 比亚迪与字节跳动合作开发动力电池技术;11) 马斯克否认xAI巨额亏损传闻。

  • 迎接颠覆性创新 Ultra新篇章即将展开

    三星Galaxy系列以用户需求为核心,通过折叠屏设计、AI技术和专业级相机等创新功能,打造颠覆性体验。新品Galaxy Ultra整合行业领先硬件配置,优化折叠屏形态下的AI应用,满足用户对轻薄便携和高效办公的需求。产品亮点包括:1)折叠状态下可作为高效办公平台;2)AI语音助手实现智能推荐和信息处理;3)专业摄影系统捕捉精彩瞬间;4)多任务处理提升工作效率。这些创新功能均由专为折叠屏优化的Galaxy AI深度赋能,重新定义智能设备与日常生活的交互方式。

  • AI日报:腾讯语音数字人模型HunyuanVideo-Avatar;Trae国际版开启付费订阅模式;Claude网页搜索功能全面开放

    本文汇总了AI领域最新动态:1)腾讯开源数字人模型HunyuanVideo-Avatar,支持图像转视频创作;2)Trae国际版开启付费订阅,首月3美元;3)Claude网页搜索功能向免费用户开放;4)印度AI初创Builder.ai破产,亏损超5亿美元;5)腾讯元宝接入微信读书平台;6)快手计划加大AI投入但预计影响利润率;7)Mistral推出智能代理API;8)Claude移动端上线语音对话测试版;9)OpenAI拟推ChatGPT第三方登录功能;10)掘金发布AI项目一键部署工具;11)多模态模型视觉推理能力评估显示准确率仅25.8%;12)中石油发布3000亿参数昆仑大模型,推动油气产业智能化。