首页 > 原创 > 关键词  > 人工智能最新资讯  > 正文

AI日报:谷歌推AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

2025-05-21 15:54 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、每月249.99美元!谷歌推出 AI Ultra 订阅计划,畅享最强大 AI 模型与高级功能

谷歌推出了全新的 AI Ultra 订阅计划,提供最高级别的 AI 模型访问和丰富的高级功能,适合电影制作人、开发者及创意专业人士。计划包含最新的 Gemini 应用、Flow 工具、30TB 存储空间等,订阅费用为每月249.99美元。

image.png

【AiBase提要:】

🌟 提供最高级别的 AI 模型访问和丰富的高级功能,适合追求最佳 AI 体验的用户。

🎥 Flow 工具支持高质量视频生成,掌握高级摄影控制并体验 Veo3功能。

💾 提供30TB 存储空间,确保用户创作和文件的安全性。

详情链接:https://blog.google/products/google-one/google-ai-ultra/

2、腾讯混元宣布模型矩阵全面升级,新推视觉推理模型T1-Vision和语音通话模型混元Voice

腾讯混元全面升级其模型矩阵,推出T1-Vision和混元Voice等新模型,TurboS在国际评测中表现优异,多模态技术取得新进展,同时推动开源技术发展。

image.png

【AiBase提要:】

🚀 混元推出T1-Vision和混元Voice,增强视觉和语音处理能力。

🏆 TurboS模型在全球评测中跻身前八,理科推理能力提升超10%。

🌐 腾讯混元开源多模态技术,支持行业创新与合作伙伴发展。

3、美图与阿里巴巴达成战略合作 获得2.5亿美元投资

美图公司与阿里巴巴达成战略合作,阿里巴巴通过可转债形式投资2.5亿美元,双方将在电商、AI技术、云计算等领域展开深度合作。

【AiBase提要:】

阿里巴巴以可转债形式投资美图2.5亿美元,助力其AI技术和电商业务发展。

美图与阿里巴巴将在电商工具开发及云服务采购上深化合作,提升商家运营效率。

合作需满足政府审批条件,旨在推动技术创新和业务增长。

4、豆包·语音播客模型发布将在豆包APP及PC端、扣子等上线

火山引擎推出的豆包·语音播客模型通过流式模型构建,实现了文本到播客的快速转化,带来高效、互动性强的创作体验。

image.png

【AiBase提要:】

🌟对话自然流畅,模拟真人播客口语习惯,提升听感真实度。

⚡端到端便捷链路,从创作到成品仅需秒级时间,极大提高效率。

🔍支持深度搜索与超长文本转播客,随时紧跟热点并丰富内容。

5、百度文心 X1Turbo 大放异彩,斩获信通院最高评级!

百度文心大模型 X1Turbo 在信通院评估中获国内首个“4+ 级”最高评级,展示出卓越的技术实力。

image.png

【AiBase提要:】

🚀 文心 X1Turbo 在24项能力评估中表现突出,16项能力满分,特别是在逻辑推理和代码推理方面。

🌟 基于文心大模型4.5升级,X1Turbo 性能更强、成本更低,且安全可靠度得到认可。

🌐 百度在AI技术研发中持续创新,X1Turbo 的成功标志着国内AI技术的重要突破。

6、谷歌发布Flow AI剪辑工具:Veo3与 Imagen4驱动、镜头控制与场景扩展

在2025年的Google I/O开发者大会上,谷歌推出了面向影视创作者的全新AI剪辑工具Flow,集成了Veo3、Imagen4和Gemini三大AI模型,通过自然语言提示和模块化工作流简化视频创作过程,为专业人士和初学者提供电影级视觉叙事能力。

image.png

【AiBase提要:】

🎥 Flow整合Veo3、Imagen4和Gemini,通过简单文本提示生成高质量AI视频片段,支持角色对话和环境音效。

🎥 Scenebuilder与Camera Controls功能赋予创作者对视频片段的无缝编辑和镜头控制能力。

🎥 内置Asset Management与Flow TV平台,优化素材管理和提供学习资源,助力创意社区发展。

详情链接:https://labs.google/flow/about

7、从文本到电影!谷歌Veo3震撼发布:4K画质、音视频一体生成

谷歌发布的Veo3视频生成模型,不仅支持音视频一体化生成,还具备超高分辨率和多样化风格支持,为创作者提供强大工具的同时,也强调了安全性与责任性。

【AiBase提要:】

🎥 Veo3可同时生成高清视频与匹配音频,简化创作流程,物理模拟和口型同步效果出色。

🌍 支持4K分辨率,捕捉细微描述,适应多种风格需求,适合专业及教育领域使用。

🔒 仅限特定用户开放,集成安全功能如数字水印与筛选器,未来将扩展应用场景。

8、谷歌Imagen4图像模型震撼发布:2K画质与精准文本渲染重塑AI创作

谷歌推出了最新一代图像生成模型Imagen4,具有超高分辨率、精准文本渲染和多种风格支持,为创作者提供强大工具。

image.png

【AiBase提要:】

✨超高分辨率与细节表现力:支持2K分辨率,细节捕捉显著提升,满足专业设计需求。

🌟改进的文本渲染与风格多样性:生成清晰文字,支持多种艺术风格,扩展创作者表达空间。

🚀快速生成模式与生态整合:速度提升10倍,集成多个平台,确保内容可追溯,降低误用风险。

9、谷歌Gemini2.5Pro Deep Think发布:并行推理重塑AI复杂问题解决

谷歌DeepMind在2025年Google I/O开发者大会上推出Gemini2.5Pro Deep Think模式,采用并行推理技术,大幅提升数学、编码和多模态推理能力,支持开发者灵活调整推理质量和成本。

【AiBase提要:】

💎 Deep Think模式通过并行推理技术,显著提升复杂任务表现,如数学、编码和多模态推理。

⚙️ 引入思考预算功能,开发者可平衡响应质量、延迟和成本,适应不同场景需求。

🔒 当前仅对受信任测试者开放,未来几周将逐步扩展至更广泛的应用领域。

10、谷歌虚拟试衣间重磅上线!上传照片秒变时尚模特,AI一键比价+自动下单

谷歌在I/O2025大会上推出了全新的AI虚拟试衣工具,用户上传照片即可快速生成逼真的穿搭效果图,同时支持多条件搜索、比价分析和自动下单,极大提升了在线购物的个性化和便利性。

image.png

【AiBase提要:】

✨ 使用AI虚拟试衣工具,上传照片后几秒内就能生成逼真的穿搭效果图,体验高度个性化。

🔍 集成多条件搜索、实时比价和自动下单功能,简化购物流程,提升购物效率。

🌍 基于Gemini2.5和Shopping Graph技术,精准捕捉服装细节,支持多种体型和品牌。

11、谷歌公测AI编码助手Jules:Gemini2.5Pro驱动,挑战OpenAI的Codex

谷歌推出的AI编码助手Jules进入全球公测阶段,基于Gemini2.5Pro模型,通过异步任务处理和GitHub集成提升开发者效率,透明工作流和免费配额吸引用户,未来扩展潜力巨大。

image.png

【AiBase提要:】

🌟 异步任务处理与GitHub无缝集成,修复Bug、编写测试等任务自动化。

📝 透明工作流,生成详细计划和代码变更差异,确保代码质量与团队规范。

🚀 支持Python和JavaScript,未来扩展至更多语言,挑战OpenAI Codex和GitHub Co pilot。

详情链接:https://jules.google/

12、苹果计划在 iOS19中向第三方开发者开放 AI 模型

苹果计划在 iOS19中向第三方开发者开放其 AI 模型,促进应用创新并增强硬件吸引力。初期将开放能在本地设备上运行的小型 AI 模型,开发者可通过新工具包利用 Apple Intelligence 创建新功能。

【AiBase提要:】

🍎 苹果计划在 iOS19中开放 AI 模型,推动应用创新与硬件吸引力提升。

💻 开发者可利用 Apple Intelligence 创建新功能,初期仅开放本地小型 AI 模型。

🌟 苹果目标是通过简化开发流程,将操作系统打造成 AI 软件平台的核心。

13、京东云宣布五大AI营销产品限时免费,助力商家提升销售效率

京东推出五大AI营销产品,包括数字人直播、商家客服智能体、商品图生成服务、视频混剪平台等,免费提供给商家,以提升销售效率和运营能力。

【AiBase提要:】

🌟 京东免费推出五大AI营销产品,助力商家提升销售效率。

🤖 数字人直播可全天候带货,降低直播成本,提高转化率。

📸 京点点平台和视频混剪工具助力商家优化图文和视频营销。

14、字节跳动开源多模态模型 BAGEL:图文生成与编辑的新突破

字节跳动发布了一款名为BAGEL的开源多模态基础模型,拥有70亿个活跃参数,整体参数量达到140亿。该模型在多模态理解、文本到图像生成、图像编辑等方面表现出色,采用了混合变换器专家(MoT)架构,并通过多模态预训练实现了持续性能提升。

【AiBase提要:】

🌟 BAGEL 是一款开源多模态基础模型,拥有70亿个活跃参数,超越多项标准基准测试。

🖼️ 该模型在图像生成和编辑任务中表现出色,能够进行自由形式的图像编辑和世界导航。

📈 通过多模态预训练,BAGEL 展示了持续的性能提升,适应了复杂的多模态推理任务。

详情链接:https://huggingface.co/ByteDance-Seed/BAGEL-7B-MoT

15、英伟达推出新型模型 Cosmos-Reason1,让 AI 更好理解物理世界

英伟达发布的Cosmos-Reason1系列模型,通过物理AI监督微调和强化学习提升AI在物理常识和具身推理上的能力,为机器人和自动驾驶领域带来新可能。

image.png

【AiBase提要:】

🌟 英伟达发布Cosmos-Reason1系列模型,增强AI在物理推理中的能力。

🤖 采用双本体系统,结合视频和文本数据进行同步推理。

📈 在物理常识和具身推理基准测试中表现优异。

详情链接:https://github.com/nvidia-cosmos/cosmos-reason1

举报

  • 相关推荐
  • 格创东智亮相深圳国际人工智能展览会:“章鱼智脑”+智能体集群,解锁工业智造新路径

    5月14日,2026全球人工智能终端展暨第七届深圳国际人工智能展以“端启未来·万物新生”为主题开幕,汇聚TCL、荣耀等超400家展商。TCL展示AI创新产品矩阵,格创东智则凭“章鱼大脑”智能决策中枢及智能体集群成为焦点,其以“打造AI自主决策的超级工厂”为核心,通过章鱼大脑、品质管理等四大板块,呈现工业智能决策实践路径。章鱼大脑采用“决策+执行Agent”架构,实现数据闭环,已落地多家半导体工厂,达成分钟级异常处置、良率实时监控等成效。未来,格创东智将持续迭代,推动从AI辅助向自主决策转型,助力中国智造高质量发展。

  • 得一微担任世界人工智能眼镜联盟(WAEA)董事会员,共推AI眼镜存力新前景

    近日,“2026AI眼镜产业生态大会”在深圳举行,汇聚全球顶尖企业与专家,探讨产业创新趋势。得壹微电子(YEESTOR)作为国内领先AI存力芯片设计企业受邀出席,被授予“世界人工智能眼镜联盟(WAEA)董事会成员单位”。大会指出,AI眼镜正从极客玩具迈向大众消费品,预计2026年全球出货量将突破2368万台。得壹微电子深耕存力主控芯片,为AI眼镜提供从端到云的全栈存力支持,推动端侧AI与智能穿戴生态规模化商用。

  • OpenAI成立OpenAI部署公司:帮助企业构建人工智能系统

    OpenAI正式成立OpenAI 部署公司”,在帮助企业构建人工智能系统。 同时,OpenAI已同意收购Tomoro一家专注于将AI转化为运营优势的应用 AI 咨询与工程公司。 新成立的部署公司由OpenAI控股,无论客户是与OpenAI、OpenAI部署公司,还是与两者同时合作,都将获得统一的服务体验。

  • 北京国际人力获评世界品牌莫干山大会“人工智能+”生态创新实践范本

    5月9日,第十个中国品牌日之际,2026世界品牌莫干山大会“搜索·点赞·传播品牌好故事论坛”在浙江德清举办,发布“人工智能+”生态创新实践范本。北京国际人力旗下万维招聘AI智能招聘平台获评“人工智能+”创新产品。论坛聚焦品牌强国建设,北京国际人力以47年行业积淀,推出全流程智能招聘平台,针对传统招聘痛点,运用大模型等技术构建PC端、微信小程序、线下求职一体机三位一体服务矩阵,赋能企业招聘管理与求职者职业成长,彰显国企担当,助力“中国服务”品牌高质量发展。

  • 十周年大调整!华为 nova 16系列6月发:砍掉Ultra版 新增Pro Max

    华为nova系列诞生于2016年,主打年轻潮流,今年迎来十周年。nova 16系列将于6月1日发布,产品策略大幅调整:取消Ultra版,新增Pro Max版,由标准版、Pro版和Pro Max版组成,命名与Pura、Mate旗舰系列看齐。硬件上,预计配备6.84英寸1.5K LTPO屏幕,顶配搭载麒麟9系芯片,出厂预装鸿蒙6.1系统,电池容量有望突破7000mAh,成为nova史上续航最强机型。

  • 足足快了9秒!保时捷纽北重新超越小米SU7 Ultra 胡峥楠:你追我赶的比赛才令人兴奋

    保时捷在纽北以6分55秒533的成绩刷新了量产豪华电动车圈速纪录,超越小米SU7 Ultra量产版,成为纽北最快量产四门纯电车。小米集团副总裁胡峥楠回应祝贺,称赛道只相信技术、实力与趋势,期待重新站上T13记分牌。此前小米SU7 Ultra曾在上赛创造最快量产车圈速,保时捷官方转发祝贺并点赞中国制造。雷军表示保时捷是世界大厂,有格局,但仍视其为学习标杆。

  • 从工具链到伙伴生态,联发科助力开发者让极致AI体验加速生长

    未来手机AI体验的核心不再是单个App功能强弱,而是系统层面的“智慧”深度。联发科与终端伙伴推出的AgentOS和“手机智能体”,通过芯片提供的主动感知与场景理解能力,实现从订票到跨设备协同的复杂操作。这标志着行业正围绕AI智能体化的新基建全面加速,从终端入口、系统底座到开发者工具链和云AI设施,构建全栈生态布局,推动智能体体验规模化落地。

  • 看齐Pura!华为nova 16大调整:新增Pro Max版 Ultra成绝唱

    华为nova 16系列即将在6月份正式揭晓,根据目前网传的消息,发布时间有可能是6月1日。作为华为深耕年轻市场的代表作,此次新品从命名到配置都迎来了显著升级。 与上一代产品相比,nova 16系列的命名规则发生了重大调整。新系列将新增Pro Max版本,并取消原有的Ultra版本,这一变化标志着nova系列的命名逻辑正式向高端旗舰Pura 90系列全面看齐。 经过调整后,nova 16系列将由�

  • 小米YU7 GT为什么不叫YU7 Ultra?GT和Ultra有什么区别?

    很多人都在问,小米新出的YU7 GT为什么不叫YU7 Ultra,这两个名字到底差在哪,官方也进行了回应。 其实就是定位完全不一样,所以名字不能混用。Ultra代表小米的巅峰旗舰,一切为极致性能服务,小米SU7 Ultra就是典型,主打赛道表现,在纽博格林北环赛道跑出过亮眼成绩,就是为了证明最强性能。 而GT代表适合长途旅行的高性能豪华车,小米YU7 GT定位跑车级SUV,不做纯粹的赛

  • AI 中转站完全解密:开发者必知的2026年生存指南

    本文全面解析了AI API中转站生态,指出国内开发者调用GPT-4、Claude等国际模型时面临海外手机号、外币信用卡和网络限制三大门槛,从而催生了中转站。文章详细介绍了中转站的定义、工作原理(统一API格式、流式输出、负载均衡)、主流渠道类型(官方直连、官转、云厂商、逆向)及其核心价值(解决支付、优化网络、统一多模型接入、成本控制、企业级功能)。同时,提供

今日大家都在搜的词: