首页 > 业界 > 关键词  > AI投资趋势最新资讯  > 正文

前端铺开智能体,后端猛砸TPU:直击谷歌I/O大会

2026-05-20 16:13 · 稿源: 光锥智能公众号

声明:本文来自于微信公众号 光锥智能,作者:光锥智能,授权站长之家转载发布。

曾经号称“看不懂AI”的伯克希尔,开始加仓AI。

谷歌,就成了Q1伯克希尔大量加持的其中一家AI公司。一季度,伯克希尔增持谷歌母公司Alphabet的A类股3640万股,环比激增约204%,持仓市值增至156亿美元。

投资公司们的热钱开始翻倍投入谷歌的同时,谷歌也用真实数据展示了一件事——当AI真正开始为普通人所用时,它的增长曲线能飞得多漂亮。

“两年前,我们每月处理的总计9.7万亿个Tokens,去年在I/O大会上,这一数字已增长至约480万亿;如今,这一数字更是激增了7倍,达到每月3200万亿的水平。”在北京时间5月20日凌晨1点开启的谷歌I/O大会上,谷歌CEO桑达尔·皮查伊说。

紧接着,他放出了一组组翻倍的用户数量和Token消耗数据:谷歌的模型API现在每分钟处理大约190亿个Tokens,环比上季度增长6倍;Gemini App月活超过9亿,同比去年4亿翻了一倍,用户每日请求总量则翻了7倍。

Token消耗量一日千里的情况下,谷歌开始用密集的新品轰炸,抓住当前最能撑起Tokens生意的产品——智能体。

本届I/O大会上,谷歌的信念是“万物皆可智能体”:

  • 要个人助手,有7×24在线、对标龙虾的云端智能体Gemini Spark;

  • 要Vibe Coding,有支持多个Agent同时运行的Antigravity2.0版本;

  • 要搜索体验,有能帮用户准确查找信息的多个智能体协同;

  • Gemini App更是针对用户需求在各个维度增设了各类Agent。

用模型当技术底气,用应用带动Tokens消耗翻倍的同时,谷歌对AI基础设施的投入也随之翻倍。

去年,谷歌云在AI基础设施上投入了超过300亿美元。皮查伊在大会上表示,今年这一数字将是去年的六倍左右,大约为1800亿至1900亿美元。

砸钱做基建,是为了每月都在翻倍的消耗做准备,但谷歌的野心不局限在谷歌云。据外媒报道,谷歌和黑石集团将共同创建一家新AI云公司,以谷歌的TPU芯片为核心,这可能代表着谷歌正在挑战英伟达等芯片公司的地位。

作为少有布局芯片-模型-产品的公司,谷歌在本届I/O大会上已经铺开了一张巨大的地图。

视频模型、文本模型双发布

打问号的性价比

本届I/O大会上,模型和智能体成为了最有看点的发布内容。

一向喜欢在I/O大会先展示AI模型的谷歌,今年也不例外,拿出了两款模型——多模态模型Gemini Omni Flash(下简称Omni)和又快又便宜的Gemini3.5Flash。

作为单开新系列的模型,Omni支持从任何输入创建任何内容,它现在支持用户输入文本、图片、文件、视频给到模型,目前只支持输出视频,后续会扩展到文本、音频等内容形态。

通过同时训练不同形态的数据,Omni在物理规律的理解上表现有所提升。光锥智能测试让Gemini Omni Flash生成一个“台球白球击打红球入袋”的视频,相比上一代Veo的表现,Omni对力学的理解确实有进步,白球在击飞红球后实现了缓慢静止的要求,改掉了Veo版本击打后仍然乱飞的效果。

Omni也吸取了图片编辑模型Nano Banana的爆火思路,被训练成一个支持靠文本描述修改的视频编辑模型。现场展示中,谷歌展示了“让雕塑变成泡泡”、“根据图片上画出的动线,让鱼顺方向游动”等案例。

前几天被曝光的Gemini3.5Flash模型,也如预料般成为了I/O大会的展示主力。

谷歌眼中的新模型,主打一个“又快又便宜”,在模型部分性能(如Agentic能力、多模态等)超越Gemini3.1Pro的同时,有点给各类智能体打基础的意思。

图片

在每秒Token输出速度上,Gemini3.5Flash比海外部分前沿模型快4倍,测试效果非常直观,让它写个简单游戏代码几乎是“喷”出来一般的快。皮查伊现场还表示,搭载上自家的编程产品Antigravity,整体速度能快12倍。

图片

诚然,从绝对性能角度来说,Flash模型没办法跟其它家最新旗舰模型打擂台,但用谷歌的话说,它的成本是前沿模型的一半。

这里我们以Claude Sonnet4.6为例,以其每百万Token输入3美元、输出15美元的价格对比,后者每百万输入为1.5美元(50%)、输出9美元(66.7%)的价格优势显著。

皮查伊当场算了笔账,表示许多公司年度Token预算超过1万亿,若将负载迁移到Gemini3.5Flash,每年可省10亿美元。

虽然谷歌对自己的新模型大加赞赏,但对于关注谷歌Flash系列定价的用户来说,Gemini3.5Flash再好,它的价格定位也超出了Flash系列的“便宜”预期。

比起前一代Gemini3Flash每百万Token输入0.5美元、输出3美元的定价相比,新的Flash模型相当于定价直接翻了三倍。何况现在据AA排行榜上显示,Gemini3.5Flash的综合分数低于Gemini3.1Pro,从上面的跑分也能看到,其实在HLM(人类最后测试,反映模型处理复杂任务能力)部分指标上表现不如后者,这让新模型处在一个“比起旗舰不香、比定价又翻倍”的尴尬境地。

为了测试它和Gemini3.1Pro到底谁编程更香,光锥智能做了个测试,让两个模型分别做个简单的魔塔小游戏出来,两版代码都在运行的时候出现了地图部分线路堵死导致无法游玩的问题。但要求它们修改的时候,Gemini3.1Pro直接修复了地图路线规划问题,但Flash版本对话修改失败。谷歌给出的“性能全面超越”,可能需要打个问号。

除了对模型能力的优化,谷歌也试图通过可视化进一步提升用户体验。比如我们在测试Gemini3.5Flash的时候,Gemini会选择性把一部分对话用AI编程的方式,做可视化的效果呈现。不过在测试中,等了超过5分钟也没等到最终效果生成,等待时间拉长,体验感反倒降低了。

至于新款旗舰模型到底表现如何,答案还要在下个月Gemini3.5Pro的发布上见分晓。

全线上新智能体

谷歌的AI订阅生意

“我们已经进入了新的智能体时代。”谷歌产品经理的一句开场白后,本届I/O大会的绝对主角——智能体占据了大多数时间的展示。

比起只发布Flash版本给大伙尝鲜的两个模型,谷歌的重头戏还是放在了智能体上。一场大会里,基本每个介绍单元都有Agent的出现。这些产品的底层模型,也正是上文发布的Gemini Flash3.5。

说实话,在Claude有Cowork,国内也纷纷跟进智能体的情况下,Google来得不算早。但坐拥一系列产品,如何把智能体放进各个产品中,谷歌确实也需要更多时间考虑这个问题。

最直接对标龙虾的Agent是Gemini Spark,这是一个运行在谷歌云上的云端智能体。

可以说,谷歌做这种面向大众消费者的思路也一样谨慎,在安全的前提上做尝试。比如在联动谷歌产品时,默认关闭状态,用户可以选择手动开启。

Spark目前看下来,它的杀手锏是与Gmail、日历、驱动器、文档、表格、幻灯片、YouTube 、地图等谷歌产品无缝打通,通过自家庞大的应用生态,做到能够接近龙虾式的高权限优势。

在谷歌的现场展示中,Spark能帮忙起草电子邮件、抓取表格信息并整理到文档中、根据抓取的内容做好日程提醒,可以说桩桩件件都和谷歌生态强相关。上述功能演示看起来比较简单和初级,也印证了谷歌本身还在智能体赛道试水的情况。谷歌还表示,前期先打通内部能力,后几周将会更新MCP加入第三方功能联动。

图片

不过,目前我们还无法直接体验到Spark产品。谷歌披露,本周开始,Gemini Spark将面向少数用户开放,后续将面向Google AI Ultra用户和部分企业用户开放。它即将出现在邮件、Gemini App中,今年夏天还可能出现在浏览器里。

放在谷歌王牌的AI搜索转型上,智能体能力的加入,也成了AI搜索优化的看点。

它支持开启多个智能体帮助用户搜索信息,比如做一个特定金融领域收集股票信息的Agent、让AI帮你做租房信息更新的实时追踪。这个服务将在今年夏天向AI Pro和Ultra订阅用户开放。

智能体编程能力也被整合进了AI搜索。

用户可以直接借助搜索结果构建可视化效果。比如,在用户搜索一些复杂名词时,AI能够直接做出可视化的动画,相当于直接做了个动画版本的演示,让用户不仅能通过文字了解,更能上手体验。这是一项免费服务,预计今年夏天对用户开放。

在购物方面,谷歌引入的智能体更多是作为体验优化和支付生态标准。

以Universal Cart(通用购物车)为例,它不仅能提供价格比较和优惠信息,还能进行跨平台比价、给出用户购物建议。一个让笔者印象深刻的例子是,当用户想要组装一台电脑时,购物车功能可以主动发现硬件兼容性问题——比如CPU与主板不匹配、电源功率不足,从而给用户提供购物指导。

在Gemini产品的优化中,一些特定功能的智能体成了拉升用户体验的附赠品。

比如帮你整理每日讯息、待办事项的Daily Brief;Google Flow中的多模态创作智能体则支持同时进行多个创作任务,比如针对一张图片同时生成16个不同角度的拍摄效果视频。

图片

大张旗鼓做智能体,谷歌想在C端靠智能体能力的加入,丰富付费服务的同时,让更多用户选择为智能体买单。

会议上,谷歌宣布为AI订阅的Ultra档服务开放一个每月100美元的新档,上述介绍的智能体能力就能够在这个更低定价的服务中开放。此外,谷歌的AI编程产品Antigravity也迎来升级,开放多智能体任务的同时,也将打通到AI Ultra的订阅中。

图片

在OpenAI最近宣布把最高档订阅价格砍半、由每月200美元降低至100美元后,谷歌的动作也来了。在大会上,谷歌也宣布,将每月250美元的订阅价格降低50美元。

谷歌的智能体轰炸和定价调整,放在C端来看,都是在为竞争加剧的订阅生意做准备。

AI基建投入翻6倍

谷歌AI生态闭环

两款模型发布、一系列智能体的更新好比繁花,而它们扎根的土壤——AI基建,虽然只是被简单提及,但它正在成为谷歌讲通物理AI故事、拉升公司市值的关键业务。

谷歌对AI基建的投入狂热,从真金白银上直接体现出来。比去年翻了6倍、高达180亿美元以上的投入,虽然谷歌有钱,但这对它来说依然是一笔不小的投入。

“我们一直在为现在和未来投资。”皮查伊说。

两款之前已经在谷歌云大会上发布的第八代芯片8t和8i,分别对应大模型的训练和推理,前者让每单元的计算性能提升3倍,通过全球100万+分散各地的芯片共同调用,它们让谷歌的模型训练速度“从几天变为几周”,后者则提升了模型的推理速度——在现场展示中,Gemini的Flash模型每秒钟输出Token速度提升到了接近1500个左右。

图片

利好自家的同时,谷歌的TPU也正在成为硅谷各家AI大厂争相囤货的对象之一。

先是今年2月,Meta叫停自家自研芯片业务的同时,展开与AMD、谷歌合作,据The Information报道,Meta和谷歌达成一项关于租赁TPU的数十亿美元交易,同时Meta在洽谈明年购买TPU业务;Anthropic也和谷歌、博通签署长期协议,承诺在未来五年内采购约5吉瓦的TPU算力用于模型训练。

搭建起庞大的芯片销售业务之外,借助TPU,谷歌的AI云业务还在进一步拓展。

5月,黑石集团也被曝与谷歌达成合作,向一家合资企业投资50亿美元,其中黑石提供50亿美元,谷歌提供包括TPU专用芯片在内的软硬件服务,新公司计划在2027年实现500兆瓦算力。

至此,谷歌的芯片-云服务-模型-产品生态已经愈发完整,随着AI带动Token消耗量指数级增长,每一层业务的提升,都能让谷歌在AI领域再拿出一笔漂亮的营收。

举报

  • 相关推荐
  • 圆满收官|睿晰AI亮相中欧2026年度营销论坛以体系化AI构筑品牌增长新壁垒

    2026年6月6日,中欧国际工商学院举办以“AI平权时代的品牌与商业增长”为主题的营销论坛,汇聚数百位学界、产业界与投资圈嘉宾,探讨AI时代品牌增长的核心逻辑与实践路径。论坛指出,在AI能力逐渐“平权”的背景下,品牌竞争转向体系化、效率化与专业化。波司登、九牧、Peet’s Coffee等企业分享了AI赋能品牌管理的案例。作为官方合作伙伴,睿晰AI提出“企业的AI品牌部”理念,通过Multi-Agent体系实现品牌洞察、舆情管理、内容生成等核心能力的智能化与自动化,助力企业以极低成本构建可持续增长壁垒。

  • AI 驱动公域增长 小鹅通 GEO 增长引擎正式上线

    用户获取信息方式从主动搜索转向AI推荐,品牌曝光逻辑被重构。商家面临私域流量增长空间有限、获客成本攀升的挑战,需构建系统化公域增长体系。小鹅通GEO增长引擎正式上线,提供内容生产、媒体分发、效果验证一体化方案,助力品牌在多公域触点获得稳定曝光。产品涵盖内容中心、媒体资源、效果测试模块,形成闭环管理,帮助商家在AI时代夯实公域竞争力。

  • 兴趣用户增长超3倍,年轻人为什么喜欢在微博聊AI?

    ​1.2万亿市场背后,谁是AI讨论的核心阵地? 据中国信通院测算,2025年我国人工智能核心产业规模有望达1.2万亿元。截至2025年底,我国人工智能企业数量已超6000家,全球占比达16%。 AI产业飞速发展的同时,内容平台不仅是信息的传播渠道,更成为公众AI认知形成、使用经验沉淀、行业讨论深化的核心场域。今年初Seedance2.0的飞速出圈,以及不久前的“养虾”热潮,都离不开大�

  • Token五年增长370倍:谁在给AI公司“印钞机”充值?

    ​不怕亏钱,就怕错过。整个5月,AI公司们的估值一路狂飙。 估值翻倍、单轮融资创下新高,也让月之暗面们今年尚未过半,手上就有了2-3轮的融资钱: 之前坚决不融资的DeepSeek一出手就是500亿元人民币的融资,估值或突破3500亿元;月之暗面在不到半年时间里完成三轮融资,累计融资超过39亿美元,最新一轮估值突破200亿美元;一天后,阶跃星辰被曝完成近25亿美元融资,投后估

  • 立足前沿趋势,读懂骁龙端侧AI进化逻辑

    AI行业竞争已从算力参数比拼转向趋势预判与技术落地能力博弈。高通总裁安蒙在2025骁龙峰会上提出AI未来六大核心趋势,涵盖AI成为新用户界面、体验转向智能体中心、全域计算架构革新、云边混合模型普及、边缘数据相关性增强及迈向6G智能感知网络,并以此精准布局骁龙平台技术,实现从趋势预判到产品落地的闭环。通过重构人机交互、升级计算架构、挖掘边缘数据价值,骁龙将抽象趋势转化为可感知的终端体验,推动AI从概念走向全民普及的规模化时代。

  • 从底层智算算力到顶层AI应用,移动云为数字中国打造智慧“引擎”

    随着AI技术发展,大模型进入价值落地阶段,推动智算服务需求激增和云计算市场新增长。2025年全球IaaS市场保持增长,中国市场规模达469亿美元。移动云作为云计算“国家队”,加速智算中心建设,突破核心技术,构建全栈智算服务体系,实现从算力到智能应用的全链路覆盖。其智算总规模达92.5EFLOPS,网络能力强大,通过GPU云主机等产品满足多元化需求,推动智算服务规模化、普惠化发展,助力千行百业数智化转型。

  • 千部难有一部破亿,AI短剧停止“狂飙”?

    ​AI短剧正在经历一次行业大洗牌。 去年11月,红果豪掷60的分成系数,扶持仿真人短剧。今年2月,Seedance2.0上线,无数团队涌向这片蓝海,期待复制真人短剧的造富神话。 4月,抖音集团短剧版权中心发布通知,AI仿真人剧分成系数从60砍至40,动画漫剧系数从50降至40。多名行业人士表示,红果还部分取消了AI短剧的保底政策。

  • 一张表看懂:AI for security vs Security for AI

    企业布局AI安全需同时推进“AI赋能安全”与“安全保护AI”两大方向,而非二选一。前者通过智能系统主动防御,后者确保AI模型本身不被攻击。正确策略是先给AI上保险(锁好门),再让AI当保安(守好院)。青藤云安全提出五步闭环方案:盘点AI资产、加密数据与管道、接入SOC、纳入云安全态势管理、持续监控模型漂移。作为AI原生安全领军者,其产品体系覆盖全栈领域,已服务超千家客户。

  • 当AI努力了解万物,骁龙让AI全新了解你

    520当天,上海北外滩江畔绽放由万朵玫瑰构成的“骁龙·AI的告白”装置,伴随《I Will Follow You》的旋律,这场科技告白不仅是浪漫仪式,更体现了骁龙对AI时代的深层思考。当行业努力让AI认知万物时,骁龙选择让AI全新了解你,聚焦以人为本、专属个体的智能内核,推动AI从认知世界走向读懂人心,实现从冰冷工具到温情陪伴的跨越,让“懂你”成为科技进化的核心密码。

  • 天娱数科吴邦毅:物理AI时代懂物理的数据才是高标号燃料

    人工智能正从数字世界走向物理世界,从“认知智能”向“行动智能”演进。物理AI要求AI理解空间、物体和动作,并通过机器人等载体完成真实任务。全球科技企业正推动从语言模型向视觉-语言-动作模型发展,国内政策也加速AI从模型竞赛进入产业落地阶段。高质量的三维、动作和交互数据成为关键燃料,中国凭借完整制造业体系和场景红利,有望抓住这一轮产业机遇。

今日大家都在搜的词: