首页 > 业界 > 关键词  > 谷歌开发者大会最新资讯  > 正文

谷歌 I/O开发者大会汇总:AI模型全面更新 几乎覆盖所有生成模型类型

2024-05-15 11:37 · 稿源:站长之家

站长之家(ChinaZ.com)5月15日 消息:在昨晚的Google I/O发布会上,Google宣布了一系列AI模型的更新,涵盖了从文本到视觉和音乐的多个领域:

Gemini1.5Pro:支持200万上下文,针对翻译、编码、推理等关键用例进行了质量改进,但未发布测试结果。

Gemini Flash:针对响应速度至关重要的窄或高频任务进行了优化,价格比GPT-3.5更便宜。

image.png

Gemini模型家族:

  • Ultra:最大的模型,仅在Gemini Advanced提供。

  • Pro:最佳总体性能模型,API预览版中提供。

  • Flash:轻量级速度/效率模型,API预览版中提供。

  • Nano:设备上模型,将内置于Chrome126中。

  • Gemini Gems:谷歌的GPTs,支持自定义与Gemini的互动方式。

  • Gemini Live:基于声音的深入双向对话能力,Project Astra实时视频理解个人助理聊天机器人即基于此。

  • Gemma2:6月发布,规模为27B,以更小的尺寸提供接近Llama-3-70B的性能。

  • PaliGemma:谷歌的第一个视觉语言开放模型,灵感来自PaLI-3。

  • Veo:DeepMind开发的模型,旨在对标Sora,但一些体验者认为效果不尽人意。

  • Imagen3:图像模型,能够理解自然书写的提示,生成高质量逼真图像,并在渲染文本方面表现优异。

  • Music AI Sandbox:旨在改变音乐创作方式的AI工具,用户可以全新创作乐器部分,轻松转换不同曲目风格。

  • Trillium:谷歌最新的TPUs,计算性能比上一代TPU v5e提升高达4.7倍。

这次发布会展示了Google在AI领域的全面布局和创新能力,从文本到视觉再到音乐,Google的AI模型正在不断进步,为用户带来更加丰富和高效的体验。

举报

  • 相关推荐
  • 百度Create AI开发者大会:李彦宏发布两大新模型、多款热门AI应用、开发者拥抱MCP

    4月25日,百度在武汉举办Create 2025开发者大会。李彦宏发布文心大模型4.5 Turbo和深度思考模型X1 Turbo,性能提升同时价格大幅下降。大会推出全球首个电商交易MCP平台,并发布数字人、智能体心响APP等多款AI应用。百度宣布未来5年培养1000万AI人才,并点亮国内首个三万卡集群。同时启动第三届"文心杯"创业大赛,最高奖金达7000万元。大会还包含6大分会场、40节AI公开课及5000平互动展区,全面展示百度AI生态布局。

  • 微软上线GPT-image-1模型 通过API向开发者开放使用

    OpenAI于4月24日发布全新图像生成模型GPT-image-1,通过API向全球开发者开放。该模型支持生成高质量图像,具备多级定制功能,包括控制敏感度、生成效率、背景、输出格式等参数,并推出"吉卜力模式"生成独特风格图像。Adobe、Figma等多家企业已将其集成到产品中。API定价按token计算,低质量图像生成成本约0.02美元/张。OpenAI CEO Sam Altman高度评价该模型,认为其为开发者带来更大创意空间。

  • 能理解海豚声音!谷歌开发AI模型DolphinGemma

    快科技4月15日消息,谷歌公布了一款名为DolphinGemma”的大型语言模型,旨在帮助科学家理解海豚的声音,并生成类似海豚的声音序列。研究人员预计在未来几个月内测试DolphinGemma及其配套的Cetacean Hearing Augmentation Telemetry(CHAT)发声系统,以探索是否能够翻译并模仿海豚的声音,进而实现与海豚的某种对话”。海豚是地球上最聪明且最善于沟通的动物之一,其社交互动极其复杂�

  • 提前感受纯血鸿蒙6!华为开发者大会HDC2025正价票今日开售

    快科技5月1日消息,华为开发者大会HDC2025定档6月20-22日召开,根据华为开发者官网显示,首批正价票将于今日10:08开售,88元起。据华为预告,这次大会可以深度体验HarmonyOS最新版本的设计。结合以往的惯例,官方应该会透露一些HarmonyOS 6的新特性。爆料称此次还会全面公布HarmonyOS 5.1,也会是一次大的版本升级,可以快速覆盖当前纯血鸿蒙设备。去年华为就是在HDC2024上正式发布HarmonyOS NEXT,并且开启了先锋用户招募。HarmonyOS NEXT从内到外实现全栈自研,是基于OpenHarmony打造的全场景智能操作系统,这是一个源自中国、自主可控?

  • 视频生成模型Vidu Q1怎么用?Vidu Q1官网是什么?

    国产视频生成大模型Vidu Q1在性能、价格和功能上实现重大突破。该模型由生数科技推出,在VBench评测中超越Sora等国内外顶尖模型,支持1080p高清视频生成,每秒价格低至3毛钱。其首尾帧功能仅需两张图即可实现电影级运镜效果,支持多元风格生成和48kHz高采样率混音功能。Vidu Q1已深度赋能影视、广告、动漫等行业,大幅降低创作门槛。

  • 谷歌Gemini整合Veo 2视频生成模型,8秒720P视频轻松搞定

    谷歌宣布又有一款 AI 模型将加入 Gemini,但这次它不仅仅是一个聊天机器人。

  • Create2025百度AI开发者大会举行 文心4.5 Turbo、X1 Turbo发布

    百度在武汉举办Create2025+AI开发者大会,李彦宏强调AI应用创造价值的关键。他指出当前AI模型迭代加速,MCP成为行业标准,但开发者担忧应用快速过时。李彦宏建议开发者选对场景和基础模型,并学习调优方法。百度发布文心大模型4.5 Turbo和X1 Turbo,价格大幅下降80%和50%,性能提升且成本更低,为开发者提供更实惠高效的工具选择。

  • Create2025百度AI开发者大会上热搜 4.5Turbo、X1Turbo发布

    百度在武汉举办2025AI开发者大会,正式发布文心大模型4.5Turbo和X1Turbo两大版本。4.5Turbo在多模态处理能力上实现突破,支持文本、图像、语音跨模态交互,调用成本较前代直降80%,仅为竞品价格的40%。X1Turbo强化深度推理能力,价格较上代降50%,成本仅占竞品的25%。两款产品围绕"多模态、强推理、低成本"三大特性展开,其中4.5Turbo提升逻辑推理与代码生成效率,X1Turbo支持多步骤复杂推理和跨工具调用能力。百度此次定价策略极具竞争力,4.5Turbo成本降至行业主流水平的1/5,瞄准中小企业及个人开发者;X1Turbo虽定位高端,但成本仅为竞品1/4,主要面向科研机构、金融分析等高要求领域。

  • 或超过人平均水平!AI模型将如何改造智能客服?

    本文探讨了AI大模型如何推动智能客服升级。每日互动产品总监高志成指出,传统智能客服存在"答非所问"问题,主要受限于算法覆盖不足、相似性匹配机制和逐句识别方式。而大语言模型能基于上下文深度理解,精准把握客户意图,实现"所答即所问"的基本要求。未来智能客服将朝五个方向升级:1)精准理解应答;2)更自然的沟通方式;3)主动挖掘需求和销售转化;4)自动构建决策模型;5)实现营销服务一体化应用。高志成认为,随着AI技术发展,智能客服水平将超越人工客服平均水平,不仅能处理售前咨询,还能部分解决售后问题。企业需构建完善的知识库体系,将商品信息、活动信息等单独做成知识库,通过数据标注构建更立体的用户画像。最终,智能客服将向"售前+售后"全能型发展,承担更大责任。

  • Unity首席执行官:96% 的游戏开发者已开始用 AI

    “市面上有很多生成式 AI 资源,但很少有公司能够用好它们,”布罗姆伯格说,因为 AI 并未无缝地融入到制作过程中……