首页 > 业界 > 关键词  > Gemini最新资讯  > 正文

谷歌承认 Gemini AI 模型演示视频不是真实的:使用静态图像帧,并撰写文本提示供 Gemini 回应

2023-12-08 10:45 · 稿源:站长之家

站长之家(ChinaZ.com) 12 月 8 日消息:Google 刚刚宣布了其迄今为止最强大的 AI 模型套件 Gemini,但该公司已被指控在其宣传视频中对其性能进行了误导性表述。

谷歌大模型Gemini

根据彭博社专栏作家帕尔米·奥尔森(Parmy Olson)的观点文章,Google 在一段视频中误导了公众对 Gemini 的理解。本周早些时候,Google 在宣布过程中播放了一段令人印象深刻的名为「what the quack」的操作视频,奥尔森在文章中指出,视频中展示的 Gemini 似乎极具能力,甚至可能过于强大

这段六分钟的视频展示了 Gemini 的多模态能力(例如,结合语音会话提示和图像识别)。视频中,Gemini 似乎能快速识别图像——甚至是连线画——在几秒内作出反应,并实时追踪杯子和纸球游戏中的纸团。虽然人类可以做到这一切,但这是一种能够识别和预测接下来会发生什么的 AI。

然而,如果点击 YouTube 上该视频的描述,Google 有一个重要的声明:

「出于本演示的目的,延迟已减少,并且为了简洁起见,Gemini 输出也已缩短。」

奥尔森对此表示不满。她在彭博社的文章中指出,Google 在被要求评论时承认,视频演示并非实时进行,而是使用了原始视频的静态图像帧,然后撰写了文本提示供 Gemini 回应。奥尔森写道:「这与 Google 似乎在暗示的内容大相径庭:一个人可以与 Gemini 顺畅地进行语音对话,同时 Gemini 实时观察并回应周围的世界。」

公平地说,公司经常编辑演示视频,特别是许多公司希望避免实时演示带来的技术故障。稍微调整演示是常见的。但 Google 有可疑视频演示的历史。人们曾怀疑 Google 的 Duplex 演示(记得 Duplex 吗,那个能打电话给美发沙龙和餐厅预订的 AI 语音助手?)是否真实,因为视频中明显缺乏环境噪音和过于乐于助人的员工。对 AI 模型的预录制视频也使人们更加怀疑。

在这种情况下,奥尔森表示,Google 是在「炫耀」,以转移人们对 Gemini 落后于 OpenAI 的 GPT 的事实的注意力。

Google 对此表示不同意。在被问及演示的有效性时,它指向了 Google DeepMind 的研究副总裁兼深度学习负责人(同时也是 Gemini 联合负责人)奥里奥尔·维尼亚尔斯(Oriol Vinyals)的一篇帖子,该帖子解释了团队是如何制作视频的。

维尼亚尔斯说:「视频中的所有用户提示和输出都是真实的,为了简洁而缩短。视频展示了使用 Gemini 构建的多模式用户体验可能的样子。我们制作它是为了激发开发者的灵感。」

他补充说,团队向 Gemini 提供了图像和文本,并要求它通过预测接下来会发生什么来作出回应。

这当然是处理这种情况的一种方式,但对于 Google 来说,这可能不是正确的选择——至少在公众眼中,Google 已经因 OpenAI 今年取得的巨大成功而显得措手不及。如果它想激发开发者的灵感,不是通过精心编辑的炫目短片,这些短片可能会误导 AI 的能力。而是通过让记者和开发者真正体验产品。让人们在小型公开测试版中与 Gemini 一起做蠢事。向我们展示它到底有多强大。

举报

  • 相关推荐
  • 谷歌推出终端AI编程工具Gemini CLI Gemini CLI安装使用教程一览

    近日,谷歌在AI编程领域推出了一款备受瞩目的终端AI编程工具——Gemini CLI。这款免费开源的工具一经发布,便在开发者群体中引发了广泛关注,其强大的功能和免费开源的特性,使其在众多同类产品中脱颖而出,甚至让一些竞争对手如Claude Code相形见绌。 如果您对AI编程工具感兴趣,想要了解更多类似的产品,可以访问 [AIbase - 智能匹配最适合您的AI产品和网站](https://top.aiba

  • 性能超OpenAI、Gemini!月之暗面发布首个自主强化学习Agent

    月之暗面(Moonshot AI)正式推出其首款Agent产品Kimi-Researcher(深度研究),并已启动小范围灰度测试。 该产品基于端到端自主强化学习(end-to-end agentic RL)技术打造,在HLE测试中表现优异,性能超越Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research,并与Gemini-Pro的Deep Research Agent持平。 Kimi-Researcher 是一款高度自主的智能研究助手,能够独立规划任务流程并交付完整结果。与其他Agent不�

  • AI日报:MiniMax推视频生成模型Hailuo 02;Cursor Pro取消500次请求限制;谷歌发布AI模型 Gemini 2.5 Flash-Lite

    本文汇总了AI领域最新动态:1)Cursor Pro取消500次请求限制;2)稀宇科技推出视频生成模型Hailuo02;3)谷歌发布轻量级AI模型Gemini2.5Flash-Lite;4)科大讯飞星火X1升级版7月上线;5)腾讯元宝推出AI编程模式;6)OpenAI将下架GPT-4.5 API;7)苹果Speech API转录速度超Whisper 55%;8)百度推出数字人互动直播间;9)Meta曾试图高薪挖角OpenAI人才;10)Krea1公测开放,解决"AI感"问题;11)特斯拉Grok车载AI助手即将上线;12)谷歌Gemini新增视频分析功能。

  • 高考数学全卷重赛!一道题难倒所有大模型,新选手Gemini夺冠,豆包DeepSeek并列第二

    本次AI高考数学测试评估了7个大模型的表现,包括Doubao、DeepSeek、Qwen3等。测试包含14道客观题和5道解答题,总分150分。结果显示:1)客观题各模型差距不大,最大分差仅3分;2)解答题成为主要失分区,仅Gemini2.5Pro获得满分;3)图像识别题(第6题)难倒所有多模态模型,暴露AI图文理解短板。最终Gemini2.5Pro以145分居首,Doubao和DeepSeek R1以144分并列第二。测试表明大模型在数学推理能力上有进步,但在复杂论证和多步骤计算方面仍需提升。

  • 「6月26日AI日报」可灵AI推全球首部AIGC单元剧;谷歌开源AI智能体Gemini CLI

    AI行业近期动态汇总:1)豆包AI编程升级为"应用创作1.0",支持可视化编辑和实时预览,降低开发门槛;2)谷歌开源Gemini CLI工具,集成Gemini 2.5 Pro模型,提供免费编程助手;3)Anthropic推出"Artifacts"功能,用户无需编程即可在Claude中创建AI应用;4)出门问问发布TicNote+硬件产品,内置Shadow AI技术;5)OpenAI将Codex CLI重构为Rust语言以提升性能;6)谷歌发布Imagen4文生图模型,突�

  • 卢伟冰:REDMI K Pad对标iPad mini

    REDMI正式官宣其首款旗舰小平板——REDMI K Pad,该产品将于近期发布。与此同时,小米集团合伙人、总裁,国际部总裁,Redmi品牌总经理卢伟冰发文透露,今年堪称小米平板业务的爆发之年,小米平板销量首次跻身全球前三,产品阵容完成换新,全面对标苹果iPad系列产品。 卢伟冰强调,5月发布的小米平板7Ultra直接对标苹果最高端的iPad Pro,而接下来即将发布的新品中,有两款�

  • AI日报:MiniMax发布视频智能体Hailuo Agent;昆仑万维开源 Skywork-SWE-32B;B站接入Qwen 3等模型

    本期AI日报聚焦多项AI领域创新:1)MiniMax推出视频Agent工具,支持文本生成高清视频及人脸驱动;2)昆仑万维开源Skywork-SWE-32B模型,提升软件工程任务表现;3)B站接入通义千问模型,推出数据分析智能体InsightAgent;4)ChatGPT深度整合Gmail与日历功能;5)腾讯云发布全链路AI开发平台"AI Builder";6)HeyGen推出UGC广告数字人功能;7)研究显示过度依赖AI或削弱批判性思维。此外还涵盖AI音乐生成、内容检测工具停运等动态,展现AI技术快速发展的多元应用与潜在影响。

  • MiniMax深夜开源首个推理模型M1,这次是真的卷到DeepSeek了。

    ​不知道还有多少人记得,AI行业的六小虎。 行业内都在说,他们已经寂静好久了。 上一次相关的项目发布,还是前一段时间我写的MiniMax声音模型的更新,Speech-02。 而昨晚凌晨将近12点的时候,又是MiniMax,居然在X上,预告了他们一整周的发布计划。

  • REDMI K Pad搭载顶级LCD屏!7大优势全面领先iPad mini

    REDMI K Pad将于本月发布,这是REDMI首款旗舰小平板,号称全面超越iPad mini。 据了解,REDMI K Pad采用8.8英寸3K LCD屏幕,按照REDMI品牌总经理王腾的说法,这块屏幕拥有行业顶级的规格。 王腾还晒出K Pad与iPad mini的屏幕规格对比图,前者无论是ppi、刷新率、全局亮度,还是触控采样率、护眼、湿手触控等,以及屏幕边框,都全面领先iPad mini。

  • AI日报:MiniMax-M1开源;阿里Qwen3升级版适配苹果MLX架构;月之暗面发布新模型Kimi-Dev-72B

    《AI日报》汇总了近期AI领域多项重要进展:1)月之暗面推出开源编程模型Kimi-Dev-72B,在软件工程任务测试中创下新纪录;2)MiniMax开源M1模型,支持超长上下文推理且训练成本低;3)腾讯发布AI音乐模型LeVo,支持音色克隆和分轨生成;4)阿里云Qwen3升级版适配苹果MLX架构;5)豆包推出"AI播客"功能,可将PDF转为对话播客;6)夸克App上线个性化AI家教"夸克老师";7)松下发布多模态大模型OmniFlow,实现文本/图像/音频自由切换;8)TikTok推出三款AI视频创作工具;9)极氪与火山引擎合作,将豆包大模型接入智能座舱系统;10)Meta的Llama3.1模型在文本记忆方面表现突出;11)Grok上线定时追踪X热门话题功能;12)Gemini2.5Pro即将更新Deep Think功能;13)谷歌地图引入AI技术升级导航和个性化推荐功能。