Gemini 是谷歌迄今为止的 AI 模型但充满希望的基准测试和演示最终引发了批评

2023-12-21 11:37 · 稿源：站长之家

站长之家(ChinaZ.com) 12 月 21 日消息:谷歌近日公布了其最新的人工智能模型 Gemini，旨在缩小与 OpenAI 之间的差距，并给行业留下深刻印象。该模型展示了强大的基准测试成绩，并通过一段引人注目的视频演示和即时的可用性（尽管是功能受限版本），彰显了谷歌的自信。

谷歌大模型Gemini

然而，随着 AI 工程师和爱好者深入探究细节后发现了一些缺陷，这股积极氛围逐渐转变。虽然「Gemini」在技术上令人印象深刻，有望最终挑战 GPT-4 的主导地位，但谷歌模糊不清的信息传达方式使其不得不处于防守状态。

北美某大型零售商的首席 AI 工程师 Emma Matthies 表示：「目前问题多于答案。我发现谷歌宣传视频中的展示与其技术博客中的细节之间存在不一致。」

谷歌陷入困境的演示

Gemini 的演示视频在 YouTube 上发布，题为「亲身体验 Gemini」，视频风格快节奏、友好、有趣，充满易于理解的视觉示例。然而，它对「Gemini」的工作原理有所夸大。谷歌代表声称该演示视频展示了「Gemini」的真实提示和输出，但编辑过程省略了一些细节。例如，与「Gemini」的互动是通过文本进行的，而不是语音，AI 解决的视觉问题是通过图片输入的，而不是实时视频。

此外，AI 开发者迅速意识到「Gemini」的能力并不如最初看起来那样革命性。

性能比较

谷歌在其基准测试数据上也受到批评。家族中最大的模型「Gemini Ultra」宣称在多种基准测试中超越 GPT-4，这在大体上是正确的，但引用的数据是为了将「Gemini」描绘得更加优秀。

谷歌使用与其他公司不同的方法来测量性能，用户提示 AI 模型的方式会影响其性能，只有在使用相同的提示策略时，结果才具有可比性。

尽管如此，「Gemini」的多模态功能仍然令人印象深刻。它能够跨文本、图像、音频、代码和其他媒介进行推理。虽然这并非「Gemini」所独有，但大多数多模态模型要么未公开，要么使用困难，或专注于特定任务。这使 OpenAI 的 GPT-4 在这一领域中占据主导地位。

未来展望

「Gemini」的命运尚未确定，取决于两个未知因素：「Gemini Ultra」的发布日期以及 OpenAI 的 GPT-5。

尽管用户现在可以尝试「Gemini Pro」，但其更强大的兄弟版本将于 2024 年某时发布。AI 领域的快速发展使得人们很难预测 Ultra 发布时的情况，同时也给了 OpenAI 足够的时间来用新模型或对 GPT-4 的适度改进作出回应。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
Gemini 1.5 Pro API怎么申请注册使用？Gemini 1.5 Pro AI模型官网地址入口

Gemini1.5Pro是Google开发者平台推出的下一代AI模型。它支持语音理解、系统指令、JSON输出等新功能，并推出了新一代文本嵌入模型Gecko，性能大幅提升。要了解更多关于Gemini1.5Pro的信息，并开始体验这一先进的AI模型，请访问Gemini1.5Pro官网。

Gemini1.5Pro
Mini-Gemini:简单有效的AI框架，增强多模态视觉语言模型

中国香港中文大学和SmartMore的研究人员推出了一种名为Mini-Gemini的新颖框架，通过增强多模态输入处理来推动VLMs的发展。Mini-Gemini采用了双编码器系统和一种新颖的补丁信息挖掘技术，结合一个特别策划的高质量数据集，使其能够有效处理高分辨率图像并生成内容丰富的视觉和文本内容，从使其脱颖出。正如研究人员所承认的那样，Mini-Gemini在视觉理解和推理能力方面仍有改进�

Gemini Mini-Gemini AI头条
代码、模型全开源！贾佳亚团队多模态模型 Mini-Gemini登上热榜

香港中文大学终身教授贾佳亚团队最近推出了一款名为Mini-Gemini的多模态模型，该模型在多模态任务榜单上取得了显著成绩，其性能堪比GPT-4与DALLE3的结合。Mini-Gemini模型以其更精确的图像理解能力、更高质量的训练数据和更强的图像解析推理能力著称。这一成果不仅为开源社区带来了新的活力，也为多模态模型的发展和应用开辟了新的可能性。

Mini-Gemini AI头条
荐谷歌重磅发布Gemini 1.5 Pro：能自动写影评，理解视频！

4月10日凌晨，谷歌在官网正式发布了Gemini1.5Pro，现在可在180多个国家/地区使用。除了能生成创意文本、代码之外，Gemini1.5Pro最大的特色是能根据用户输入的文本提示，理解、总结上传的视频、音频内容进行深度总结，并且支持100万tokens上下文。Gemini1.5Pro已经全面开放使用了，有兴趣的小伙伴赶紧去试试吧。

Gemini1.5Pro Google AI
谷歌宣布Gemini 1.5 Pro开放API 新增多项功能

Google宣布开放其AI模型Gemini1.5Pro的API，这一版本在原有基础上进行了大幅度的功能扩展，现已在180多个国家提供。Gemini1.5Pro引入了对原生音频的理解能力，以及文件API和系统指令等新功能。这个新模型在MTEB基准测试中取得了更强的检索性能，超过了具有可比维度的所有现有模型。

Gemini1.5Pro AI头条
Gemini 即将开始收费开发者“白嫖”的好日子到头了

开发者白嫖Gemini的好日子结束了!近日，有开发者称收到了GeminiAPI团队的邮件，邮件通知称，Google将于2024年5月2日起更新GeminiAPI的附加服务条款，并开始对通过云计费账户进行的API请求收费。这项变更主要影响使用GoogleAIforDevelopers提供的GeminiAPI的用户不影响VertexAIGeminiAPI的用户。Google对用户选择使用GeminiAPI和GoogleAIStudio表示感谢，并期待继续为用户提供优质的服务。

Gemini AI头条
比Gemini Pro1.5强！可解读视频的多模态模型Pegasus-1公测

TwelveLabs最新发布了Pegasus-1的公测版本，这款视频-语言基础模型在视频理解领域取得了新突破。Pegasus-1是一款具有约17亿参数的视频-语言模型，能够以卓越的准确性和细节处理能力从视频输入中生成语言描述。Pegasus-1的不断进化与创新，为视频理解技术开辟新的可能性。

Pegasus-1 AI头条
荐李飞飞团队年度报告揭底大模型训练成本：Gemini Ultra是GPT-4的2.5倍

如何复盘大模型技术爆发的这一年?除了直观的感受，你还需要一份系统的总结。斯坦福HAI研究所发布了第七个年度的AIIndex报告，这是关于人工智能行业现状的最全面的报告之一。该指数中的其他图表显示，不同人群的观点存在显著差异，年轻人更倾向于乐观地看待人工智能将如何改变他们的生活。

李飞飞 GeminiUltra GPT-4
荐今日AI：ChatGPT免注册可使用；开发者没法“白嫖”Gemini了；AI程序员首次入职科技公司；DALL·E聊天就能改图了

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

ChatGPT
Adobe发布新一代图像生成模型Firefly Image3，号称迄今为止最好

Adobe发布了Firefly图像生成模型的最新版本，名为FireflyImage3，声称具有“摄影细节”的图像生成能力。相比之前的版本，这一第三代模型在图像生成能力上有了显著的改进。即使是新手用户也可以在Photoshop中游刃有余，并更快地成为高级用户，PhotoshopgentechAI产品管理总监JohnMetzger表示。

Adobe FireflyImage3 AI头条

今日大家都在搜的词：

热文

3 天
7天

Gemini 是谷歌迄今为止的 AI 模型 但充满希望的基准测试和演示最终引发了批评

谷歌陷入困境的演示

性能比较

未来展望

今日大家都在搜的词：

热文

站长商机

Gemini 是谷歌迄今为止的 AI 模型但充满希望的基准测试和演示最终引发了批评