谷歌Gemini1.5新功能揭秘:上下文挑战重现准确性

2024-02-21 09:05 · 稿源：站长之家

站长之家（ChinaZ.com）2月21日消息:近日，Google Gemini1.5推出了一项令人瞩目的技术突破，该版本引入了一个拥有高达一百万个令牌的上下文窗口功能。这项新功能旨在处理完整的书籍甚至电影，其准确性关注。

尽管Gemini1.5的上下文窗口容量庞大，但可能仍存在不准确再现信息的可能性。在“海底捞针”测试中，该系统需要提取多达100条特定信息，但平均准确度仅在60%至70这项任务相对于复杂文档的摘要撰写而言仍然要简单一些。

值得一提的是，在谷歌对维克多·雨果的《悲惨世界》进行的更复杂的测试中，他们提出了100个问题，共涉及710，000个标记，并使用“归因于已识别来源”的方法进行答案评估。结果显示，在人工评估中，80% 的答案可归因于源文档，而在机器评估中则有91% 的答案可归因于源文档。然而，这一基准倾向目前的权威及其与原著作者之间存在细微的差异。

在“大海捞针”测试中，模型必须在上下文窗口中找到一条信息。这与LLM的实际应用场景关系不大。 |图片:谷歌

尽管社交媒体上对Gemini1.5的积极评价络并不绝，但即将对其准确性进行更深入的评估。大多数评论焦点于功能测试，缺乏对源材料的深入了解。如果信息检索的可信度不高，即使在复杂的查询下，巨大的上下文窗口可能仍然存在问题。

可见， Gemini1.5Pro 提供了令人印象深刻的技术突破，但在实践中，提取复杂的信息仍然是一个挑战。如果其可靠性低于90%，那么实际中的巨大容量的上下文窗口运用中可能并不具备专业的帮助。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
谷歌宣布Gemini 1.5 Pro开放API 新增多项功能

Google宣布开放其AI模型Gemini1.5Pro的API，这一版本在原有基础上进行了大幅度的功能扩展，现已在180多个国家提供。Gemini1.5Pro引入了对原生音频的理解能力，以及文件API和系统指令等新功能。这个新模型在MTEB基准测试中取得了更强的检索性能，超过了具有可比维度的所有现有模型。

Gemini1.5Pro AI头条
Gemini 1.5 Pro API怎么申请注册使用？Gemini 1.5 Pro AI模型官网地址入口

Gemini1.5Pro是Google开发者平台推出的下一代AI模型。它支持语音理解、系统指令、JSON输出等新功能，并推出了新一代文本嵌入模型Gecko，性能大幅提升。要了解更多关于Gemini1.5Pro的信息，并开始体验这一先进的AI模型，请访问Gemini1.5Pro官网。

Gemini1.5Pro
荐谷歌重磅发布Gemini 1.5 Pro：能自动写影评，理解视频！

4月10日凌晨，谷歌在官网正式发布了Gemini1.5Pro，现在可在180多个国家/地区使用。除了能生成创意文本、代码之外，Gemini1.5Pro最大的特色是能根据用户输入的文本提示，理解、总结上传的视频、音频内容进行深度总结，并且支持100万tokens上下文。Gemini1.5Pro已经全面开放使用了，有兴趣的小伙伴赶紧去试试吧。

Gemini1.5Pro Google AI
Gemini 即将开始收费开发者“白嫖”的好日子到头了

开发者白嫖Gemini的好日子结束了!近日，有开发者称收到了GeminiAPI团队的邮件，邮件通知称，Google将于2024年5月2日起更新GeminiAPI的附加服务条款，并开始对通过云计费账户进行的API请求收费。这项变更主要影响使用GoogleAIforDevelopers提供的GeminiAPI的用户不影响VertexAIGeminiAPI的用户。Google对用户选择使用GeminiAPI和GoogleAIStudio表示感谢，并期待继续为用户提供优质的服务。

Gemini AI头条
Mini-Gemini:简单有效的AI框架，增强多模态视觉语言模型

中国香港中文大学和SmartMore的研究人员推出了一种名为Mini-Gemini的新颖框架，通过增强多模态输入处理来推动VLMs的发展。Mini-Gemini采用了双编码器系统和一种新颖的补丁信息挖掘技术，结合一个特别策划的高质量数据集，使其能够有效处理高分辨率图像并生成内容丰富的视觉和文本内容，从使其脱颖出。正如研究人员所承认的那样，Mini-Gemini在视觉理解和推理能力方面仍有改进�

Gemini Mini-Gemini AI头条
比Gemini Pro1.5强！可解读视频的多模态模型Pegasus-1公测

TwelveLabs最新发布了Pegasus-1的公测版本，这款视频-语言基础模型在视频理解领域取得了新突破。Pegasus-1是一款具有约17亿参数的视频-语言模型，能够以卓越的准确性和细节处理能力从视频输入中生成语言描述。Pegasus-1的不断进化与创新，为视频理解技术开辟新的可能性。

Pegasus-1 AI头条
荐AI日报：GPT-4-Turbo正式版自带读图能力；Gemini1.5Pro开放API；SD3将于4月中旬发布；抖音宫崎骏AI特效爆火

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

GPT4
代码、模型全开源！贾佳亚团队多模态模型 Mini-Gemini登上热榜

香港中文大学终身教授贾佳亚团队最近推出了一款名为Mini-Gemini的多模态模型，该模型在多模态任务榜单上取得了显著成绩，其性能堪比GPT-4与DALLE3的结合。Mini-Gemini模型以其更精确的图像理解能力、更高质量的训练数据和更强的图像解析推理能力著称。这一成果不仅为开源社区带来了新的活力，也为多模态模型的发展和应用开辟了新的可能性。

Mini-Gemini AI头条
手机被黑客入侵后会自动息屏？安卓15新功能绝了

根据最近发布的Android15DeveloperPreview2代码，一项隐藏特性被发现：检测用户是否正在使用手机，如果处于未使用状态，则自动关闭屏幕。默认情况下，在30秒内未使用手机时会自动息屏，再过5秒后会自动锁定屏幕。然代码并没有提及实现方式，可能是借助前置摄像头来判断用户当前是否正在使用手机。

Android 15 Developer
荐李飞飞团队年度报告揭底大模型训练成本：Gemini Ultra是GPT-4的2.5倍

如何复盘大模型技术爆发的这一年?除了直观的感受，你还需要一份系统的总结。斯坦福HAI研究所发布了第七个年度的AIIndex报告，这是关于人工智能行业现状的最全面的报告之一。该指数中的其他图表显示，不同人群的观点存在显著差异，年轻人更倾向于乐观地看待人工智能将如何改变他们的生活。

李飞飞 GeminiUltra GPT-4

今日大家都在搜的词：

热文

3 天
7天

谷歌Gemini1.5新功能揭秘:上下文挑战重现准确性

今日大家都在搜的词：

热文

站长商机