谷歌Gemini1.5新功能揭秘:上下文挑战重现准确性

2024-02-21 09:05 · 稿源：站长之家

站长之家（ChinaZ.com）2月21日消息:近日，Google Gemini1.5推出了一项令人瞩目的技术突破，该版本引入了一个拥有高达一百万个令牌的上下文窗口功能。这项新功能旨在处理完整的书籍甚至电影，其准确性关注。

尽管Gemini1.5的上下文窗口容量庞大，但可能仍存在不准确再现信息的可能性。在“海底捞针”测试中，该系统需要提取多达100条特定信息，但平均准确度仅在60%至70这项任务相对于复杂文档的摘要撰写而言仍然要简单一些。

值得一提的是，在谷歌对维克多·雨果的《悲惨世界》进行的更复杂的测试中，他们提出了100个问题，共涉及710，000个标记，并使用“归因于已识别来源”的方法进行答案评估。结果显示，在人工评估中，80% 的答案可归因于源文档，而在机器评估中则有91% 的答案可归因于源文档。然而，这一基准倾向目前的权威及其与原著作者之间存在细微的差异。

在“大海捞针”测试中，模型必须在上下文窗口中找到一条信息。这与LLM的实际应用场景关系不大。 |图片:谷歌

尽管社交媒体上对Gemini1.5的积极评价络并不绝，但即将对其准确性进行更深入的评估。大多数评论焦点于功能测试，缺乏对源材料的深入了解。如果信息检索的可信度不高，即使在复杂的查询下，巨大的上下文窗口可能仍然存在问题。

可见， Gemini1.5Pro 提供了令人印象深刻的技术突破，但在实践中，提取复杂的信息仍然是一个挑战。如果其可靠性低于90%，那么实际中的巨大容量的上下文窗口运用中可能并不具备专业的帮助。

（举报）

相关推荐

关键词：

被AI引用才是真的流量：写出让GPT、Gemini主动引用的AI搜索友好型内容（实操清单 + 工具推荐）

本文系统介绍生成式引擎优化(GEO)的核心方法，帮助内容从“给人看”升级为“AI友好型”。关键策略包括：1.采用结构化写作框架，在开头设置可直接回答问题的“黄金段落”；2.运用分步清单、数据标注、FAQ等模块提升内容引用率；3.通过多平台同步分发增加曝光；4.使用AIBase等工具量化监测内容被AI引用的频率与场景，并给出5天落地执行表。

AI搜索友好型内容创作 GEO Generative
荐AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停Sora生成已故名人；谷歌推出Gemini地图数据集成工具

视觉中国与多家AI公司合作开发可商用视觉大模型，已获阿里、微软等订单。OpenAI因不当内容暂停Sora生成马丁·路德·金形象视频，引发AI伦理讨论。DeepSeek在加密货币交易实验中表现领先。WhatsApp将禁止第三方通用AI聊天机器人，仅保留Meta AI。宇树科技推出仿人机器人Unitree H2，具备拟人化设计。谷歌为Gemini集成地图数据工具，可访问25亿地点实时信息。Opera推出集成三款AI助手的Neon浏览器，但用户体验存在困惑。Facebook在美加推出AI照片编辑建议功能，可分析手机未分享照片。

AI 视觉大模型版权合规
荐AI日报：快手KAT-Dev代码模型开源登顶；全球首款IP66防护人形机器人DR02发布；谷歌Chrome即将引入Gemini新功能

快手开源72B代码模型KAT-Dev在SWE-Bench测试中准确率达74.6%，创国产AI编程里程碑；杭州云深处推出全球首款IP66防护全候作业机器人DR02；谷歌Chrome将集成Gemini引发隐私担忧；学者指控苹果使用盗版书籍训练AI，版权争议再起；Liquid AI发布高效稀疏激活模型LFM2-8B-A1B；苹果拟收购Prompt AI布局智能家居视觉技术；AI伴侣应用泄露4300万条用户隐私对话；西湖大学DeepScientist显著提升科研效率。

AI日报快手72B代码模型 KAT-Dev
荐AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮融资；百度发布文档解析模型 PaddleOCR-VL

谷歌Gemini 3.0 Pro开始小范围推送，强化推理与多模态能力；百度发布全球领先文档解析模型PaddleOCR-VL，重塑OCR技术格局；爱诗科技完成亿元B+轮融资，ARR突破4000万美元；Anthropic推出Claude“skills”功能，提升AI工作效率；Pinterest推出AI内容限制工具，用户可自定义减少生成式图像；开源多模态模型LLaVA-OneVision-1.5超越Qwen2.5-VL；OpenAI视频生成模型Sora 2上线微软Azure平台，进入公共预览阶段；旅行搜索引擎Kayak推出“AI模式”，简化旅行规划与预订流程。

谷歌Gemini AI日报 DeepMind
荐更新功能、内测新App，抖音快手再战社交

抖音和快手又一次向社交领域发起进攻。近日，抖音、快手在站内密集更新了“日常”“说说”等一系列社交新功能;此外，抖音还被曝正在内测全新的社交App。当流量增长触及天花板，内容的稀缺性逐渐变弱，社交似乎成为了短视频巨头的“新叙事”。它们为何始终对“社交”念念不忘?这究竟是构筑护城河的必然选择，还是一场注定艰难的豪赌?

文章搜索核心标签社交功能
特斯拉全新功能上线：氛围灯会随音乐跳舞

特斯拉通过2025.26版OTA更新推出“音彩光舞”功能，让车内灯光随音乐律动，提升座舱氛围，还支持锐舞洞穴等玩法及专辑封面颜色匹配。同时上线“车鱼视听”应用，可登录抖音账号浏览视频、收听头条新闻，并支持Apple Music百首以上播放列表随机播放及自定义音频均衡器预设，优化听觉体验。此次升级大幅提升了座舱娱乐体验。

特斯拉 OTA升级座舱娱乐
荐AI日报：阿里发布紧凑型Qwen3-VL模型；科大讯飞AI翻译耳机全球首发；Gemini代码惊现Veo3.1

阿里巴巴发布紧凑型Qwen3-VL多模态模型，推动边缘设备AI应用；科大讯飞推出全球首款AI翻译耳机，支持60种语言实时翻译；谷歌NotebookLM集成图像生成功能，可将笔记转为动态视频；ChatGPT将于12月向成人开放限制内容并推出自定义交互功能；谷歌Gemini代码泄露Veo3.1视频模型升级迹象；马斯克宣布X平台将全面转向AI推荐系统；巨人网络与清华联合开源多方言语音合成框架DiaMoE-TTS；vivo公布X200系列影像升级计划；字节跳动开源文本驱动高保真人脸生成模型FaceCLIP。

AI技术多模态模型边缘计算
火车免费坐？12306今起又上新功能：积分可兑换车票

国铁集团10月20日宣布升级“铁路畅行”常旅客会员服务，重点针对14至28岁年轻会员推出更大幅度积分优惠：购票后可获票面金额10倍积分（普通会员为5倍），例如购1000元票可得1万分（价值100元）。同时拓展积分应用场景，新增列车座位升席功能，会员乘车时可通过扫描二维码或联系工作人员办理升席。积分还可用于兑换火车票（100分抵1元），但需注意兑换的车票仅可改签1次且不退票。此次升级旨在为年轻旅客提供更多出行便利与实惠。

铁路畅行常旅客会员积分优惠政策
告别伪升级 TCL携SQD-Mini LED亮相，「真极致」稳坐画质王座

过去十年电视画质难以同时实现高对比度和真实色彩。TCL通过SQD-Mini LED技术突破行业十年色域僵局：采用纯蓝光激发量子点，结合光学提纯器实现100% BT.2020全局高色域，解决传统RGB-Mini LED串色问题；配合20000+万象分区精准控光，控光效率远超普通分区。该技术从底层革新显示标准，终结“挤牙膏式”升级，成为高端电视画质新标杆。

电视画质对比度高色彩真实丰富
小米17 Pro背屏功能获赞卢伟冰：新功能开发持续推进中

小米17 Pro的副屏功能正加紧开发，投入超10亿元。该副屏采用与主屏同材质的龙晶玻璃，支持LTPO自适应刷新率技术，2.1英寸AMOLED屏幕横向覆盖后摄模组，兼具美观与实用。用户可通过副屏快速查看通知、接听来电，无需翻转手机；拍照时可作实时取景器，提升构图效率；还支持自定义壁纸功能。小米高管透露用户对副屏需求全面爆发，各类定制化诉求层出不穷，团队将持续推进新功能规划与开发。

小米17Pro 妙享背屏龙晶玻璃

今日大家都在搜的词：

热文

3 天
7天

谷歌Gemini1.5新功能揭秘:上下文挑战重现准确性

被AI引用才是真的流量：写出让GPT、Gemini主动引用的AI搜索友好型内容（实操清单 + 工具推荐）

荐AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停Sora生成已故名人；谷歌推出Gemini地图数据集成工具

荐AI日报：快手KAT-Dev代码模型开源登顶；全球首款IP66防护人形机器人DR02发布；谷歌Chrome即将引入Gemini新功能

荐AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮融资；百度发布文档解析模型 PaddleOCR-VL

荐更新功能、内测新App，抖音快手再战社交

特斯拉全新功能上线：氛围灯会随音乐跳舞

荐AI日报：阿里发布紧凑型Qwen3-VL模型；科大讯飞AI翻译耳机全球首发；Gemini代码惊现Veo3.1

火车免费坐？12306今起又上新功能：积分可兑换车票

告别伪升级 TCL携SQD-Mini LED亮相，「真极致」稳坐画质王座

小米17 Pro背屏功能获赞卢伟冰：新功能开发持续推进中

今日大家都在搜的词：

热文

五大升级！红米REDMI K90标准版采用6.59英寸黄金中尺寸

AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”

iOS 26液态玻璃效果能关了苹果iOS 26.1 Beta 4新增液态玻璃开

余承东官宣华为路由X3 Pro 采用“日照金山”设计

微信三大更新放出上热搜涉及群聊消息处理、消息撤回等

天猫双11战报发布：苹果iPhone成交额破纪录

真我GT8发布：售价2899元起骁龙8至尊版双芯

红米REDMI K90标准版亮相：质感、工艺脱胎换骨

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个

华为鸿蒙HarmonyOS 6公测版开启推送

五大升级！红米REDMI K90标准版采用6.59英寸黄金中尺寸

AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

iOS 26液态玻璃效果能关了苹果iOS 26.1 Beta 4新增液态玻璃开

AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停So

天猫双11今晚8点开卖品类券每人可领万元

余承东官宣华为路由X3 Pro 采用“日照金山”设计

火车免费坐？12306今起又上新功能：积分可兑换车票

REDMI K90 Pro Max本周四发布卢伟冰：给4K档一点小小的震撼

REDMI K90 Pro Max搭载小米17同款光影猎人950超大底主摄

站长商机