斯坦福大学研究生开发名为PIGEON的AI模型仅通过几张照片找到你的位置

2023-12-20 10:26 · 稿源：站长之家

划重点:
- 研究生们在斯坦福大学开发出一款 AI 模型，可以通过查看 Google 街景图像，以令人印象深刻的准确率确定具体位置。
- 这款名为 PIGEON 的应用程序可以在很大程度上准确地确定 Google 街景中的具体位置，其预测国家的准确率达到92%，并且在40%的猜测中可以将位置定位在目标位置的25公里范围内。
- 该模型基于 OpenAI 开发的神经网络 CLIP，以及 GeoGuessr 游戏的数据集进行训练，取得了令人印象深刻的成果。

站长之家（ChinaZ.com）12月20日消息:斯坦福大学的研究生们开发了一款名为 PIGEON 的应用程序，可以仅仅通过查看 Google 街景图像或其他图像来确定具体位置，其准确率令人印象深刻。

根据预印本论文的数据，PIGEON 可以以92%的准确率预测所拍摄国家，并且在40%的猜测中可以将位置定位在目标位置的25公里范围内。该论文指出，PIGEON 在 GeoGuessr 游戏中排名前0.01%的玩家之内，该游戏要求用户根据所拍摄的 Google 街景图像猜测位置，这也是这个项目的灵感来源。

那么，PIGEON 是如何工作的呢?

学生们利用了 OpenAI 开发的神经网络 CLIP，通过对视觉类别名称进行训练，使其能够将文本和图像进行连接。然后，他们根据 GeoGuessr 的数据集进行了训练，该数据集包含了10万个原始随机采样的地点和四张图像，以覆盖给定位置的整个 “全景”，总共有40万张图像。与其他 AI 模型训练的图像数量相比，PIGEON 的训练图像数量相对较少。例如，OpenAI 流行的图像生成模型 DALL-E2是基于数亿张图像进行训练的。

此外，学生们还研发了一个名为 PIGEOTTO 的单独模型，该模型通过训练来自 Flickr 和维基百科的400万张照片，以从单张图像中识别位置。根据论文的数据，PIGEOTTO 在图像地理定位基准测试中取得了令人印象深刻的成绩，在城市准确度方面超过先前的最新技术结果7.7%，在国家准确度方面超过29.8%。

论文还探讨了与该模型相关的伦理考虑，包括其益处和风险。在一方面，图像地理定位具有许多积极的用途，例如自动驾驶、视觉调查以及满足对照片拍摄地点的好奇心。然而，其负面影响包括对隐私的最直接侵犯。因此，学生们决定不公开发布模型权重，仅在学术验证时发布代码。

这项研究为我们展示了 AI 在图像地理定位方面的巨大潜力，但也引发了隐私和伦理方面的一些担忧。在将来的发展中，必须更加重视这些问题，并确保合适的保护措施得以实施。

论文网址:https://arxiv.org/abs/2307.05845

（举报）

相关推荐

关键词：

有AI就有无限可能，灰豚AI发布新一代GEO系统

11月1日，灰豚AI发布新一代GEO系统，突破传统仅支持文本内容优化的局限，全面支持国内短视频平台作品优化，实现近乎零算力成本。该技术被视作行业重大创新，是当前国内GEO源头厂商的重要突破。系统通过AI训练提升企业在生成式搜索中的品牌影响力，助力企业获得竞争优势。未来电商将从平台化转向AI化，灰豚GEO系统支持多种合作模式，让企业以业务增长为导向，抢占AI市场先机。

灰豚AI GEO系统短视频优化
新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

苹果因自研大模型项目遇瓶颈，决定引入谷歌Gemini大模型升级Siri，计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数，将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能，支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送，后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

苹果谷歌Gemini Siri升级
AI搜索可见性监控：如何免费查询品牌GEO指数

在AI颠覆流量格局的今天，传统SEO已无法满足品牌传播需求。用户通过生成式引擎直接获取答案，品牌能否被AI准确采纳决定市场可见度。GEO（生成引擎优化）应运而生，通过追踪品牌在AI流量中的表现，量化评估并优化内容策略。AIBase平台提供专业GEO监控工具，覆盖主流AI模型，生成指数化报告，帮助品牌抢占AI搜索高地，避免在智能回复中"隐形"。

GEO 生成引擎优化品牌监控
GEO时代必备：品牌AI搜索监控实操指南，用AIBase抢占AI可见性高地

随着生成式AI成为主流信息入口，GEO（生成引擎优化）成为企业品牌曝光的关键。其核心是让品牌信息成为AI生成答案的首选引用源，而品牌AI搜索监控正是落地GEO策略的关键抓手。AIBase平台提供品牌监控服务，帮助企业精准追踪AI搜索可见性、解析GEO指数，实现数据驱动的优化。通过多平台覆盖、核心指标追踪和竞品对标分析，让品牌在AI生态中精准占位，提升权威性与可见性�

GEO 品牌AI搜索监控生成引擎优化
荐AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

本期AI日报聚焦多项技术突破：HeyGen推出精准唇形同步的视频翻译引擎；科大讯飞发布星火X1.5大模型，提升多语言处理能力；QQ浏览器新增AI助手浮窗；科大讯飞推出软硬一体方案，实现高噪声环境精准识别；谷歌Gemini 3 Pro预览版支持百万级上下文窗口；Comfy Cloud让Stable Diffusion实现零门槛创作；谷歌Gemini新增深度研究功能，可整合邮件生成智能报告；上海AgiBot机器人10分钟完成复杂制造任务，重塑生产效率。

AI视频翻译唇形同步跨语言本地化
AI搜索时代，谁把GEO品牌监控做到位谁就能先赢

AI搜索正颠覆传统品牌营销：2025年3.2亿中文用户遇事首选AI问答，模型答案直接决定品牌生死。用户问“敏感肌防晒”，AI秒推竞品却忽略你家品牌——这种场景每日上演。品牌面临四大盲区：新品被AI推荐旧款、遭竞品对比抹黑、被误标为“廉价版”、海外模型产生偏见。AIBase工具提供解决方案：监控12大主流模型，实时追踪品牌提及率、情感倾向、竞品差距，配套优化指南助品牌提升2.7倍引用概率。在AI0.3秒定生死的时代，品牌必须主动掌握搜索话语权。

AI搜索品牌认知敏感肌防晒
GEO时代:如何通过AI搜索可见性监控抢占品牌制高点

随着AI搜索普及，传统SEO正被GEO（生成引擎优化）取代。品牌需在AI回答中保持高曝光和正面提及，这成为未来竞争力核心。文章提出GEO指数作为量化品牌在AI模型中被引用程度的关键指标，并介绍AIBase工具如何通过监控主流AI模型、分析竞争情报、追踪提示词等方式，帮助品牌精准掌握AI搜索可见性，实现从被动应对到主动管理的跨越。

GEO AI搜索品牌曝光
GEO指数上升代表什么？AI搜索时代的品牌健康信号

本文解析GEO指数（生成式引擎优化指数）的核心价值：衡量品牌在AI搜索生态中的可见度与影响力，包含曝光频率、推荐排名和场景覆盖三大维度。指数上升意味着品牌在用户决策链前置、认知度提升、竞争优势扩大及内容策略见效。需通过建立基准线、选用自动化工具（如覆盖国产AI平台的AIBase）、定期分析趋势及对标竞品来持续监控。避免三个误区：过度追求绝对数值、被短期波动干扰、忽略业务相关性。GEO指数本质是品牌在AI时代的健康度信号。
用了3个月GEO监控，我发现品牌在AI推荐中的5个真相

文章探讨AI搜索时代企业面临的新挑战：用户转向ChatGPT、豆包等平台直接提问，导致传统搜索引擎询盘量下降。核心提出GEO品牌监控概念，需关注品牌在AI推荐中的曝光率、排名位置、提及场景等5个关键指标。通过工具持续监控并优化内容，可提升AI搜索可见性。数据显示GEO投入回报率达1:3.71，建议企业尽早布局抢占新兴流量入口。
GEO品牌监控:让AI搜索结果优先推荐你

2025年AI搜索崛起，品牌曝光逻辑被彻底改写。传统SEO优化网页排名，现在需通过GEO（生成引擎优化）让AI模型主动推荐品牌。AI回答决定爆款命运，若未被提及则在新搜索中"隐形"。AIBase推出的GEO品牌监控工具，帮助品牌重塑在AI搜索中的可见性，提供全平台曝光监测、竞品对比及优化建议，让品牌从被动等待转为主动引导，成为AI首选推荐。

AI搜索品牌曝光 GEO

今日大家都在搜的词：

热文

3 天
7天

斯坦福大学研究生开发名为PIGEON的AI模型仅通过几张照片找到你的位置

有AI就有无限可能，灰豚AI发布新一代GEO系统

新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

AI搜索可见性监控：如何免费查询品牌GEO指数

GEO时代必备：品牌AI搜索监控实操指南，用AIBase抢占AI可见性高地

荐AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

AI搜索时代，谁把GEO品牌监控做到位谁就能先赢

GEO时代:如何通过AI搜索可见性监控抢占品牌制高点

GEO指数上升代表什么？AI搜索时代的品牌健康信号

用了3个月GEO监控，我发现品牌在AI推荐中的5个真相

GEO品牌监控:让AI搜索结果优先推荐你

今日大家都在搜的词：

热文

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

特斯拉股东批准马斯克万亿美元薪酬包

曝折叠屏iPhone配2400万屏下摄像头预计2026年秋亮相

华为鸿蒙智行新款享界S9开启预订：预售价31.8万起

OPPO Find X9 Pro卫星通信版开启预售：6999元

何小鹏再回应机器人里藏真人质疑：现场展示内部结构

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

阿里回应饿了么更名：正处于灰度测试阶段

马斯克称若发现外星人证据就公开

AI日报：昆仑万维SkyReels V3模型上线；月之暗面推Kimi Linear

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

华为Mate70 Air官宣今日开启预售

vivo Y500 Pro官宣11月10日发布：同档首发2亿HP5主摄

站长商机

斯坦福大学研究生开发名为PIGEON的AI模型 仅通过几张照片找到你的位置

今日大家都在搜的词：

热文

站长商机

斯坦福大学研究生开发名为PIGEON的AI模型仅通过几张照片找到你的位置