斯坦福大学研究生开发名为PIGEON的AI模型仅通过几张照片找到你的位置

2023-12-20 10:26 · 稿源：站长之家

划重点:
- 研究生们在斯坦福大学开发出一款 AI 模型，可以通过查看 Google 街景图像，以令人印象深刻的准确率确定具体位置。
- 这款名为 PIGEON 的应用程序可以在很大程度上准确地确定 Google 街景中的具体位置，其预测国家的准确率达到92%，并且在40%的猜测中可以将位置定位在目标位置的25公里范围内。
- 该模型基于 OpenAI 开发的神经网络 CLIP，以及 GeoGuessr 游戏的数据集进行训练，取得了令人印象深刻的成果。

站长之家（ChinaZ.com）12月20日消息:斯坦福大学的研究生们开发了一款名为 PIGEON 的应用程序，可以仅仅通过查看 Google 街景图像或其他图像来确定具体位置，其准确率令人印象深刻。

根据预印本论文的数据，PIGEON 可以以92%的准确率预测所拍摄国家，并且在40%的猜测中可以将位置定位在目标位置的25公里范围内。该论文指出，PIGEON 在 GeoGuessr 游戏中排名前0.01%的玩家之内，该游戏要求用户根据所拍摄的 Google 街景图像猜测位置，这也是这个项目的灵感来源。

那么，PIGEON 是如何工作的呢?

学生们利用了 OpenAI 开发的神经网络 CLIP，通过对视觉类别名称进行训练，使其能够将文本和图像进行连接。然后，他们根据 GeoGuessr 的数据集进行了训练，该数据集包含了10万个原始随机采样的地点和四张图像，以覆盖给定位置的整个 “全景”，总共有40万张图像。与其他 AI 模型训练的图像数量相比，PIGEON 的训练图像数量相对较少。例如，OpenAI 流行的图像生成模型 DALL-E2是基于数亿张图像进行训练的。

此外，学生们还研发了一个名为 PIGEOTTO 的单独模型，该模型通过训练来自 Flickr 和维基百科的400万张照片，以从单张图像中识别位置。根据论文的数据，PIGEOTTO 在图像地理定位基准测试中取得了令人印象深刻的成绩，在城市准确度方面超过先前的最新技术结果7.7%，在国家准确度方面超过29.8%。

论文还探讨了与该模型相关的伦理考虑，包括其益处和风险。在一方面，图像地理定位具有许多积极的用途，例如自动驾驶、视觉调查以及满足对照片拍摄地点的好奇心。然而，其负面影响包括对隐私的最直接侵犯。因此，学生们决定不公开发布模型权重，仅在学术验证时发布代码。

这项研究为我们展示了 AI 在图像地理定位方面的巨大潜力，但也引发了隐私和伦理方面的一些担忧。在将来的发展中，必须更加重视这些问题，并确保合适的保护措施得以实施。

论文网址:https://arxiv.org/abs/2307.05845

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
CS25官网体验入口斯坦福大学深度学习AI课程免费在线使用地址

CS25是斯坦福大学提供的一门课程，主要探讨深度学习模型Transformers，该模型在全球范围内产生了巨大影响。课程邀请了Transformers研究领域的前沿人物，讨论从GPT和Gemini等LLM架构到创造性应用在内的最新突破。要了解更多关于CS25课程的信息，以及开始您的深度学习之旅，请访问CS25官方网站。

CS25
职高女孩逆袭成双一流大学研究生：展现不凡毅力和努力

职高女孩赵殷樱的励志故事在社交媒体上引起了广泛关注。这位女孩用九年的时间逆袭成为双一流大学研究生，展现了她不凡的毅力和努力。赵殷樱的故事激励着我们不断前行，无论遇到多大的困难和挑战，我们都应该坚定信念，勇往直前。

职高女孩励志故事双一流大学
职高女孩逆袭成双一流大学研究生：有梦想谁都了不起

近日，职高女孩赵殷樱用9年逆袭成为双一流大学研究生，引发关注。2012年，赵殷樱的中考成绩并不理想，于是她进入了职业高中，从那时起，她就坚定了高考的目标，并且经历了两次高考，最终成功考入了专科。如果能够勇敢地面对困难，积极寻找解决问题的方法，那么就能够逐渐克服障碍，向梦想迈进。

赵殷樱职高女孩双一流大学研究生
斯坦福大学发布2024年人工智能指数报告:十大要点解析

在2024年4月19日，斯坦福大学以人为中心的人工智能研究所发布了其备受瞩目的2024年人工智能指数报告。这份全面的研究报告深入分析了人工智能的现状，探讨了主要趋势、进步和挑战。这份报告的见解可以作为导航AI领域的宝贵资源，帮助我们为实现一个更加公平、可持续和有益的AI驱动未来制定路线。
阿里AI模型EMO免费上线通义APP 一张照片即可开口唱歌说话

阿里云宣布，EMO模型成功在通义APP中上线，并且完全开放给所有用户免费使用。在通义千问APP内，用户只需简单三步操作:选择模版、上传照片、生成视频，即可轻松实现照片中人物演戏唱歌的神奇效果。通义APP还不断推出实用功能，如超长文档解析、AI编码助手、AI会议助手等，为用户提供全方位的超级AI助手服务。

阿里云 EMO模型通义APP
荐奥特曼斯坦福演讲：专注当前AI局限性没用，GPT-5让一切努力过时

黄仁勋亲自为OpenAI送来了全球第一台NvidiaDGXH200超级计算机，三人合影引得大家津津乐道。奥特曼也没闲着，现身斯坦福大学的Nvidia礼堂发表演讲，大约超过1000名学生排起了长队。奥特曼表示一年前他们推出的GPT-4曾引发了人们两周的恐慌，人们认为这是一件疯狂的事，世界被永远改变了。

GPT-5
斯坦福团队大模型Octopus v2火了：手机就能运行准确性超越GPT-4

斯坦福大学研究人员发布的Octopusv2模型引起了开发者社区的极大关注，其20亿参数的模型一夜下载量超过2k。这一模型可以在智能手机、汽车、个人电脑等端侧设备上运行，并在准确性和延迟方面表现超越了GPT-4，同时将上下文长度减少了95%。设备端AI智能体时代即将到来，Octopusv2的发布为这一趋势注入了新的活力。

Octopusv2 AI头条
斯坦福推可以在手机端跑的大模型 Octopusv2超越GPT-4一夜爆火

斯坦福大学的研究团队近日推出了一款名为Octopusv2的新型人工智能模型，这款模型以其在端侧设备上的强大运行能力受到广泛关注。论文:Octopusv2:On-devicelanguagemodelforsuperagent论文地址:https://arxiv.org/abs/2404.01744模型主页:https://huggingface.co/NexaAIDev/Octopus-v2Octopusv2的推出，标志着设备端AI智能体时代的来临。对于那些对AI技术充满热情的开发者和企业来说，Octopusv2无疑提供了一个全新的�

Octopusv2
马里兰大学开发出“隐形斗篷” 可让监控无法识别到你

马里兰大学帕克分校与FacebookAI的研究人员合作，开发了一种能够在物理和数字环境中有效降低对象检测器性能的对抗性模式。这项技术通过在物体上覆盖特定图案来欺骗检测器，使其无法正确识别对象，类似于一种“隐形斗篷”。更多信息和论文可以在马里兰大学的相关项目网站和arXiv上找到。

监控
Spline发布3D生成工具AI 3D Generation 支持文/图生3D模型及混合编辑3D模型

Spline的最新3D生成工具的发布，标志着3D设计领域的一次重大进步。这款在线3D编辑工具不仅支持从文字和图片生成3D模型能够混合和编辑3D模型，为用户提供了一个全面强大的3D设计解决方案。这意味着用户可以始终接触到行业的最新趋势，并将这些新功能应用到自己的项目中，保持创作的前沿性和创新性。

3D模型 AI头条

TravAI:是一款AI驱动的旅行培训产品，提供交互式AI培训、模拟、评估和智能助手，为旅行行业人员提供最新的技能和知识。

TravAI是一款旅行行业的AI驱动培训产品，通过注入AI技术，为培训注入活力。它能创建引人入胜、交互式的培训课程，进行逼真的角色扮演模拟，并设计能够真正起作用的测验。同时，TravAI利用您的数据为旅行团队量身定制个性化学习体验，让培训不再是通用的、一刀切的。它是培训旅行业专业人员的更智能、更快速的方式。

旅行培训 AI

Nextminds:是一家提供在线辅导服务的平台，为所有科目和学术水平的学生提供个性化辅导。

Nextminds是一个提供在线辅导服务的平台，通过与经验丰富的导师在线互动，为学生提供个性化的学习经验。平台提供ICSE、CBSE和州委员会等多种教育体系的辅导。Nextminds的主要优点是学生可以在舒适的家中与专业的导师进行一对一的在线学习，为学生提供高质量的辅导服务。

在线辅导学习个性化

Pedagogue.io:每天花费10分钟，提升您的AI技能。

Pedagogue是一款AI技能培训平台，旨在帮助个人和企业提升AI技能。通过该平台，用户可以学习AI工具、技术和策略，并获得40%的生产力提升。Pedagogue的优势在于更新及时的内容库、个性化的技能培养、有趣的学习方式以及具有商业价值的数据驱动洞察。

AI 技能培训教育

LexiGym:你的语言学习伴侣。🚀 # #HinkouLabs

LexiGym是一款语言学习应用，帮助用户提升语言技能。它具有离线和多语言支持的创新功能，是最强大的语言学习伴侣。用户可以根据自己的预算选择免费使用或付费订阅，灵活选择学习方式。LexiGym还提供易于创建字典和智能学习等功能，以及详细的训练统计数据。

语言学习词汇训练多语言

Alevels.ai:A Levels AI是一个利用人工智能提高A Levels学习成绩的工具。

A Levels AI利用人工智能技术，提供个性化的学习计划和辅导资源，帮助学生在A Levels考试中取得优异成绩。它通过分析学生的学习情况和弱点，为其提供针对性的学习建议和练习题。A Levels AI还提供实时答疑和学习进度跟踪功能，帮助学生更好地掌握知识。

教育考试辅导人工智能

MailReply:是一款AI助手，可生成专业且人性化的邮件回复，节省时间。

MailReply通过AI生成邮件回复，帮助用户节省时间。它可以在保持人类写作风格的同时，根据邮件内容生成上下文相关的回复。MailReply适用于Windows和macOS，并兼容多种邮件客户端。

邮件回复 AI助手工具

Notification harbor:高性能团队的电子邮件营销平台

Notification harbor是一个为电子邮件营销团队提供AI优化的电子邮件内容和自动化流程的平台。通过使用LLM技术，我们可以在短短5分钟内创建高性能的电子邮件营销内容，并且随着时间的推移，产品甚至可以自我优化。我们的平台简化了电子邮件营销活动的方式，确保每个活动都能精准地与您的目标受众建立联系。AI生成的电子邮件模板根据您提供的信息和要求选择最合适的模板。实时个性化电子邮件可以提高用户参与度和转化率，并根据每个用户实时定制内容。AI驱动的电子邮件营销使您的团队在创建电子邮件模板和文本方面节省了60％的时间。

电子邮件电子邮件营销 AI优化

Magic Loops:通过结合ChatGPT自动化与代码，创建简单的自动化任务

Magic Loops是一种基于ChatGPT的自动化工具，可以连接数据、发送电子邮件、接收短信、爬取网站等功能。它能够帮助用户自动化生活中的各种任务，提高工作效率。Magic Loops的主要优点是可以与各种数据源和应用程序集成，轻松实现个性化的自动化需求。

自动化工具 ChatGPT

ReplyAuto:Reply Auto是一款AI邮件助手，能够根据上下文理解邮件内容，并提供智能回复。

Reply Auto是一款使用AI技术的邮件助手，它能够自动分析邮件内容，根据上下文提供智能回复。它的主要优点是提高工作效率，减轻用户的邮件负担，并能够个性化定制回复。Reply Auto定位于帮助用户更高效地处理电子邮件，提高工作效率。

邮件智能回复工作效率

Mailman Workcation:智能邮递员 - 自动化影响力的智能Twitter机器人

AI Mailman利用最新的人工智能技术创建世界上最准确的邮件，比人类更快速和高质量。它提供简单的用户界面，能够创建世界上最强大的邮件模板，打开率更高。使用AI Mailman创建的邮件打开率是其他方式的10倍，生成时间只需10秒。

邮件自动化影响力

Inpost:一款AI驱动的移动应用程序，可以改善个人电子邮件体验。

Inpost.ai是一款基于AI的移动应用程序，可以优化个人电子邮件体验。它帮助用户智能地组织和清理收件箱，专注于重要的电子邮件。它提供无缝的邮件交互，提供增强的安全性和独家功能。通过高级AI模型分析邮件内容，而不暴露用户的敏感信息。用户可以轻松追踪支出、管理发票，并利用促销优惠来优化个人预算。Inpost.ai还提供定制的收件箱分类，让用户能够个性化和高效地管理和优化收件箱。

电子邮件 AI 个人化

Leadog:AI驱动的冷邮件营销、线索跟踪和互动

Leadog.io是一款AI驱动的冷邮件营销平台，提供冷邮件发送、线索跟踪和互动等功能。它采用先进的AI技术来优化冷邮件营销策略，提供精确的邮件投递和跟踪，帮助用户更好地了解和转化潜在客户。

冷邮件线索跟踪营销工具

Prospect AI:一键查找网站上的电子邮件地址和联系人信息

Prospect AI是一款插件，可以帮助销售团队、数字营销人员和公关专业人员免费查找公司的联系人。它使用人工智能技术，快速获取所需的联系人信息，帮助用户拓展业务关系。

市场营销销售潜在客户

Email whisperer:写作完美邮件，让你的电子邮件沟通更上一层楼！

Email Whisperer是一个用于Gmail和Outlook的AI电子邮件编写工具。它可以帮助你轻松地写出完美的电子邮件，提供重新表达、拼写检查和修正功能。它能够提高你电子邮件的清晰度和风格，并确保邮件无错误。Email Whisperer是一个提高电子邮件写作效率的工具，让你的邮件专业而准确。

生产力电子邮件 AI工具

Humanize AI by AI Text Converter:将AI生成的文本转换为与人类写作相匹配的内容。

Humanize AI Text是一个免费在线的AI文本人性化转换工具，能够绕过AI检测，并将AI生成的文本转换为与人类写作相匹配的内容。

AI转换工具文本人性化 AI检测绕过

Happily.ai:使用，超越传统调查。我们的AI平台分析员工情绪，提供可操作的见解，为健康、投入、高绩效的团队提供支持。

Happily.ai是一个AI工具包，帮助人力资源和经理人通过无忧无虑的参与、认可和绩效管理来提高人才留存和团队生产力。

员工参与度人力资源绩效管理

ChatKPI:是一款基于AI的数据分析工具，可以通过文本消息跟踪销售趋势、识别热门产品、了解客户行为，提供图表、定制CSV等功能。

ChatKPI是一个AI数据分析工具，旨在帮助Shopify商家做出更明智的数据驱动决策。它可以提供实时洞察力，跟踪销售趋势，识别热门产品，了解客户行为，并通过自然语言对话提供个性化的商业洞察。ChatKPI可以通过文本消息或在Shopify商店内安装的应用程序使用。

数据分析销售趋势热门产品

Limodify.AI | Email Marketing Design Meets AI:Limodify.AI通过AI技术提供电子商务邮件创建服务。

Limodify.AI革新了电子商务邮件的创建过程，只需点击几下，选择格式，输入关键信息，即可在30秒内获得准备好发送的AI设计的邮件。节省时间，利用先进技术，精确实现您的营销目标。立即免费开始使用。

电子商务邮件营销 AI

PurplePro:使用AI技术，只需两个点击即可启动您的忠诚度俱乐部。

PurplePro是一个使用AI技术的插件，它可以帮助您在短短两个点击的时间内启动您的忠诚度俱乐部。PurplePro通过游戏化和动态的积分规则增加用户参与度，并奖励他们。它还提供了强大的推荐、挑战、问卷和可变奖励功能，帮助您将首次用户转化为忠实的客户。

忠诚度俱乐部用户参与度奖励

LISUTO:株式会社は、eコマースのセラーやマーケットプレイスが売上を増やし、時間を節約し、コアビジネスに集中できるスマートデータ構造化ソリューションのリーダーです。

LISUTO株式会社は、eコマースのセラーやマーケットプレイスが売上を増やし、時間を節約し、コアビジネスに集中できるスマートデータ構造化ソリューションのリーダーです。LISUTO AIは、AIタッガーやイメージタッガーなどのサービスを提供し、商品のタグ登録やナビゲーション改善などを自動化し、効率を向上させます。

斯坦福大学研究生开发名为PIGEON的AI模型 仅通过几张照片找到你的位置

今日大家都在搜的词：

热文

站长商机

斯坦福大学研究生开发名为PIGEON的AI模型仅通过几张照片找到你的位置