首页 > 业界 > 关键词  > 斯坦福最新资讯  > 正文

斯坦福推新AI模型 可快速找出图片中位置,准确率92%

2024-01-10 14:01 · 稿源:站长之家

站长之家(ChinaZ.com)1月10日 消息:一群斯坦福大学研究生发布了一个新项目,他们的AI模型经过了10万个随机位置、50万个街景图片以及其他图片的训练。这个模型能够快速准确地找出图片中的位置,目前的准确率达到了92%。

image.png

论文地址:https://arxiv.org/pdf/2307.05845.pdf

甚至在40%的猜测中,也能将真实地点缩小到25公里范围内。虽然这个项目在自动驾驶、视觉调查和安全方面有应用前景,但也存在潜在的隐私安全问题。

对于注重隐私的用户来说,可能不会在社交网络上发布自己周围的照片。因为有些人可以通过照片分析位置,从而带来潜在的隐私问题。尽管以前这种技术主要限于一些专业玩家,如B站UP主地球百科君,他有时会发布一些找照片位置的视频。但相信未来肯定会有其他类似的模型问世,因此保护隐私,不随意公开发布周围照片是非常重要的。

为了解决潜在的隐私安全问题,项目团队决定不公开该模型,仅基于学术目的共享代码。这样可以有效减少滥用该技术的可能性。所以对于普通用户来说,保护好隐私是至关重要的。

举报

  • 相关推荐
  • 3年1亿模型,年收入2.8亿:当AI大佬开始做游戏

    过去一年多,游戏行业对AI的态度渐渐回归理性。最初大家惊叹于各种大模型的生成效果,现在大家往往更关心现实问题:能嵌入开发管线吗?工作流是什么样?成本和效果又如何? Meshy AI创始人兼CEO胡渊鸣在今年GDC上用一组对比强烈的数据作为开场,向大家展示了3D生成工具Meshy(meshy.ai)的生产力: “Meshy拥有超过1000万注册用户,三年内用AI生成了超过1亿个3D模型;相比之下,在整�

  • AI 音乐赛道再进阶:音潮V3.0全链路自研模型突围,平民创作时代已至

    2026年,AI音乐赛道进入“好用”的专业进阶阶段,竞争焦点转向音乐审美、情感表达与创作平权。音潮音乐大模型V3.0凭借全链路自研技术与“音乐平权”理念,成为国产AI音乐工具中的全能选手。它通过三大核心技术实现演唱质量、旋律悦耳度、编曲多样性的突破,解决了AI音乐“顺畅易忘、质感单薄”的行业痛点。产品定位跳出“专业辅助”,以降低创作门槛为核心,支持文字、图片、哼唱等多模态输入,让零基础用户也能通过极简操作在短时间内生成带有人声演唱、情感饱满的完整歌曲,实现“人人皆可写歌”。音潮V3.0已完成全平台覆盖,生成歌曲版权归用户所有,通过技术实力与人文温度双线突围,重新定义了一键生成歌曲软件的体验标准。

  • 月流水破2000万美元,可灵成全球最吸金的AI视频模型

    3月25日,快手公布2025Q4及全年财报,Q4快手收入396亿元,同比增长11.8%,创历史新高,经调整净利润5.5亿元,同比增长16.2%,维持了较为强势的表现。全年业绩方面,快手2025总收入1428亿元,同比增长12.5%,经调整净利润206亿元,同比增长16.5%,经调整净利润率为14.5%。

  • AI日报:阿里发布Wan2.7视频模型;红果下架AI剧桃花簪;广电严禁AI演员换脸

    本期AI日报聚焦多领域进展:阿里通义实验室发布Wan2.7-Video模型,提升视频创作自由度;红果短剧因AI换脸侵权下架,引发行业法律风险讨论;腾讯云推出“龙虾”记忆服务,增强AI代理长期记忆能力;千问3.6发布,编程能力达国际先进水平;广电行业组织严禁AI换脸和声音克隆侵权;ElevenLabs进军AI音乐创作市场;谷歌开源Gemma4模型;小米MiMo大模型推出商业化订阅套餐。

  • 悠然远智大模型服务平台正式上线:首发行业级AI视觉智能体

    考拉悠然发布“悠然远智”大模型服务平台,实现AI视觉智能体“定义即运行”。该平台基于全栈自研多模态大模型,让业务人员通过自然语言指令即可定义、创建并驱动具备专业理解与执行能力的AI智能体,将事件检测算法上线周期从“数周”缩短至“分钟级”。平台提供三种开箱即用的智能体工作模式,覆盖审核、增强与检测等场景,支持零样本视觉推理,无需标注数据与模型训练即可直接分析视频流,输出结构化判断结果,形成“感知-理解-决策”的完整执行闭环。

  • 声网对话式AI ×ClawStage:让大模型成为你的专属家庭智能体

    当前智能家居仍停留在“你下指令,我执行”的被动模式,功能虽多却各自为战。随着大模型进入家庭,交互逻辑正发生根本变化:用户无需逐个控制设备,而是以AI为核心,实现家庭设备的统一协同,只需与大模型对话即可。这推动了家庭运行方式从“被动触发”走向“主动服务”。未来智能家居将向“家庭智能体”演进,如ClawStage这类具身AI终端,为大模型提供可定位、可感知、可执行的物理接口,解决AI长期“悬浮”在云端、无法干预真实世界的痛点。声网等实时互动技术让用户与AI的对话更自然流畅,推动大模型能力在家庭场景中落地为可感知的服务。

  • 讯飞智能臂筒式血压计发布:AI大模型赋能,家庭血压监测迈入智慧时代

    4月2日,科大讯飞旗下讯飞医疗发布首款搭载讯飞医疗星火大模型的智能血压计——讯飞智能臂筒式血压计。产品包含X3、X5、X7三款型号,主打双模精准测量、AI语音交互、远程数据同步等核心功能。这标志着家庭血压监测行业正从“单点测量”迈入“智慧管理”新阶段。该产品以星火医疗大模型为核心,依托语音交互、数据解读、趋势分析、健康指导的全链路能力,重构家用血压管理体验,让居家测量也能拥有与医院同等专业、可信的结果。讯飞智能臂筒式血压计预售首发优惠价格:X3首发价349元,X5首发价699元,X7首发价999元。

  • 国内最强生图模型阿里Wan2.7-Image来了!千人千面 告别AI标准脸

    阿里巴巴今日正式发布图像生成与编辑统一模型Wan2.7-Image,直击当前 AI 生图领域标准脸”审美疲劳和色彩盲盒”等痛点。 该模型可实现千人千面”,捏出活人感”,全新的调色盘”功能可精准控制色彩。 即日起,用户可在https://tongyi.aliyun.com/wan/、wan.video网站和阿里云百炼体验Wan2.7-Image,千问App也即将接入。 据介绍,Wan2.7-Image具备文生图、图生组图、图像指令编辑和交互式�

  • AI日报:腾讯研发新AI产品探梦DreamNow;MiniMax 2.7 确认本周开源;千问3.6Plus登顶OpenRouter 全球大模型调用榜

    本期AI日报聚焦多领域进展:腾讯推出AI互动影游平台“探梦DreamNow”,降低创作门槛;阿里千问3.6 Plus单日调用量破万亿Token,登顶全球模型调用榜;谷歌发布离线AI听写应用Eloquent,保障数据安全;国产模型MiniMax 2.7确认开源,降低成本提升可用性;宇树科技移动机器人专利获授权,简化感知架构;专业动画工具OiiOii上线,AI赋能动画制作;通义千问上线财经分析模块,接入实时行情与财报;前迪士尼工程师与Midjourney打造仿生机器人Éloi,探索情感交互。

  • 大模型吞噬阴影下,美图交出“十年最强”成绩单

    文章探讨了“AI吞噬软件”论调对全球软件市场的冲击,指出并非所有软件都将被取代。以美图为代表的审美决策类应用,因其核心在于满足用户主观审美和创作需求,而非标准化流程,反而通过整合AI能力实现业绩增长。文章认为,AI可能替代流程优化类软件,但难以颠覆需要人类审美决策的应用。未来,AI不会毁灭软件行业,而是成为一道分水岭,区分“AI受害者”与“AI受益者”。美图等公司通过主动变革,将Agent能力整合至产品,聚焦高价值垂直场景,展现了在AI时代的进化与价值。

今日大家都在搜的词: