首页 > AI头条  > 正文

​谷歌 DeepMind 推出虚拟卫星 AI 模型 AlphaEarth Foundations,重塑全球环境监测

2025-08-01 10:50 · 来源: AIbase基地

谷歌 DeepMind 近日推出了名为 AlphaEarth Foundations 的人工智能系统,该系统旨在将海量的卫星数据转化为统一的数字表示,以提高环境分析的准确性,支持食物安全、森林砍伐和水资源等问题的决策。AlphaEarth Foundations 可以被视作一种 “虚拟卫星”,它以每10x10米的分辨率对地球的所有陆地和沿海水域进行描绘。

image.png

这一模型整合了多种数据来源,包括光学卫星图像、雷达、3D 激光测绘和气候模拟。通过将这些输入数据压缩为64维嵌入(embedding),DeepMind 实现了数据的高效表示。其训练过程中,AlphaEarth Foundations 使用了来自全球超过500万个地点的超过30亿条观测数据,数据来源涵盖了 Sentinel-2和 Landsat 等卫星任务,还结合了维基百科文章和物种观察等文本信息。

该系统的目标是解决数据过载和信息不一致的两个核心挑战。AlphaEarth Foundations 能够穿透持续的云层,绘制南极洲的复杂地表,并揭示加拿大小麦种植中的微小变化,这些细节是人眼所无法捕捉到的。在与传统方法及其他 AI 绘图系统的对比测试中,AlphaEarth Foundations 的错误率平均低了24%。该模型在土地利用分类、生物物理变量估算和变化检测等15个评估数据集上表现优异。

AlphaEarth Foundations 还能够在处理数据稀缺的情况下进行有效工作,其持续的时间分析功能使得系统可以对不完全对齐的时间段进行精确预测。该模型的 “时空精度”(STP)架构将来自同一地点的不同时期的卫星图像视作视频中的帧,这样的处理方式使系统能够学习空间、时间和测量之间的关系,从而生成捕捉局部环境和时间轨迹的嵌入表示。

目前,已有50多家组织在现实应用中测试这一系统。全球生态系统地图(Global Ecosystems Atlas)利用该数据将以前未映射的生态系统分类,包括沿海灌丛和超干旱沙漠等。巴西的 MapBiomas 则借助这些数据深入分析农业和环境变化,尤其是亚马逊雨林等关键生态系统。

此外,谷歌还将在 Google Earth Engine 上发布名为卫星嵌入数据集(Satellite Embedding Dataset)的年度嵌入数据。根据 Google Earth Engine 的数据,该数据集每年生成超过1.4万亿个嵌入足迹,为识别全球相似环境条件、变化检测、自动聚类和更智能的分类提供了多种应用场景。

为了加速科学研究,谷歌还提供最高5000美元的研究资助,以支持基于卫星嵌入的应用案例研究。DeepMind 的开发团队认为,AlphaEarth Foundations 是理解我们不断变化的星球状态和动态的重要一步,并期待将其与通用推理大型语言模型(LLM)结合,创造出更强大的应用。

划重点:  

🌍 AlphaEarth Foundations 是谷歌 DeepMind 推出的虚拟卫星 AI 系统,能够以10x10米分辨率描绘地球的所有陆地和沿海水域。  

📊 该系统整合多种数据源,通过64维嵌入高效表示,提升环境监测的准确性,平均错误率降低24%。  

💡 谷歌将发布卫星嵌入数据集,支持全球研究,并提供研究资助以促进科学应用。

  • 相关推荐
  • 谷歌DeepMind发布Genie 3世界模型:支持实时生成交互式3D环境

    据媒体报道,谷歌DeepMind正式发布了其新一代通用世界模型Genie 3。 该模型能够根据用户的文本提示,快速生成丰富多样的交互式虚拟环境。Genie 3不仅能够以每秒24帧的速度生成720p分辨率的高清交互式3D世界,更创新性地引入了 可提示世界事件” 功能。用户通过简单文本指令,即可实时修改虚拟环境,显著提升了沉浸感与创造力。 DeepMind视Genie 3为迈向通用人工智能(AGI) 的�

  • AI日报:百度推全球首批AI数字员工;Claude Opus4.1出世;谷歌DeepMind发布世界模型Genie 3

    AI日报栏目聚焦人工智能领域最新动态:1)Claude Opus4.1发布,编程能力提升74.5%;2)OpenAI开源GPT-OSS-120B和20B模型;3)谷歌DeepMind推出革命性3D世界模型Genie3;4)谷歌Gemini新增AI故事书生成功能;5)ElevenLabs推出商用AI音乐生成器;6)百度智能云发布首批AI数字员工;7)OpenAI估值或达5000亿美元;8)00后创业者推出云端AI协作开发工具Vinsoo;9)腾讯启动2026校园招聘,重点培养AI人才;10)马斯克宣�

  • AI日报:混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布

    【AI日报】汇总了最新AI领域动态:1)腾讯开源混元系列小尺寸模型,适用于消费级显卡;2)昆仑万维发布推理大模型MindLink,提升回答透明度;3)B站推出AI原声翻译功能,保留UP主音色;4)谷歌Gemini 2.5在数学奥赛夺金,展现强大推理能力;5)OpenAI展示GPT-5网络信息整合特性;6)苹果组建AI团队挑战ChatGPT;7)高德地图推出全球首个AI原生地图应用;8)Adobe推出AI图像合成工具Harmonize;9)NVIDIA发布革命性视频渲染技术;10)谷歌推出Android Studio免费AI编程助手;11)开源结构化信息提取工具LangExtract;12)Figma开发者模式升级提升设计转代码效率。

  • 用友YonSuite全球化新篇章:One AI-World, One YonSuite

    用友旗下YonSuite发布全球化品牌战略"One AI-World, One YonSuite",标志着其从SaaS工具向智能商业平台的全面升级。该战略基于六年服务万家企业的实践沉淀,提出"六One"模型:统一智能入口、数据中台、AI全场景驱动、产业链协同、全球化运营和客户成功体系。YonSuite已具备1000+智能体、100+AI场景,支持40+国家地区的全球化合规运营,助力企业打破技术、组织和地域壁垒。典型案例显示,其帮助日丰集团实现全球30余家分子公司统一管理,海外系统最快3周上线。在AI与全球化双引擎驱动下,YonSuite正重塑企业级SaaS价值,成为商业文明进化的数字基座。

  • 智能体迎来“DeepSeek时刻”,为何主角是纳米AI?

    大模型重塑了人工智能的产业格局,但却没有彻底颠覆人类的生产模式。 在这背后,并非其技术力量不足,而是当前的应用形态仍停留在“工具赋能”的初级阶段,大模型的潜力被束缚在碎片化场景中,未能转化为重构生产逻辑的核心动能。 正如360集团创始人、董事长周鸿祎所言,大模型的能力其实已经相当强大,甚至超越了我们中的许多人。只是其潜力尚未被挖掘。 而�

  • 谁在往“DeepSeek们”的回答里塞广告?

    AI正在重塑现代职场与当代生活。如果说在过去,人们遇到问题往往会首选“搜一下”,如今,则变为“问问AI”。或许是ChatGPT和DeepSeek,也可能是豆包和元宝…… 从数据来看,头豹研究院数据显示,全球AI搜索的用户量从2024年1月的3.1亿增长至2025年2月份的19.8亿,增长率达538.7%。 而当AI在日常工作和生活中越来越成为不可或缺的工具,变化正悄然发生。当DeepSeek的回答里频繁�

  • INDEMIND三目AI避障-脏污检测模组,扫地机器人的“全能副手”

    文章介绍了扫地机器人避障技术的最新发展。传统避障方案(ToF、线激光、视觉)各有优劣,而"激光雷达+视觉"组合成为高端机型标配,因其能精准识别拖鞋、线缆等复杂障碍物。随着智能化需求升级,INDEMIND创新推出三目AI避障-污渍检测模块,融合立体视觉避障、AI物体识别、高精度污渍检测及彩色视频传输功能。该模块具备1.5米避障距离、40+类物体识别能力,污渍检测准确率超95%,且计算资源占用极低,可无缝替代现有方案,为扫地机器人提供"智慧之眼"和"敏锐嗅觉",推动清洁设备向智能化、精准化方向发展。

  • GPT-5和Claude 4 Opus谁更强?用这个AI大模型对比工具一眼明了

    OpenAI正式发布GPT-5,与Claude4Opus和Gemini2.5Pro进行对比测试。GPT-5在编程能力(SWE-bench测试74.9%)和数学推理(AIME2025测试94.6%)表现突出;Claude4Opus编程优异(72.5%)但数学较弱(33.9%);Gemini2.5Pro擅长长文本处理(100万token窗口)和多模态应用。价格方面,GPT-5和Gemini2.5Pro定价相近($1.25-$10),Claude4Opus较高($15-$75)。建议根据需求选择:GPT-5适合综合应用,Claude4Opus适合专业编程,Gemini2.5Pro适合长文档�

  • AI日报:Kimi K2 高速版发布;美图WHEE上线视频超清功能;字节发布新模型Seed Diffusion Preview

    【AI日报】今日AI领域重要动态:1)美图WHEE推出"视频超清"功能,通过AI技术提升视频画质;2)Kimi K2高速版发布,输出速度提升至每秒40 Tokens;3)通义千问开源编程模型Qwen3-Coder-Flash,支持大规模上下文理解;4)Anthropic企业AI市场份额升至32%,超越OpenAI;5)字节跳动发布实验性扩散语言模型Seed Diffusion;6)马斯克将为Grok用户推出视频生成器Imagine和AI虚拟男友;7)Quora的Poe平台推出开发者API;8)Black Forest Labs开源图像生成模型FLUX.1-Krea;9)Augment推出CLI工具Auggie优化开发流程;10)清华开源AI语音模型MOSS-TTSD;11)Claude升级支持多格式文件上传。

  • 迄今最先进的AI模型!ChatGPT-5具备博士级别的认知能力

    ChatGPT-5在多个领域表现出色,包括编程、数学、写作、健康和视觉感知等。 它具备增强的推理能力,能够根据对话类型选择最佳模型,并通过深度推理模型解决更具挑战性的问题。 OpenAI 表示,ChatGPT-5在知识工作方面表现卓越,其知识水平在40多种职业中均达到或超过专家水平,涵盖法律、物流、销售和工程等领域。 在基准测试中,ChatGPT-5 展现了出色的认知能力。 例如,�

今日大家都在搜的词: