首页 > 业界 > 关键词  > 遥感大模型最新资讯  > 正文

武大、蚂蚁集团发布新一代遥感大模型:12边型战士

2025-08-09 14:28 · 稿源: 快科技

据快科技8月9日消息,近日,武汉大学携手蚂蚁集团推出了新一代语义增强遥感大模型SkySense,可谓是全方位的强者。

其相关研究成果于国际知名学术期刊《自然机器智能》在线刊发。

当下,遥感基础大模型在复杂多变的地球观测场景应用里遭遇挑战,像多模态遥感影像数据融合效果不佳、下游任务微调需大量数据支撑、对遥感语义信息挖掘不够充分等。

为突破这些难题,研究团队基于前期的多模态遥感大模型SkySense,研发出了SkySense。

SkySense依托来自11个卫星载荷的2700万组多模态遥感影像,运用两阶段渐进式学习来完成预训练。有效减轻了大模型对复杂微调流程以及大量标注数据的依赖,大幅提升了实用性与泛化能力。

研究团队在农业、林业、灾害管理等7个领域的12种典型地球观测任务中,对SkySense展开全面评估。

武大、蚂蚁集团发布新一代遥感大模型:12边型战士

实验结果表明,SkySense在这12项任务中均展现出卓越表现,性能超越其他模型。与同期最前沿方法相比,在全量微调分类与检测任务上,平均精度提高了4.79%;在少样本提示分割任务上,平均交并比提高了14.08%。

SkySense的前序版本SkySense,曾在国际计算机视觉领域顶级会议CVPR发表,并在2024年世界人工智能大会发布。

而此次SkySense在农业生产评估、灾害应急响应、国土资源监测等任务中,性能更为出色、稳定,还新增了免微调部署能力。

举报

  • 相关推荐
  • 小度发布多模态智能摄像机,AI大模型重塑家庭看护体验

    小度科技推出首款多模态智能摄像机C800,搭载800万像素4K超清摄像头,支持AI大模型技术。该产品不仅能实现高清监控,还具备智能行为识别、语音交互等功能,可自定义看护提醒。结合视觉与语音交互,支持复杂语义查询和家庭设备联动,扩展智能家居应用场景。目前产品已全网发售,年底还将推出三摄版本,持续探索AI硬件创新。

  • AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型

    本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。

  • 既能读懂情绪,还能多模态交互!INDEMIND用空间智能重新定义陪伴机器人

    TCL与INDEMIND合作推出的陪伴机器人“Ai Me”通过空间智能技术实现突破,从传统2D感知升级为3D语义感知,赋予机器人动态语义建图、实时环境适应及多模态交互能力。该平台借助立体视觉与多传感器融合,让机器人精准构建三维地图,识别家居属性,实现主动避障与个性化服务。同时,结合低算力混合模型与情感交互功能,机器人可感知用户情绪、提供安全防护,并支持宠物看护等场景拓展,从“工具”升级为有温度的“家庭伙伴”,真正满足复杂家庭需求。

  • GEO排名查询工具推荐:霸屏AI大模型答案的核心方法,做好AI大模型排名优化

    随着AI大模型成为用户获取信息的主要入口,AIBase推出GEO排名查询工具,帮助品牌监测在豆包、DeepSeek、文心一言等主流AI平台中的曝光情况。该工具支持多平台检测、关键词追踪、可视化数据展示,可精准分析品牌是否被推荐、出现频次及具体场景,为制定AI大模型排名优化策略提供数据支撑。在GEO时代,抢占AI回答推荐位意味着获得全新流量入口。

  • 微算法科技(NASDAQ: MLGO)融合二次矩阵变换模型,研发基于区块链的可溯源IP版权保护算法

    微算科技(NASDAQ: MLGO)研发基于区块链的可溯源IP版权保护算法,解决现有技术效率低、可追溯性差等痛点。该方案融合二次矩阵变换、分布式随机嵌入与位置映射函数,实现版权从产生到交易流转的全链路精准追踪与安全保护。凭借区块链的不可篡改特性,算法有效抵御重放攻击,确保版权信息稳定可靠,有望拓展至专利、商标等知识产权领域,推动全球版权保护生态健全高效。

  • 云栖大会智舱黑科技:全球首个全模态端侧大模型解决方案,斑马智行首发

    9月24日,2025云栖大会在杭州开幕,主题为“云智一体·碳硅共生”,汇聚全球50多国2000余位嘉宾探讨AI、云计算与产业应用趋势。阿里云发布7款通义大模型,其中Qwen3-Omni作为行业首个端到端全模态AI大模型,在36项基准测试中实现22项SOTA,性能全面突破。大会聚焦多模态技术,斑马智行宣布率先接入Qwen3-Omni,并与阿里云、高通联合推出端到端全模态端侧大模型方案Auto+Omni,具备主动智能、断网可用、隐私无忧三大特点,推动汽车智能座舱从指令交互向Always-on主动服务升级。首批搭载方案车型将于2026年量产,标志着汽车智能化迈入“自主行动”新阶段。大会将持续至26日,预计更多创新技术将亮相。

  • 淘宝闪购入局到店团购,场景融合里藏着行业新活力

    当“淘宝闪购,团购来了”的字样在街头亮起,本地生活赛道又迎来新故事。 9月20日,淘宝闪购启动到店团购业务,首批覆盖上海、深圳、嘉兴三个城市的核心商业区域。团购入口不仅包括淘宝闪购,还有支付宝和高德,阿里体系内最能打的三大流量入口同时开动,显示出这一业务的重要性。 这并不是一次偶然的尝试。回顾淘宝闪购的发展,今年4月30日,“小时达”正式升�

  • ColorOS 16阶段性爆料总结:拥有安卓首个跨级融合编译技术

    ColorOS 16将于10月15日正式发布,流畅度、AI、设计、互联四大方面全面升级。系统带来安卓首个无缝架构和芯片级动态追帧技术,确保全场景流畅体验;AI功能全面覆盖相册、便签等日常应用,新增AI人像补光、AI写作等实用功能;设计语言全新升级,图标动画交互全面优化;生态互联支持通知流转、电脑投屏等跨设备协同。目前Beta版已开启招募,支持一加13、Find X8系列等多款机型。

  • 易鑫发布Agentic大模型,破解汽车金融风控与效率痛点

    9月12日,易鑫集团在“IT Value Summit数字价值年会”上入选“2025创新场景年度AI应用TOP榜”,成为汽车金融科技领域唯一上榜企业。首席科技官贾志峰指出,易鑫以AI为核心驱动力,通过自研大模型“智鑫多维”等技术,显著提升风控水平与融资通过率,推动行业智能化转型。平台已连接全国4.2万家经销商及上百家金融机构,服务覆盖牧民、基层员工等多元群体,体现技术普惠价值。未来将持续加大科技创新投入,深化国内普惠金融服务,并探索技术出海,助力全球汽车金融行业迈向更高水平智能化。此次上榜不仅是对其技术实力的认可,更反映出行业正加速拥抱智能化变革。

  • 考拉悠然开源悠然无界大模型BLM-1.0,以空间智能引擎驱动产业变革

    9月28日,在成都举行的“2025天府人工智能产业生态大会”上,考拉悠然宣布其自主研发的“悠然无界大模型BLM-1.0”完成迭代升级并全面开源,同时发布基于该模型的UU Holo Glass O1 AR工业眼镜。此举标志着公司以“技术开源+场景落地”双轮驱动策略,推动空间智能产业生态共建。BLM-1.0突破传统模型局限,具备跨空间、跨任务、跨本体的“三跨”统一能力,在空间理解、推理与执行三大核心能力上刷新行业纪录。配套AR眼镜深度融合空间感知与多模态交互,实现工业运维、安装巡检等场景的全程自动化与智能辅助,显著提升效率并降低成本。

今日大家都在搜的词: