首页 > 业界 > 关键词  > EdgeSAM最新资讯  > 正文

SAM模型加速变体EdgeSAM 比原始SAM提速40倍

2023-12-14 11:53 · 稿源:站长之家

站长之家(ChinaZ.com)12月14日 消息:EdgeSAM是一个优化过的SAM变体,相比原始SAM实现了40倍的速度提升,对性能的影响较小,可以在iPhone14上以30帧每秒的速度运行。

该方法将原始的基于ViT的SAM图像编码器提炼成纯CNN架构,更适合边缘设备。通过仔细评估各种提炼策略,研究人员证明了任务不可知的编码器提炼无法捕捉SAM所蕴含的全部知识。

image.png

地址:https://mmlab-ntu.github.io/project/edgesam/

为了克服这一瓶颈,他们在提炼过程中包括了提示编码器和蒙版解码器,循环中还有框和点提示,以便提炼模型能够准确捕捉用户输入和蒙版生成之间的复杂动态。此外,为了减轻点提示提炼带来的数据集偏差问题,研究人员在编码器中加入了一个轻量级模块。

关键的见解是在知识蒸馏过程中考虑提示,以便学生模型接收任务特定的指导,并专注于更难的训练目标,比如更精细的边界。

为此,引入了一种动态提示采样策略,旨在实现三个关键目标:从初始提示(无论是框还是点)动态生成多样化的提示组合,准确识别学生模型在掩模内表现不准确的区域,从而引导其专注于这些特定的部分,并促使教师模型,即SAM,产生更高质量的掩模,以提供更精确的指导。

举报

  • 相关推荐
  • WeGame还有机会么?

    ​随着腾讯游戏业务发展如火如荼,从产品到平台各个摩拳擦掌,但WeGame已经“失声”了很长时间。 上一次聊WeGame还要追溯到2020年的0分成(在WeGame平台同步首发上线的国产单机游戏或创新玩法类产品,1000万元人民币流水以内,平台不再收取任何分成)以及19年的上线国际版WeGame X。 哪怕是去年《黑神话:悟空》的火爆借其东风,也没能完全覆盖掉过去留给玩家LOL启动器的刻�

  • AI日报:昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

    本文介绍了AI领域最新动态:1)昆仑万维推出全球首款AI+Agent架构的Office智能体应用;2)研究显示ChatGPT能提升K12学生成绩近87%;3)谷歌视频生成工具Veo3扩展至更多地区;4)谷歌发布三款Gemma模型变体,覆盖医疗、手语翻译和海豚语言研究;5)VideoTutor实现一句话生成定制教学视频;6)字节跳动开源多模态模型BAGEL;7)Rork支持无代码开发iOS/Android应用;8)AingDesk降低AI助手开发门槛;9)Claude4登陆亚马逊Bedrock平台;10)Youware通过MCP协议提升网页生成能力。这些创新展示了AI技术在各领域的快速发展和应用潜力。

  • 腾讯AI数字人AvaMo落地商用,百度/微美全息加速虚拟人生态闭环构建

    腾讯与Offshore公司达成战略合作,推出面向日本市场的AI数字人视频生成服务"AvaMo"。该服务基于腾讯云智能数字人技术,仅需1-3分钟视频样本即可创建高保真数字人,支持实时交互,能将30秒视频制作时间从传统的12小时压缩至15分钟。同时,百度也在数字人领域发力,展示手语数字人、直播数字人等应用案例。我国数字人产业生态日益完善,相关企业已达114.4万家。微美全息等企业通过整合AI、计算机视觉等技术,显著降低商业化门槛,推动数字人在社交、娱乐等场景的个性化应用。随着生成式AI技术发展,数字人制作效率和多样性显著提升,用户可打造更具个性化的数字产品。

  • 碳企通CBAM解决方案:三步破解碳关税困局

    本文介绍了应对欧盟碳关税(CBAM)的三步解决方案:1)智能诊断:通过自主研发的计算引擎精准预测2024-2026年碳关税支出,误差率<5%,并定位生产环节碳排热点;2)快速认证:建立欧盟合规认证快速通道,认证周期缩短至7个工作日,通过区块链确保数据不可篡改;3)持续优化:动态监测32国碳政策变化,建立碳成本分摊模型。案例显示某钢铁企业通过该方案降低碳强度19%,年节省碳关税82万欧元。方案优势包括欧盟双认证资质、全流程闭环服务和可控成本(申报费用比自建团队低65%)。

  • Vibe编码公司:有了Claude 4,语法错误减少25%、提速40%

    Vibe 旗下的编码公司 Lovable 宣布,部署了 Claude 4 之后,其代码错误减少了 25%,速度提高了 40%……

  • Steam正版移植 《英勇之地》手游今日全平台公测

    《勇士之地》手游正式开启全平台公测,这款融合沙盒探索与硬核战斗的奇幻大作已吸引超500万玩家预约。游戏以"无拘束"为核心,打造开放世界与阶梯式副本挑战,支持单人探索或团队配合。特色包括:跨服PVP千人对战、死亡零惩罚友好区、精准操作战斗系统及爆装机制。手游版针对移动端优化操作,支持自定义按键布局。公测达成500万预约里程碑,全服玩家可领取限定皮肤。研发团队承诺持续优化服务器稳定性和内容平衡,呈现完美版本。5月22日,百万勇士集结,开启热血冒险盛宴!

  • Steam畅销榜全球第一,《沙丘:觉醒》现已正式上线!

    《沙丘:觉醒》6月10日正式上线Steam,首日登顶畅销榜。这款大型多人生存游戏设定在残酷的厄拉科斯星球,融合生存与MMO玩法,支持数百名玩家在持久服务器中共存。豪华版玩家可提前5天体验,游戏目前Steam好评率达88%。开发商Funcom确认2026年将登陆PS和Xbox平台。游戏采用买断制,后续将推出4款DLC,首款"厄拉科斯野生动物"DLC同步上线。玩家需在恶劣环境中打造装备、�

  • Steam创始人G胖创业最新进展:首款脑机芯片今年就推出!

    Valve创始人Gabe Newell创立的脑机接口公司Starfish Neuroscience宣布,计划年底推出首款脑机接口芯片。该芯片体积仅2x4mm,功耗1.1毫瓦,支持无线充电,拥有32个电极位点和16个记录通道。相比现有产品,其特点是能同时连接多个脑区,无需电池运行,侵入性更低。公司表示该技术对治疗帕金森等神经系统疾病具有重要意义,目前正积极寻找合作伙伴开发新应用。早在2019年,G胖就秘密成立了这家公司,并曾在游戏开发者大会上探讨过脑机接口的游戏应用可能性。

  • 谷歌推出 Beam AI:将普通视频通话,转为逼真的 3D 沉浸式体验

    一位测试用户表示: “你甚至会忘记自己是在用科技交流。眼神是真实的,你能看出对方什么时候想说话,就像现实生活中一样。”

  • 小米手环10首曝:升级1.72英寸AMOLED屏、预装澎湃2.0

    小米手环可以说是市场表现最强的智能穿戴产品之一,而且渗透力强大,很多苹果、华为等手机用户也都在使用。 根据洛图科技线上监测数据显示,小米独占62.0%的份额,遥遥领先于华为的26.8%,其他家只能瓜分约10%的份额。 xpertpick今天首次曝光了小米手环10的配置,并且公布了外观渲染图。 先看外观,小米手环10与前代造型几乎完全一致,不过屏幕从前代的1.62英寸升级为1.