首页 > 业界 > 关键词  > AI最新资讯  > 正文

港科大版图像分割AI“Semantic-SAM”来了 比Meta「分割一切AI」更全能

2023-07-17 09:09 · 稿源:站长之家

站长之家(ChinaZ.com)7月17日 消息:香港科技大学团队开发出一款名为 Semantic-SAM 的图像分割 AI 模型,相比 Meta 的 SAM 模型,Semantic-SAM 具有更强的粒度和语义功能。该模型能够在不同粒度级别上分割和识别物体,并为分割出的实体提供语义标签。

image.png

研究团队通过联合训练 SA-1B 数据集、通用分割数据集和部件分割数据集,实现了多粒度分割任务和交互分割任务的优化。Semantic-SAM 基于 Mask DINO 框架进行开发,其模型结构主要改进在 decoder 部分,同时支持通用分割和交互式分割。

image.png

模型的训练过程中,采用解耦的物体分类和部件分类方法,以学习物体和部件的语义信息。实验结果表明,Semantic-SAM 在分割质量和粒度可控性方面优于 SAM 模型。总之,Semantic-SAM 是一款全面且强大的图像分割 AI 模型。

论文地址:https://arxiv.org/abs/2307.04767

代码地址:https://github.com/UX-Decoder/Semantic-SAM

举报

  • 相关推荐
  • AI之下,资讯平台的重构与价值改写

    图文资讯平台的黄金时代,似乎已悄然谢幕。 图文称雄的年代,公众号、资讯App等聚拢了无可撼动的流量池,但时过境迁,张小龙所言“视频化表达是下一个十年的内容核心”已然成为现实。 从技术栈到产品观,曾扮演用户入口的信息枢纽的资讯平台,逐渐成为“门户时代的困守者”——尽管行业表面上仍在运转,几大平台仍在持续进行功能更新、频道微调、运营改版,但�

  • 女子肺结节AI预警查出癌症:部分钙化 还明显增大

    ​近日,湖南的郭女士分享了一段惊险又幸运的经历。4年前,郭女士的母亲在体检中被查出肺结节,当时并未引起过多重视。直到今年5月再次复查,发现肺结节明显增大,还出现了部分钙化的情况。然而,体检报告上仅提示“建议靶扫描及MDT会诊”,面对这些专业术语,郭女士感到十分困惑和犹豫,一时不知该如何是好。 就在郭女士犯难之际,经朋友推荐,她抱着试一试的�

  • AI日报:B站测试AI视频工具花生AI;腾讯发布多模态模型Large-Vision;昆仑万维开源Skywork UniPic 2.0

    【AI日报】主要内容: 1. B站测试"花生AI"视频工具,3分钟可成片,同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0,实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI,苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐,仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新:恢复GPT-4o默认模式,为GPT-5引入多模式选择,优化交互体验

  • ISC.AI PARK:科技博主集体打卡!AI原来可以这么“酷”

    ISC.AI2025大会8月6-7日在北京国家会议中心成功举办,以"ALL IN AGENT"为主题。展会全新升级为"ISC.AI PARK",吸引超万名观众参观。360集团、华为、百度智能云等科技巨头及行业领军企业参展,集中展示了AI与数字安全领域的前沿技术和创新应用。AI互动区设置办公、生活、娱乐等场景体验,机器人表演、智能设备等吸引观众驻足。科技博主现场互动体验AI赋能安全行业的产品,直观感受AI技术带来的变革。大会展现了AI技术在各领域的融合应用,推动构建更安全智能的世界。

  • 赛博养生新搭子:和喜临门一起AI睡眠

    文章讲述了智能科技如何改变现代人的健康管理方式。通过李女士早晨被智能手环根据睡眠周期唤醒、刷牙时智能牙刷提醒力度过大、查看皮肤水分数据等日常场景,展现了健康管理的数据化趋势。重点指出深度睡眠对人体修复的核心作用,研究显示172种疾病与睡眠质量显著相关。喜临门等企业正通过AI智能床垫等产品,结合脑电波监测技术,推动睡眠科技进入"读脑"新阶段。未来AI睡眠科技将突破单一功能,与智能家居、医疗系统联动,提供个性化健康建议,成为人们日常的健康守护伙伴。这体现了"赛博养生"理念的终极意义——让科技成为主动关怀式的健康管理工具。

  • 从 Soul App 用 AI 重塑内容社区,看 Gen AI 浪潮下的社交新范式

    高分治愈动画电影《玛丽和马克思》8月8日在中国院线上映,豆瓣评分9.0。影片通过两位孤独灵魂跨越半个地球的书信往来,探讨了人际关系的深刻主题。社交平台Soul App借助AI技术,让用户能与电影主角虚拟形象互动,延续影片治愈内核。这不仅是电影IP的数字化延伸,更是AI在情感陪伴领域的创新实践。Soul通过构建多元虚拟角色矩阵,打造"内容场+情感连接"的社交新生态,让AI成为缓解孤独、促进真实社交的桥梁,重新定义人机关系。平台数据显示,18%的用户发帖源于社交场景中的情感需求,印证了现代人普遍存在的孤独感。Soul正通过生成式AI技术,构建更具温度和效率的数字社交空间。

  • 天狮李金元:以区块链与AI重塑健康消费新生态

    天狮集团在董事长李金元"八新八全"战略指引下,通过社交云店平台整合区块链与AI技术,构建中医药全产业链溯源体系,实现产品"一物一码"透明化管理。平台集成AI问诊、面诊等数字化工具,提供个性化健康方案,推动健康消费从被动转向主动管理。集团发起"百市千县"计划深入药材产区,通过数字化渠道将传统中医药推向全球224个国家和地区,实现"产地直达全球"的流通变革。凭借33年行业积淀和50余项保健品批文,天狮正构建"专业服务+优质供应链"的健康消费新生态,未来将继续以科技引领大健康产业发展。

  • Agentic AI落地加速:迈富时企业级智能体中台2.0,让 AI Agent成为企业 “数字员工”

    Gartner将代理型AI列为2025年十大战略趋势之首,预测到2028年15%的日常工作决策将由自主智能代理完成。迈富时发布的AI-Agentforce2.0企业级智能体中台,通过"技术赋能+场景落地"双轮驱动,构建了从模型能力到业务价值的闭环。该平台具有三大核心优势:1)"模型-应用-开发平台"三位一体架构;2)ChatBox+工作流双开发模式,支持快速部署;3)企业级安全保障,满足金融等敏感行业需求。已在保险、零售、供应链等领域实现规模化应用,最高提升37%销售转化率。该方案让企业能低成本打造专属数字员工团队,真正释放代理型AI的战略价值。

  • AI日报:昆仑万维发布SkyReels-A3模型;百度搜索PC端全面上线AI搜索;Grok 4 AI模型永久免费开放

    AI日报栏目聚焦人工智能领域最新动态:1)昆仑万维发布SkyReels-A3模型,实现语音驱动数字人生成;2)xAI宣布Grok4模型永久免费开放;3)OpenAI发布GPT-5提示词指南;4)百度PC端上线AI搜索功能;5)微软Windows Co pilot接入GPT-5;6)百川智能开源医疗大模型Baichuan-M2性能超越GPT-oss120b;7)苹果iOS26将集成ChatGPT-5;8)谷歌推出3D视觉编辑框架BlenderFusion;9)轻量级TTS模型Kitten TTS参数仅1500万;10)MiniCPM-V

  • AI时代,浏览器的排位赛重新开启

    过去一周,WAIC 带给我们的感官刺激,已经从过去的大模型参数彻底走向AI应用革命。 但是我们所感知到的可能只是庞杂的碎片,如果梳理互联网大厂当下AI 叙事的重点,集体所向,还要从别处寻找答案。 比如,对于信息入口的定义,对于全新AI 交互形态的探索,路线其实越来越明朗。 当 OpenAI 宣布代号为「Aura」的AI浏览器进入开发阶段时,科技圈再次意识到:这场由大模型�

今日大家都在搜的词: