首页 > 业界 > 关键词  > AI框架最新资讯  > 正文

FC-CLIP彻底改变全景分割:统一的单级AI 框架

2023-09-27 14:11 · 稿源:站长之家

要点:

1、全景分割将语义分割和实例分割相结合,对图像进行精细分割标注,但受限于数据集标注成本。

2、FC-CLIP通过冻结卷积CLIPbackbone实现掩码生成和CLIP文本对齐分类的单阶段统一,突破闭词汇限制。

3、FC-CLIP设计简单高效,参数和计算量都大大减少,性能显著提升,可扩展到开放词汇场景。

站长之家(ChinaZ.com)9月27日 消息:全景分割是将图像分割成有意义的部分或区域的基础计算机视觉任务,对各种应用如医学图像分析和自动驾驶具有关键作用。全景分割将语义分割的对每个像素进行对象分类,和实例分割的对同类不同实例进行区分相结合,目标是为每个实例生成不重叠的掩码并赋予类别标签。

多年来,研究者不断提升全景分割模型性能,重点关注全景质量指标。但是基于闭词汇的限制严重制约了这些模型的实际应用,因为数据集细颗粒度标注的高成本限制了语义类别数目。这成为全景分割应用的关键难题。

image.png

项目地址:https://github.com/bytedance/fc-clip

计算机视觉社区探索开放词汇分割来克服闭词汇的限制。这种范式利用单词的文本嵌入作为类别标签嵌入,大大增强了模型处理更广泛类别的能力。CLIP等多模态预训练模型利用其从海量互联网数据中学习对齐图像文本特征表示的能力,在开放词汇分割中显示出巨大潜力。

近期的两阶段方法如SimBaseline和OVSeg改编了CLIP进行开放词汇分割,但固有的低效和分割与分类不一致的问题仍然存在。提出单阶段统一框架FC-CLIP正是为解决这一关键问题。

image.png

FC-CLIP在共享的冻结卷积CLIP backbone上无缝集成了掩码生成和CLIP分类。这种设计基于以下核心思路:

冻结的CLIP backbone保留了预训练的图像文本对齐,支持开放词汇分类。

添加轻量级解码器后,CLIP backbone可作为强大的掩码生成器。

卷积CLIP在输入尺寸放大时泛化能力提升,适合密集预测任务。

单一冻结卷积CLIP backbone带来极简但高效的设计。相较先前方法,FC-CLIP参数和计算量大幅减少,训练时间也更短,实用性强。在多个数据集上,FC-CLIP都显著提升了状态转换水平。

FC-CLIP开创性的单阶段框架统一了掩码生成和文本匹配分类,具有巨大的潜力推动全景分割向开放词汇场景扩展,实现真正的图像理解和交互。这项突破性工作为端到端的单阶段全景分割方法提供了范例,值得进一步改进和扩展。

举报

  • 相关推荐
  • 腾讯云安全发布人工智能风险评估框架,助企业构建可信智能体

    9月17日,腾讯云在2025全球数字生态大会上发布人工智能风险控制框架及多款安全产品。该框架涵盖六大风险模块、七层级、130余项措施,系统性应对AI应用全生命周期的安全挑战,包括数据泄露、供应链隐患及权限滥用等核心问题。同时推出LLM-WAF防火墙、AI-SPM态势管理等产品,构建覆盖研发、部署、运维的全链路防护体系,助力企业建立可信、稳定的AI服务生态。

  • 腾讯开源框架 Kuikly 再升级!率先适配 “液态玻璃”,原生体验更极致

    腾讯跨端开发框架Kuikly基于Kotlin Multiplatform技术,适配苹果iOS26系统新增的“液态玻璃”设计语言。该框架采用原生渲染架构,能快速集成系统级创新,提供简洁API支持开发者低成本适配新特性,同时确保跨平台一致性和兼容性。Kuikly已实现对液态玻璃的首阶段适配并开源,帮助业务在保持代码统一性的同时获得原生级体验。

  • 全球首个!OpenAI将推“AI版抖音”:禁止上传实拍内容 视频100%由AI生成

    国庆假期前夕,OpenAI发布了Sora 2,一款旗舰视频和音频生成模型。 据介绍,Sora 2可以完成以前的视频生成模型难以完成的事情,比如运动员的奥林匹克体动作、桨板上的后空翻,准确模拟浮力和刚度的动态等等,并擅长现实主义、电影和动漫风格。 一则来自《连线》杂志的重磅爆料更是指出,OpenAI的下一步棋,并非简单升级一个模型,而是要亲自下场,推出一个独立的AI影�

  • 淘宝用AI给电商搜索趟了条新路

    ​众所周知 ,最近两个月,淘宝搜索的AI化有了明显的提速趋势。 8月,淘宝低调全量上线了“AI万能搜”产品;9月,淘宝“AI助手”传出内测消息、拍立淘的“AI找低价”也全量上线。 这三个产品分别覆盖了传统搜索入口,图片搜索入口、以及搜索页面呈现后的交互,算是在淘宝端内形成了一个围绕搜索场景的能力矩阵。 前段时间,硅星人也拿到了“AI助手”的内测资格,我

  • AI为他们圆了导演梦

    “我们这么小团队做的‘小东西’真的可以吗?” 当得知自己作品《小怪物》入围釜山电影节时,黎晓薇的第一反应是“难以置信”,因为就在几个月前她才开始正式接触AI工具。 和黎晓薇一样幸运的,还有徐文君、小文和MANYMANY团队,这些来自中国的AI创作者们分别带来了《一目五先生》《权利童话》和《九宵》三部作品。 “未来影像计划”由即梦AI联合火山引擎、上海电�

  • 天网杯纳米AI视频创作赛圆满落幕,ISC.AI学苑推动“教育AI+”新范式

    9月23日,第三届“天网杯”网络安全大赛在天津落幕,吸引全国顶尖战队角逐,同期举办纳米AI视频创作赛。赛事聚焦个人信息保护、防诈 骗等网络安全议题,通过“以赛促学”模式提升学生防护意识与AI应用能力。ISC.AI学苑作为平台支持,依托“纳米AI”技术降低创作门槛,推动“安全+AI”人才培养。大赛评选出24个奖项,并联合多所高校深化合作,促进AI技术在教育场景的落

  • 千亿AI玩具市场:当IP被AI“唤醒”,玩具厂商如何开辟新赛道?

    过去两年AI技术热度飙升,从ChatGPT爆发到谷歌、Meta频发新一代大模型,AI已切实改变生活方式。传统玩具行业正孕育智能化尝试,迪士尼与乐森机器人合作推出Mini Robot智能潮玩,通过“通用底座+可替换IP公仔”平台化设计,结合机器人技术与情感交互,打破单一产品逻辑。该产品支持动作编程、语音定制及UGC内容共享,推动玩具从“产品消费”转向“情绪消费”,成为连接虚拟与现实的新型生命体。

  • 周鸿祎称不用AI的员工有理由裁掉 “对不起 不是我裁掉你 是AI时代裁掉你”

    360创始人周鸿祎在访谈中表示,公司正推动AI与工作结合,要求员工坚持使用AI,即使效果不佳也要持续尝试。他强调,拒绝使用AI的员工可能面临裁员,并称“不是公司淘汰你,而是AI时代淘汰你”。周鸿祎认为,与其担忧哪些岗位被替代,不如思考如何利用AI提升能力。他还透露将亲自挑战完成一场新产品发布会,测试6月11日发布的纳米AI超级搜索智能体。此前他曾提出裁撤市场部以节省成本,此次言论进一步凸显其对AI应用的强硬态度。

  • 行业抢滩的AI漫剧,又有哪些新变化

    9月24日刚结束的北京文化论坛上,AI漫剧作为新样态被概括有以下三大特征:更低的生产成本,更年轻的用户群体,更高的付费效率。 受抖音、B站、快手、红果等多平台的加码垂青,漫剧可以说是当前内容市场最新、最受关注的一大风向内容。脱胎于动态漫,曾于垂直漫画平台及长视频平台「夹缝求生」近十年的动漫短剧并非新品类,但对于目前众内容平台而言却是新的增量�

  • 从数字工具到效率员工,AI员工赋能企业营销服务生产力全面提升!多款AI工具口碑推荐,用AI驱动新增长!

    如今,AI赋能业务已非遥不可及,而是切实帮助企业降本增效的新方案。文章以获客、销售、服务、办公四大场景为例,说明AI如何替代重复性工作:营销人员可借助AI工具快速生成高质量素材;销售可将客户跟进、资料更新等琐事交给AI,专注高价值沟通;售后AI能24小时响应基础问题,提升服务效率;办公场景中,AI还能辅助招聘筛选、邮件撰写等日常任务。通过引入具备理解、推理、执行能力的智能工具,企业能以更少人力、更高效率实现业务优化,未来率先布局AI的企业将更具竞争优势。

今日大家都在搜的词: