首页 > 业界 > 关键词  > 图像分割最新资讯  > 正文

字节推图像分割项目UniRef++ 提高图像分割效率和精确度

2023-12-28 11:45 · 稿源:站长之家

站长之家(ChinaZ.com)12月28日 消息:字节公司最新推出了一个名为UniRef++的图像分割项目,该项目将现有的即参考图像分割(RIS)、少镜头图像分割(FSS)、参考视频对象分割(RVOS)和视频对象分割(VOS)四种分割方式整合到一个架构下进行处理,从而能够自动判断应该使用哪种方式来分割内容。

image.png

论文地址:https://arxiv.org/pdf/2312.15715.pdf

这一项目中的UniFusion模块还可以与SAM模型结合使用,进一步提高图像分割的效率和精确度。这一项目的推出将为图像分割领域带来新的突破,为用户提供更加便捷和高效的图像处理解决方案。

image.png

功能:

UniRef++ 的核心部分是 UniFusion 模块,用于进行多路融合,处理与指定参考相关的不同任务。这使得语言和注释掩码能够无缝集成,适用于不同的分割任务。

采用统一的 Transformer 架构实现实例级分割。这种设计选择增强了模型在不同基于参考的对象分割任务中泛化的能力。

UniRef++ 允许在广泛的基准上进行联合训练,消除了任务特定模型的需要。这导致资源的更有效利用和整体性能的提高。

该模型在运行时表现出灵活性,能够通过指定相应的参考完成多个任务。这种适应性对于具有不同分割要求的实际应用至关重要。

实验结果表明,UniRef++ 在引用图像分割和引用视频对象分割方面取得了最先进的性能。此外,它在少样本图像分割和视频对象分割中与参数共享网络相比表现出竞争力。

举报

  • 相关推荐
  • AI日报:腾讯重磅发布混元图像3.0;快手发布KAT系列Agentic Coding大模型;苹果悄然研发ChatGPT式应用

    快手发布KAT系列代码大模型,腾讯推出“混元图像3.0”实现多模态突破,苹果研发类ChatGPT应用升级Siri,谷歌更新Gemini 2.5 Flash Lite提升效率。苹果还推出Manzano图像模型,YouTube Music测试AI音乐主播功能,VideoFrom3D框架简化3D视频生成,Moondream 3.0在多项基准测试中超越GPT-5等顶尖模型,展现强大性能。

  • QQ传文件功能升级,闪传功能便捷支持长假批量传图

    国庆假期临近,QQ推出“闪传”功能,解决大文件传输难题。单文件上限提升至10GB,支持批量发送与不限速传输,用户可生成链接或二维码直接分享至微信等平台,接收方无需登录QQ即可下载。该功能适用于旅行照片、婚礼影像快速分享,也便于办公人群传输设计稿、项目资料,实现跨平台无缝协作。测试期间获用户好评,摄影师称其大幅提升节日期间紧急交片效率。QQ持续优化核心功能,强化独特价值。

  • LV首尔开餐厅3只牛肉饺子243元:印有经典图案

    路易威登正式进军餐饮业,旗下首家餐厅Le Café Louis Vuitton于9月1日在首尔江南区清潭洞开幕。餐厅由名厨尹太均主理,主打融合韩式风味的法式料理,特色菜品包括印有品牌经典Monogram图案的牛肉饺子(约243元人民币)等。自8月开放预约以来座位迅速订满,持续火爆。品牌还通过全球合作计划,在巴黎、纽约等地拓展餐饮版图。

  • 携10亿流量杀入到店团购,淘宝闪购为本地生活拼上新拼图

    从业务覆盖范围来看,此次团购功能首批聚焦上海、深圳、嘉兴三座城市的核心商业区域,品类上则精准覆盖餐饮赛道,涵盖茶饮、甜品、正餐、自助餐及城市特色小吃等多个细分领域。 不管是想喝杯奶茶、吃块甜品,还是约正餐、冲自助餐,甚至想尝本地特色小吃,都能在里面找到团购。 也正因如此,上述三地的消费者成了全国第一批“尝鲜党”。社交平台上不少深圳IP�

  • 金蝶参编工信部机器人行业场景图谱(2025 版)

    工信部印发《场景化、图谱化推进重点行业数字化转型参考指引(2025版)》,聚焦14个行业数字化转型场景图谱。金蝶依托机器人行业数字化实践经验,深度参编机器人行业场景图谱,为行业转型提供参考。该指引以“一图四清单”体系为核心,明确转型路径与四大攻关重点(数据要素、知识模型、工具软件、人才技能)。金蝶通过企业AI平台提供“SaaS+智能体+数据”服务,分步助力制造业企业提升数字化能力,为行业高质量发展注入新动能。

  • 华为云EI获国际医学超声图像分割比赛第一

    近日,华为云EI(企业智能)医疗影像团队在超声图像分割与测量领域取得技术突破,在Grand-Challenge胎儿超声影像头围测量比赛(HC18)上以1.89mm的平均绝对误差取得第一。什么是Grand-Challenge?Grand-Challenge是一个举办医学影像分析比赛的国际化平台,致力于为前沿医学图像算法研究提供统一的数据和标准进行比较,进而更好的促进技术发展。多年来吸引了数以千计的一流研究团队参加,其比赛数据和结果常作为论文被发表在MICCAI等国际

  • 微算法科技(NASDAQ MLGO)创新基于账户加权图与后量子密码学的区块链

    区块链技术凭借去中心化与全网共识机制展现巨大潜力,但单节点性能限制其交易处理能力,且量子计算威胁传统加密体系。微算法科技(MLGO)提出创新方案,通过账户加权图模型动态分片,结合格密码学提升并行处理与量子安全。该技术优化跨片通信,采用后量子签名算法,支持双链架构平滑过渡,在金融、供应链、元宇宙等场景实现高效扩展与隐私保护,为Web3.0奠定安全�

  • 领星ERPAI生图功能:一分钟打造跨境电商专业视觉素材

    在竞争白热化的跨境电商领域,高质量产品图片是吸引买家点击、促成转化的关键。然而,传统拍摄流程成本高、周期长,严重影响新品上架和营销效率。领星ERP推出的AI生图功能,通过“文生图”和“图生图”两种模式,让卖家仅需输入简单描述或上传草图,即可快速生成专业级商业图片,大幅降低门槛。该功能支持自由编辑提示词、批量出图和预设模板,并能与ERP系统深度集成,实现图片自动关联SKU、一键引用至商品Listing,形成从素材生成到应用管理的闭环。这不仅解决了视觉素材制作痛点,还提升了运营效率,助力跨境卖家降本增效。

  • 演唱会神器就选它!vivo X300 Pro灭霸长焦,让你坐后排也能拍出舞台神图

    文章聚焦演唱会场景下手机拍摄的挑战与解决方案,指出普通手机因距离远、光线复杂、人物移动快而难以捕捉清晰画面。推荐具备强大长焦能力的手机,并按2000-6000元价位段分类:vivo X300 Pro(5299元起)搭载2亿像素长焦与专业防抖,适合舞台特写;vivo X300标准版(4299元起)性价比更高;荣耀Magic6(3000-4000元)和小米14(中高端)提供均衡长焦体验;小米Civi4 Pro和荣耀100 Pro(2000-3000元)则适合入门用户。强调vivo X300 Pro凭借芯片级影像实力,可突破光线与距离限制,成为记录震撼瞬间的理想工具。

  • 微信新功能上线:长按图片“搜一搜” 检索购物转表一键达

    微信近日推出创新功能“搜一搜”,用户长按图片即可快速检索相关信息、直达购物或转换表格。该功能在信息检索方面表现突出,用户无需打开浏览器即可获取图片相关的历史、科学等专业内容。同时支持购物直达,系统自动关联商品购买渠道,实现“看图购物”。此外,还能一键将图片中的表格转为可编辑格式,提升工作效率。适用于iOS 8.0.59及以上、安卓8.0.58及以上版本,网友称赞其便捷高效。

今日大家都在搜的词: