首页 > 业界 > 关键词  > 视频最新资讯  > 正文

在线视频实例分割技术TCOVIS 可保持时间一致性

2023-09-26 16:59 · 稿源:站长之家

站长之家(ChinaZ.com)9月26日 消息:研究人员介绍了一种名为TCOVIS的在线视频实例分割技术,该技术注重时间一致性。实例分割是计算机视觉领域的一个热门研究课题,其目标是将视频帧中的每个独立实例进行识别和分割。

TCOVIS的核心创新在于提出了一个时序一致性模块。视频实例分割是一个非常具有挑战性的任务,因为需要对每一帧图像进行语义分割,同时跟踪并关联各帧之间的目标实例。但是由于各帧之间存在遮挡、形变等问题,使得直接应用图片实例分割模型往往无法获得时序一致和连续的结果。

image.png

论文地址:https://arxiv.org/pdf/2309.11857v1.pdf

项目地址:https://github.com/jun-long-li/TCOVIS

TCOVIS通过构建一个记忆模块来实现时序一致性。该模块存储历史帧的特征,并与当前帧建立匹配,从而关联当前帧与之前帧之间的同一实例。 Memory模块采用字典学习的策略,以降低存储和搜索时间成本。同时,TCOVIS还设计了在线训练和模型自监督策略,使框架能够适应视频中新出现的实例,实现真正的在线逐帧分割。

经过实验验证,TCOVIS相比其他主流方法,能够取得更好的时间一致性指标,同时保持与SOTA方法相当的分割精度。该框架可以部署在资源受限的边缘设备上,实现实时高质量的视频实例分割。

举报

  • 相关推荐
  • 日本熊袭击人清晰视频流出:工人被狂追后扑倒在地

    当地时间6月2日上午,日本福岛钢铁厂的监控视频记录下一头亚洲黑熊袭击人类的过程,当天它先后袭击了工厂两名男性员工、附近住宅的一名80多岁女性,以及另一家公司一名60多岁男性。 监控画面显示,这头黑熊在工厂入口穷追一名20多岁的工人,虽然工人已经绕着圈子闪躲,但最终还是不敌,被黑熊扑倒在地,好在有人驾驶一辆汽车驱赶,这才将黑熊给吓退,否则后果怕�

  • 全量机型推送!荣耀与微信首个A2A合作上线:一句话发消息、视频电话

    今日,荣耀宣布,荣耀与微信首个A2A合作成果落地,目前已面向荣耀全量机型推送。 升级后,荣耀YOYO可支持一句话调用微信,完成发送微信消息、拨打微信语音电话、视频电话等操作。 据介绍,该功能基于A2A技术方案实现。 荣耀用户只需将系统、YOYO智能体和微信升级至最新版本,打开荣耀YOYO后,即可通过一句话调起微信,为指定联系人发送消息,或发起语音、视频通话�

  • 微信正与手机厂商合作推出A2A助手:可语音发消息、视频通话

    微信正在与华为、荣耀、小米、OPPO、vivo等手机厂商合作推出A2A(Agent-to-Agent)助手能力,可通过手机语音助理发起微信的音视频通话,或向好友发送消息。 目前,荣耀部分机型已经支持该功能,把YOYO智能体和微信更新到最新版本,即可唤醒YOYO直接语音下达指令,比如语音发微信消息、拨打微信语音、视频通话。 A2A为跨应用智能体通信标准,打破APP生态壁垒,运行逻辑为手�

  • 快手亮相2026金砖产融合作论坛:直播短视频出海赋能金砖合作

    5月28日,2026金砖国家新工业革命伙伴关系系列活动之金砖产融合作论坛在厦门举行。论坛以“深化金砖产融协同,赋能企业国际化发展”为主题,围绕产业合作、企业国际化、技术创新出海等议题展开交流。快手受邀参会,副总裁、快手研究院院长蔡雄山发表题为《直播短视频出海赋能金砖合作》的主旨演讲,分享了快手在技术、商业模式和文化出海方面的实践。快手通过AI技术降低视频创作门槛,助力AIGC在影视、广告等领域落地;在巴西等市场深耕本土化,推动数字平台赋能当地商业生态;并强调文化深度融合,以长期责任服务当地社会发展,助力构建开放、包容、互利共赢的数字经济合作生态。

  • 不见不散亮相第22届广州国际乐器展,融合创新乐器读谱弹唱+视频KTV一体化体验

    第22届广州国际乐器展于2026年5月28日开幕,聚焦音乐产业数字化、智能化转型。深圳品牌“不见不散”推出AI智能KTV音响,集成读谱弹唱与视频KTV功能,实现“读谱+弹奏+K歌”一体化。该产品针对传统练琴痛点,提供动态乐谱显示、自动翻页、AI语音点歌等创新体验,推动家庭娱乐从单一听歌向乐器弹唱、视频互动等多元场景升级。品牌深耕智能音频18年,将持续布局AI家庭音乐娱乐生态。

  • 2499元!华为AI眼镜发布:第一视角AI闪拍、视频通话

    华为发布AI眼镜方形钛银灰版,售价2499元,主打第一视角拍摄与智能交互。搭载1200万像素超感光摄像头和1/2.8英寸大底传感器,支持4K照片、2K视频及HDR+Vivid标准,0.7秒AI闪拍捕捉瞬间。内置自研AI芯片,支持智能问答、卡游识别及“看一眼支付”。轻触镜腿快捷键可快速操作,钛合金铰链佩戴舒适,IP54防水防尘,12小时综合续航。运行鸿蒙系统,可连接华为设备,外观可选方形、圆形镜框,支持定制近视镜片。6月1日10:08开售,赠换新守护权益和优惠配镜服务。

  • 闯视频赛道,小红书动真格了

    5月26日晚,杭州太阳剧场的颁奖台上,一位英国教授的名字出现在大屏幕上。 他叫Alan Macfarlane,已经84岁,是剑桥大学社会人类学系荣休教授,研究领域横跨英国巫术史、尼泊尔社会、现代世界起源。他参赛的视频毫不“流量向”,没有三分钟抓人眼球的叙事,没有精心设计的剪辑节奏,开头只是用略带口音的中文道一句“你好”,然后娓娓讲述关于文明、历史或人类社会的�

  • 2026年专业视频微单如何选?佳能R50V给出了一套完整方案

    佳能R50V是EOS V系列首款机型,围绕视频创作、Vlog记录、人像拍摄、轻便携带及静态摄影五大核心场景设计。它仅重323克,支持6K超采样4K30P视频、第二代全像素双核CMOS AF对焦系统及14种色彩滤镜,为视频创作者提供轻量化方案。画质平衡出色,散热表现佳,对焦智能覆盖人物、动物和交通工具,竖拍优化适合直播,静态拍摄也保留佳能肤色优势,是视频为主、兼顾便携与人像效果的微单相机。

  • 跻身全球第一梯队!京东开源JoyAI-Echo框架:解决长视频生成三大难题

    今日,京东宣布推出JoyAI-Echo长音视频生成框架,号称解决行业长期头疼的长视频生成三大难题:角色易崩、声音乱变、生成缓慢。 目前,JoyAI-Echo代码与权重已全部开源,项目页和GitHub代码仓库均已上线,开发者和创作者可进行体验和二次开发。 京东表示,JoyAI-Echo的推出,标志着京东在长视频生成领域实现重大突破,进入全球第一梯队。 据了解,JoyAI-Echo内置跨模态音视频�

  • 2026年6月AI电商智能体推荐指南:AI电商卖点提取,AI电商视频生成,直播带货AI,中小商家AI公司优选!

    2026年AI电商工具已从尝鲜进入刚需阶段,覆盖卖点提取、短视频生成、直播辅助等场景,使用AI的商家平均内容产出效率提升47%、营销成本下降38%、转化率提高22%。本文围绕三大核心场景,推荐Lightnuts(国内电商内容生产与落地效果突出)、草妈妈(数据驱动能力强)、万兴播爆(跨境适配性佳)、微盟AI(全链路服务完善)及剪映商业版(抖音生态协同好)五家服务商,为中小商家采购提供参考。

今日大家都在搜的词: