在线视频实例分割技术TCOVIS 可保持时间一致性

2023-09-26 16:59 · 稿源：站长之家

站长之家（ChinaZ.com）9月26日消息:研究人员介绍了一种名为TCOVIS的在线视频实例分割技术，该技术注重时间一致性。实例分割是计算机视觉领域的一个热门研究课题，其目标是将视频帧中的每个独立实例进行识别和分割。

TCOVIS的核心创新在于提出了一个时序一致性模块。视频实例分割是一个非常具有挑战性的任务，因为需要对每一帧图像进行语义分割，同时跟踪并关联各帧之间的目标实例。但是由于各帧之间存在遮挡、形变等问题，使得直接应用图片实例分割模型往往无法获得时序一致和连续的结果。

论文地址:https://arxiv.org/pdf/2309.11857v1.pdf

项目地址:https://github.com/jun-long-li/TCOVIS

TCOVIS通过构建一个记忆模块来实现时序一致性。该模块存储历史帧的特征，并与当前帧建立匹配，从而关联当前帧与之前帧之间的同一实例。 Memory模块采用字典学习的策略，以降低存储和搜索时间成本。同时，TCOVIS还设计了在线训练和模型自监督策略，使框架能够适应视频中新出现的实例，实现真正的在线逐帧分割。

经过实验验证，TCOVIS相比其他主流方法，能够取得更好的时间一致性指标，同时保持与SOTA方法相当的分割精度。该框架可以部署在资源受限的边缘设备上，实现实时高质量的视频实例分割。

（举报）

相关推荐

关键词：

视频

Sora App的AI视频社交，给了百度们新希望

Sora2发布两周后，百度的蒸汽机AI视频模型，和谷歌Veo3.1撞了档期。两家公司选择同期发布并非有多默契，而是Sora2带来的压迫感促使它们不得不加快脚步。奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”，不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃，还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。这无疑是扔在AI视�

文章搜索核心标签 AI视频模型
荐做乐园，长视频拥抱线下的终极大考

如果说过去十年中国长视频平台的竞争重点一直在“内容规模”、“会员数”与“时长争夺”这些线上指标上，那么进入2024–2025年之后，这场竞争的重心，正在悄然转向“线下”。随着短视频、短剧对注意力的强势分流，用户的付费意愿、广告主的投放信心以及内容本身的价值空间都在被压缩，单纯依靠“剧好看”、“综艺够爆”已经无法支撑起平台增长的想象力。一个�

长视频平台线下乐园 IP体验
荐投身短视频后，「极客」们不再孤单

「Geek」一词在互联网和科技产业的崛起过程中，本来仅指向比尔·盖茨、史蒂夫·乔布斯等对计算机科学和技术充满热情的人。在当下语境中，其含义则不断拓展，成为智慧、专业、创新和热情的代表，对某一领域或技术极度痴迷并具备深入了解、精通能力的人，都可称之为「极客」。在科技发展普及、不断平权的当下，极客们拥有了更蓬勃的创造活力。今年来，以抖音、b站

极客文化科技创新短视频平台
短视频加速跑入AI时代

「现在是西天取经的第996天，刚把师父从妖怪嘴里救出来，师父身上都还是热乎的，我们就马不停蹄开始出发了。」在抖音，都能看到《西游记》里师徒四人的取经vlog了。采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播，各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。尽管在专业影视

文章搜索核心标签 AI生成
即构实时音视频：为宠物陪伴打造稳定的连接引擎

随着宠物经济升温，智能设备正从“自动化工具”升级为“实时陪伴终端”。以可视喂食器为例，通过即构实时音视频技术实现远程高清互动：支持80%抗丢包、1080P画质、200ms低延迟及暗光增强功能，确保弱网环境下仍能流畅投喂、清晰观察宠物状态。这项技术重塑了人宠情感连接，成为宠物IoT厂商提升用户体验的核心竞争力。
get这一点，才是把视频会议用到极致

远程办公常态化下，视频会议常遇网络卡顿、文件传输慢、频繁掉线等问题。TCL会议电视内置腾讯会议、钉钉等主流软件，一键入会；配备多功能遥控器，支持快速开关摄像头、翻页等操作。搭载AI拾音算法，精准锁定发言人，声音清晰；采用防眩光技术，减少视觉干扰，画面高清稳定。配备Type-C 4K无线投屏接口，秒速投屏，文件传输快如闪电。TCL会议电视打造高效会议体验，助力职场人轻松应对各类会议场景。

数字化转型远程办公视频会议
抄底指南！佳能R50V领衔双十一微单榜：视频拍照全能打，开箱即用真省钱

双十一期间数码相机市场热度攀升，佳能R50V凭借全能双修与高性价比位居榜首。其搭载APS-C画幅CMOS与DIGIC X处理器，支持6K超采样4K视频，配备智能对焦系统及丰富创意功能，满足视频创作者多元需求。配合双十一诚意套餐，从Vlog基础装备到专业补光设备一应俱全，大幅降低创作门槛。对于追求性能与价格平衡的用户，佳能R50V是明智选择。

双十一数码相机佳能R50V
荐Sora2之后，又来了个全新的影视级AI视频模型，它的名字，叫GAGA。

Sora2爆火之后，随之而来的AI视频领域的新产品。来自我的好朋友，曹越老师的Sand.ai。凌晨，他们终于上线了他们全新的音画同步视频模型GAGA-1，在人物表演上，我觉得，已经算是现在的TOP级了。

AI视频 GAGA-1 音画同步
音视频系统服务商推荐！itc保伦股份荣获全国声光视讯行业工匠杯“百强企业奖”

近日，第五届全国声视讯行业“工匠杯”评选在深圳举行，近500家产业链企业参与。itc保伦股份凭借技术创新、优质产品与服务，历经网络投票和专家评审，从192个品牌中脱颖而出，荣获“百强企业奖”。该奖项肯定了itc在音视频领域的专业能力和持续创新精神。作为行业领军者，itc深耕三十余载，专注国产化音视频系统研发，拥有1678项知识产权，产品应用于北京奥运会等重大项目。未来，itc将继续加大研发，以工匠精神推动行业高质量发展。

LED工程商联盟工匠杯评选声光电视讯
预算6000左右怎么选？佳能R50V大促来袭，视频拍照双修微单，送礼还带美颜！

双十一期间，佳能R50V微单相机以5999元起售，主打高性价比与全能表现。它专为视频和拍照双修设计，支持6K超采4K视频、全像素双核AF对焦，配备2420万像素APS-C传感器，适合Vlog拍摄与日常抓拍。促销赠品丰富，涵盖基础配件到专业工具套装，满足不同用户需求。机身轻便，色彩还原自然，是预算6000元左右用户的优选。

双十一微单推荐性价比高微单佳能R50V

今日大家都在搜的词：

热文

3 天
7天

在线视频实例分割技术TCOVIS 可保持时间一致性

Sora App的AI视频社交，给了百度们新希望

荐做乐园，长视频拥抱线下的终极大考

荐投身短视频后，「极客」们不再孤单

短视频加速跑入AI时代

即构实时音视频：为宠物陪伴打造稳定的连接引擎

get这一点，才是把视频会议用到极致

抄底指南！佳能R50V领衔双十一微单榜：视频拍照全能打，开箱即用真省钱

荐Sora2之后，又来了个全新的影视级AI视频模型，它的名字，叫GAGA。

音视频系统服务商推荐！itc保伦股份荣获全国声光视讯行业工匠杯“百强企业奖”

预算6000左右怎么选？佳能R50V大促来袭，视频拍照双修微单，送礼还带美颜！

今日大家都在搜的词：

热文

一加15今晚发布定位全能水桶机

红米REDMI K90全方位提升雷军：是不是越来越有旗舰气质

余承东曝鸿蒙智行新款享界S9将于11月上市

华为MatePad Pro流金典藏版开卖：售价7799元

华为MatePad Mini典藏版今日开售：售价5999元起

AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度

iPhone18发布或推迟苹果明年9月只发Pro系列和Fold折叠屏

五大升级！红米REDMI K90标准版采用6.59英寸黄金中尺寸

华为nova Flip S小折叠开售：首发3388元起

兰博基尼联名！REDMI K90 Pro Max冠军版官宣

微信三大更新放出上热搜涉及群聊消息处理、消息撤回等

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个

雷军回应K90定价：最近内存涨价太多希望大家理解这份诚意

红米REDMI K90标准版亮相：质感、工艺脱胎换骨

REDMI K90标准版12+512GB降价300元小米回应：可退差价

苹果首款2nm手机芯片上热搜 A20由iPhone 18系列首发

华为鸿蒙HarmonyOS 6公测版开启推送

站长商机