首页 > 业界 > 关键词  > 视频分割模型最新资讯  > 正文

一键消除视频人物!南科大发布视频分割模型TAM 支持动态物体追踪

2023-05-04 17:53 · 稿源:站长之家

站长之家(ChinaZ.com) 5月4日 消息:特效师的救星来了!近日,南科大发布视频分割模型TAM,可轻松追踪视频中的任意物体并消除,操作简单友好。

TAM的出现为解决传统视频分割模型需要人工标记培训数据和初始化参与数据的问题提供了之前提供,将改变CGI行业的游戏游戏规则。

image.png

TAM可应用于视频编辑、虚拟现实、增强现实等领域,具备广泛的应用前景。TAM的出现也将促进视频内容的真实性和可信度,减少一些虚假信息的传播。

TAM是在SAM的基础之上结合记忆力建立时空关联现实的视频分割模型,可应用于多个领域。TAM的训练过程中,SAM的静态图像分割能力对模型进行初始化,XMem进行半人干预训练,再由SAM进行再优化和调整。

TAM的出现将改变传统视频分割模式的工作方式,提供高清视频内容的真实性和可信度。

论文地址:

https://arxiv.org/abs/2304.11968

GitHub页面:

https://github.com/gaomingqi/Track-Anything

举报

  • 相关推荐
  • 闪剪AI:一键生成数字人营销视频,助力商家轻松实现内容获客

    闪剪AI是一款专为营销视频制作设计的智能工具,主要解决实体商家和小白用户制作高质量营销视频的痛点。核心功能包括:1)一键生成数字人视频,支持定制专属形象;2)提供1000+数字人模特素材;3)多语种语音克隆,实现本地化内容;4)内置爆款文案素材库;5)智能成片功能简化制作流程;6)照片数字人让静态图片"开口说话";7)直播切片功能实时引流。该工具

  • 三下乡投稿视频媒体平台|学习 强国央视频人民视频投稿

    文章介绍了高校如何在权威媒体平台高效投放宣传视频的三大推荐渠道:1)"学习 强国"平台,适合党政类内容;2)央视视频平台,作为国家级5G新媒体平台;3)人民日报旗下人民视频。建议通过第三方服务机构【猎媒传播】投稿,可1-3天快速审核发布。视频要求MP4格式,大小不超过200M,时长1-3分钟,可配300-500字简介。

  • 一键解决无障碍出行,华人创立的Transreport拿到了英国“国王企业奖”

    伦敦无障碍出行服务公司Transreport荣获2025年度英国"国王企业奖"创新类奖项。该公司由华人创业者沈星杰2015年创立,通过移动App和后台系统为残障人士提供一键预约高铁、机场等场所的照护服务。其创新技术已支持超700万次援助请求,拥有全球100万用户。目前正拓展日本、中东市场,与阪急集团合作将于2025年在日本推出服务。该奖项由英国国王亲自颁发,表彰其在推动交通系统现代化和无障碍出行领域的突出贡献。

  • MasterAgent颠覆性上线:一键式生成智能体集群,分钟级构建专属AI协作网络

    全球首个L4+级智能体母系统MasterAgent在深圳发布,标志着AI从"被动执行工具"升级为能主动思考、跨界解决问题的"数字伙伴"。该系统突破性实现三大功能:一键生成智能体集群、多智能体自主协作、灵活定制优化。核心技术突破包括动态Agent生成框架将开发周期压缩至分钟级,以及去中心化多智能体协同机制,支持数百个智能体像"数字团队"一样高效协作。由深圳深元人工智能科技自主研发,其团队依托中国科学技术大学专家资源,已快速成长为国家级高新技术企业。这一突破让AI真正成为能创造实际价值的"新生产力单元"。

  • 迅雷影音全新升级 支持多种网盘及百种视频格式解码播放

    迅雷影音发布全新版本,主打"下载-存储-播放"全链条服务。新版本支持阿里云盘、百度网盘、NAS设备等多网盘挂载,实现跨平台资源整合;支持MP4/AVI/MKV等百种视频格式及4K/8K/HDR高清播放;新增智能字幕匹配功能,可自动适配外挂字幕。产品还优化了跨端同步体验,支持PC/平板/TV多端访问云端资源。目前用户可限时免费享受超级会员权益,包括高清云播、倍速播放等10项特权。迅雷表示将持续深化与网盘厂商的生态合作,通过技术创新提升数字内容消费体验。

  • 小红书可以长文了:正文可发千字以上 一键排版

    小红书官方近期开启长文功能内测,定向邀请创作者申请开通,为内容创作带来新体验。 长文创作有清晰流程:标题限20字内,正文支持千字以上输入,可插入图片、表情包。 长文支持一键排版”功能,点击后长文自动切分,还能借助AI自动生成封面配图与文章摘要。 后台提供6个排版模板,创作者可自选风格,灵活调整主题配色、封面、标题及摘要,实时预览效果,让长文

  • 共探AI视频新纪元:讯飞“绘镜开放麦”全回顾

    7月12日,科大讯飞与WaytoAGI联合主办的"绘镜开放麦"活动在杭州举行,汇聚全国百余位AI视频创作者探讨AI视频创作潜力。活动发布了"讯飞绘镜共创者计划",邀请视频爱好者参与AI创作。多位创作者分享了AI赋能视频创作的经验,讯飞工程师详解了AI视频生成技术原理,强调精准提示词的重要性。讯飞绘镜平台通过精细化提示词优化、角色DNA赋予等技术,提升视频生成质量。活动还展示了AI视频挑战赛优秀作品,6位获奖者获颁荣誉。WaytoAGI作为最大AI开源社区,将持续推动AI创作生态发展。

  • 腾讯视频上线“超高清内容”专区:4K/60帧 支持HDR Vivid

    近日,腾讯视频推出超高清内容”专区,集纳平台400余部超高清内容,涵盖电视剧、电影、纪录片、综艺、动画片、微短剧等品类,在各端进行重点推荐。 腾讯视频超高清方案命名为臻彩”,这是腾讯视频超高清的代表性技术。 2025年1月,腾讯视频自研超高清视听品牌臻彩”的高阶版本臻彩MAX”正式推出,主打极致画质与沉浸式观影体验。

  • 马斯克xAI推出Grok - 4 大模型将至,Meta/微美全息深耕开源AI融合加速

    埃隆·马斯克旗下xAI即将发布Grok-4大模型,该模型将在语言、数学和推理方面超越OpenAI和谷歌最新AI产品。同时苹果低调收购两家AI公司TrueMeeting和WhyLabs,加速布局Vision Pro头显和Apple Intelligence领域。Meta计划投入数百亿美元扩建AI基础设施,扎克伯格亲自招募顶尖AI人才。微美全息聚焦高性能算力与多模态模型,推动AI产业升级。当前AI赛道竞争激烈,大模型正向通用多模态演进,商业化落地成为关键。

  • 视频播客,还值不值得抖快B红争一争

    这个夏天,B站又主动高调了一回。 “视频播客出圈计划”推出,B站承诺千万流量扶持、AI剪辑工具和城市录播棚支持,旨在将原本属于耳朵的“播客”内容,也呈现在屏幕之前。这不是B站第一次试图改写内容生态,也不会是最后一次。 更耐人寻味的是,它选择的视频播客这一形式,恰恰正处于一种“想被看见”又“尚未被定义”的模糊边界上。 视频播客当然不是什么新物