首页 > 传媒 > 关键词  > 视频编码最新资讯  > 正文

腾讯多媒体实验室5篇论文入选PCS 2022,含视频压缩、视频数据集等领域

2023-04-06 18:48 · 稿源: 站长之家用户

  视觉数据编码顶 级国际论坛之一的 PCS 2022 论文入选结果公布!

  本次,腾讯多媒体实验室共有 5 篇论文入选,内容含视频压缩、视频数据集、神经网络压缩图像/视频压缩、高维媒体压缩等多个领域。

  以下为入选论文简介:

  用于屏幕内容编码的开放视频数据集

  An Open Video Dataset for Screen Content Coding

  Y. Wang, X. Zhao, X. Xu, S. Liu, Z. Lei, M. Afonso, A. Norkin, T. Daede 2022 IEEE PCS, Dec. 2022

  近年来,屏幕内容视频在视频录制和视频会议等几大视频应用中越来越受欢迎。不同于传统由相机传感器捕获的图像视频内容,屏幕内容是由计算机通过程序及模型计算生成的。针对屏幕内容的统计特性,研究人员开发了专用的编码工具以实现显着的压缩效率增益。鉴于屏幕内容应用的普及,本文提出了一个开放的屏幕内容视频数据集,用于屏幕内容编码技术的研究和发展。提出的视频数据集包含12 个典型的公开可用的屏幕内容类型视频剪辑。此外,为了更好地理解所提出的视频数据集的特征,本文对 AOMedia Video 1 (AV1) 视频编码标准中的几项核心的屏幕内容编码工具进行了性能评估,并在本文中结合数据集的统计特性进行了分析。

  通用视频编码中帧内和帧间预测的统一快速分割算法

  Unified Fast Partitioning Algorithm for Intra and Inter Predictions in Versatile Video Coding

  W. Kuang, X. Li, X. Zhao, S. Liu 2022 IEEE PCS, Dec. 2022

  最 新一代VVC视频编码标准采用了比上一代HEVC视频编码标准更加灵活的块划分技术框架。该技术框架所支持的四叉树及多类型树(QTMT)块划分结构显著提高了编码效率。然而,根据递归编码单元(CU) 块划分方案进行全搜索寻找最 优块划分结构会导致编码器的计算复杂度大幅增加。在本文中,作者针对帧内和帧间预测提出了一种统一的块划分结构快速算法,该算法利用了编码器在模式决策过程中评估各种候选块划分方案的各种历史信息进行块划分模式的筛选,从而跳过不必要的块划分方案,达到编码器计算复杂度的降低。本文所提出的算法在VVC 参考软件VTM-14.0 之上已经实现并且验证。实验结果表明,所提出的算法在所有帧内(AI)、随机访问(RA)和低延迟(LDP)配置下能够显著地提升编码速度,编码时间节省达到40%。

  用于动态网格编码的边界保留几何视频

  Boundary-Preserved Geometry Video for Dynamic Mesh Coding

  C. Huang, X. Zhang, J. Tian, X. Xu, S. Liu 2022 IEEE PCS, Dec. 2022

  本文提出了一种用于具有时变几何、连接性和属性的动态网格编码(DMC) 的边界保留几何视频 (BPGV) 框架。几何视频是通过在采样的 2D UV 图表中插入 3D XYZ 坐标生成的,并且可以通过任何视频编解码器进行编码以消除空间和时间冗余。然而,由于缺少 UV 图表的边界信息,几何视频本身的重建可能会严重失真。因此,建议通过有效的预测和残差编码在单独的子比特流中编码 UV 图的边界信息。连接信息可以从解码的几何图像和边界信息中推断出来,通过三角测量在解码器端具有线性复杂度。通过利用建议的编码工具(包括自适应图表采样和原始图表编码模式)在比特率和质量之间进行权衡,可以实现更好的编码性能。提议的 BPGV 框架是作为对 MPEG CfP on DMC 的回应而提交的,结果证明其与最 先进的网状编解码器相比具有卓越的性能。

  通过迭代训练优化基于神经网络的环路滤波器

  Optimize neural network based in-loop filters through iterative training

  L. Wang, X. Xu, S. Liu 2022 IEEE PCS, Dec. 2022

  通用视频编码(VVC)的最 新视频编码标准已于 2020 年最终确定。在研究人员之前的工作中,提出了几种基于神经网络的环路滤波器来提高 VVC 以外的压缩性能。但是,没有考虑帧间引用机制的影响,导致训练过程和最终测试过程不一致。为了解决这个问题,本文提出了一种迭代训练方法来进一步优化基于神经网络的环路滤波器。基于所提出的方法,可以实现高达 1.74% 的额外YUV BD 码率节省。与VVC相比,实验表明, 22 个模型的过滤器平均节省了14.00%的YUV BD-rate,而单个模型的过滤器平均节省了11.21%的YUV BD-rate。此外,主观评价已经证实单模型滤波器的性能明显优于 VVC。

  替代神经图像压缩

  Substitutional Neural Image Compression

  X. Wang, D. Ding, W. Jiang, W. Wang, X. Xu, S. Liu, B. Kulis, P. Chin 2022 IEEE PCS, Dec. 2022

  本文描述了替代神经图像压缩(SNIC),这是一种增强任何神经图像压缩模型的通用方法,不需要数据或对训练模型进行额外调整。它将压缩性能提高到灵活的失真度量,并使用单个模型实例实现比特率控制。关键思想是将要压缩的图像替换为以所需方式优于原始图像的替代图像。找到这样的替代品对于传统的编解码器来说本来就很困难,但由于其完全可微分的结构,对于神经压缩模型来说却出人意料地有利。通过将特定损失的梯度反向传播到输入,可以有效地迭代制作所需的替代品。研究人员展示了SNIC 在与各种神经压缩模型和目标指标相结合时在提高压缩质量和执行通过率失真曲线测量的比特率控制方面的有效性。

  腾讯多媒体实验室专注于多媒体技术领域的前沿技术探索、研发、应用和落地,音视频编解码、网络传输、实时通信、多媒体内容质量评估和沉浸式媒体的端到端解决方案,同时负责国际国内行业标准制定,包含多媒体数据压缩、网络传输协议、多媒体系统和开源平台等。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 全球图生视频榜单第一,爱诗科技PixVerse V5如何改变一亿用户的视频创作

    好玩好用的明星视频生成产品再更新,用户操作基础,模型技术就不基础。 熟悉生成领域的读者们最近都被谷歌的一只纳米香蕉 nano-banana 刷了屏。 在图像生成领域,纳米香蕉在短期内获得了巨量的影响力,凭着「照片变手办」的超高真实感的创意玩法横扫整个社交媒体,尤其触动了毛孩子家长们的心。

  • 解码小熊电器品牌背后的故事:是生活方式的变迁

    1963年威廉·莱泽提出“生活方式”概念,强调品牌应关注消费者整体生活诉求而非孤立提供产品。如今全球商业围绕生活方式品牌建设持续演变,如Lululemon塑造健康自律符号、Patagonia代表环保理念、泡泡玛特掀起收藏文化。小熊电器从小家电制造商转型生活方式品牌,通过洞察用户需求持续创新,如破壁机解决清洗难题、升级产品满足健康早餐场景,提供品质生活解决方案。消费升级时代,品牌需从功能满足转向情绪共振,以产品与场景支撑品牌进化,赢得用户认可。

  • B站为何需要视频播客?

    ​最近,内容平台最大的风莫过于视频播客了。 各大平台纷纷发力,竞相涌入这一新赛道。其中,B站则重磅推出《视频播客出圈计划》,吸引了于谦、鲁豫、蔡明、罗永浩、杨迪等众多名人入驻,各类媒体播客也相继加入战局。 从扶持力度上和势头上看,B站无疑将视频播客视为下一个重点发力领域。那么,B站为何需要视频播客?它又能否成为B站新的品牌IP?

  • 南京新街口万达美华酒店解码金陵文脉,引爆商业热度

    南京新街口万达美华酒店凭借融合城市记忆与现代美学的设计,开业即实现连续五天满房,抖音平台预售超250万元。酒店以“文化解码”为核心,结合Art Deco风格与民国元素,打造沉浸式旅居空间。其成功彰显万达生活方式品牌的市场号召力,为高端酒店市场提供文化赋能的创新范本。

  • 解码广东浠芮燕教授:以长期主义重构健康产业价值新坐标

    燕教授以“全球健康服务商”为定位,13年构建起涵盖14大明星产品、19项专利技术的健康生态体系。在行业普遍陷入概念炒作与价格内卷时,其年复合增长率达42%,通过战略定力、技术壁垒与组织进化,成为健康产业长期主义的范本。品牌坚守“做最长久、最正确、最困难的事”原则,专注个性化健康方案研发,2024年研发投入占比8.3%,远超行业3%平均水平。未来将升级至健康生态系统,推出“1+N”健康管理方案,并计划布局全球市场。

  • 外贸营销进入视频智能时代 宜选网贸易通重构海外获客生态

    在AI与数字化浪潮下,中国外贸企业正从流量竞争转向价值竞争。宜选网贸通依托400多项专利技术,推出全视频独立站整合营销方案,通过视频内容生态、全网流量矩阵与AI智能商机引擎深度耦合,构建从流量获取到订单履约的全链路外贸增长体系。该方案实现用户停留时长4分23秒,远超行业平均水平,询盘量增长35%,助力企业借视频革命链接全球买家。

  • 因炒作明星动态破坏网络生态被查处!小红书回应被约谈:深刻吸取教训

    今日,小红书官方账号发布公告称,近日,网信部门对小红书平台热搜榜单管理不善问题进行约谈并采取处罚措施。对此,我们诚恳接受,深刻吸取教训,认真落实整改要求。” 小红书表示,我们已对照网信部门的要求,第一时间成立整改专项工作小组,推进热搜榜单生态专项治理,进一步提升热搜榜单管理能力。 我们将在网信部门的指导下,以此为戒,举一反三,切实履�

  • 大厂押注的AI和视频化,能成为播客的好出路吗?

    长期在国内市场不温不火的播客赛道,正在焕发出越来越蓬勃的新机。 8月15日,自带流量和多重话题标签的罗永浩入驻B站,并宣布将开启一档视频播客节目《罗永浩的十字路口》,8月19日,罗永浩发布了第一条视频播客,与理想汽车创始人李想进行了近4小时的深度对话,一度引发热议,在B站内的观看量超230万。 而由罗永浩掀起的这一波流量热潮背后,可以看出B站对于视频

  • 连续十季度增长!解码学大教育增长韧性:垂直深耕、多元布局与长期主义

    学大教育2025年上半年业绩亮眼,营收19.16亿元同比增长18.27%,净利润2.3亿元增长42.18%。在A股教育板块中表现突出,连续十个季度保持增长。公司通过个性化教育业务快速复制、职业教育布局深化及债务优化实现稳健发展。同时,政策利好与数字化转型推动业务持续增长,未来业绩可期。

  • 一条视频获赞427万,这些创作者靠“做好事”造爆款

    ​在抖音,以“做好事”为核心的正能量视频能有多大影响力? 去年9月,抖音创作者@良田 发布了两条前往新阳光病房学校看望白血病儿童的视频。视频中,面对因化疗失去头发而自卑的白血病女孩,他做了一个让人出乎意料的举动:剃光自己的头发,然后陪伴小女孩玩耍。震惊过后,小女孩逐渐打开心扉,绽放出了久违的笑容,并穿上公主裙拍下了一组照片。视频结尾,@良田

今日大家都在搜的词: