首页 > 传媒 > 关键词  > 视频编码最新资讯  > 正文

腾讯多媒体实验室5篇论文入选PCS 2022,含视频压缩、视频数据集等领域

2023-04-06 18:48 · 稿源: 站长之家用户

  视觉数据编码顶 级国际论坛之一的 PCS 2022 论文入选结果公布!

  本次,腾讯多媒体实验室共有 5 篇论文入选,内容含视频压缩、视频数据集、神经网络压缩图像/视频压缩、高维媒体压缩等多个领域。

  以下为入选论文简介:

  用于屏幕内容编码的开放视频数据集

  An Open Video Dataset for Screen Content Coding

  Y. Wang, X. Zhao, X. Xu, S. Liu, Z. Lei, M. Afonso, A. Norkin, T. Daede 2022 IEEE PCS, Dec. 2022

  近年来,屏幕内容视频在视频录制和视频会议等几大视频应用中越来越受欢迎。不同于传统由相机传感器捕获的图像视频内容,屏幕内容是由计算机通过程序及模型计算生成的。针对屏幕内容的统计特性,研究人员开发了专用的编码工具以实现显着的压缩效率增益。鉴于屏幕内容应用的普及,本文提出了一个开放的屏幕内容视频数据集,用于屏幕内容编码技术的研究和发展。提出的视频数据集包含12 个典型的公开可用的屏幕内容类型视频剪辑。此外,为了更好地理解所提出的视频数据集的特征,本文对 AOMedia Video 1 (AV1) 视频编码标准中的几项核心的屏幕内容编码工具进行了性能评估,并在本文中结合数据集的统计特性进行了分析。

  通用视频编码中帧内和帧间预测的统一快速分割算法

  Unified Fast Partitioning Algorithm for Intra and Inter Predictions in Versatile Video Coding

  W. Kuang, X. Li, X. Zhao, S. Liu 2022 IEEE PCS, Dec. 2022

  最 新一代VVC视频编码标准采用了比上一代HEVC视频编码标准更加灵活的块划分技术框架。该技术框架所支持的四叉树及多类型树(QTMT)块划分结构显著提高了编码效率。然而,根据递归编码单元(CU) 块划分方案进行全搜索寻找最 优块划分结构会导致编码器的计算复杂度大幅增加。在本文中,作者针对帧内和帧间预测提出了一种统一的块划分结构快速算法,该算法利用了编码器在模式决策过程中评估各种候选块划分方案的各种历史信息进行块划分模式的筛选,从而跳过不必要的块划分方案,达到编码器计算复杂度的降低。本文所提出的算法在VVC 参考软件VTM-14.0 之上已经实现并且验证。实验结果表明,所提出的算法在所有帧内(AI)、随机访问(RA)和低延迟(LDP)配置下能够显著地提升编码速度,编码时间节省达到40%。

  用于动态网格编码的边界保留几何视频

  Boundary-Preserved Geometry Video for Dynamic Mesh Coding

  C. Huang, X. Zhang, J. Tian, X. Xu, S. Liu 2022 IEEE PCS, Dec. 2022

  本文提出了一种用于具有时变几何、连接性和属性的动态网格编码(DMC) 的边界保留几何视频 (BPGV) 框架。几何视频是通过在采样的 2D UV 图表中插入 3D XYZ 坐标生成的,并且可以通过任何视频编解码器进行编码以消除空间和时间冗余。然而,由于缺少 UV 图表的边界信息,几何视频本身的重建可能会严重失真。因此,建议通过有效的预测和残差编码在单独的子比特流中编码 UV 图的边界信息。连接信息可以从解码的几何图像和边界信息中推断出来,通过三角测量在解码器端具有线性复杂度。通过利用建议的编码工具(包括自适应图表采样和原始图表编码模式)在比特率和质量之间进行权衡,可以实现更好的编码性能。提议的 BPGV 框架是作为对 MPEG CfP on DMC 的回应而提交的,结果证明其与最 先进的网状编解码器相比具有卓越的性能。

  通过迭代训练优化基于神经网络的环路滤波器

  Optimize neural network based in-loop filters through iterative training

  L. Wang, X. Xu, S. Liu 2022 IEEE PCS, Dec. 2022

  通用视频编码(VVC)的最 新视频编码标准已于 2020 年最终确定。在研究人员之前的工作中,提出了几种基于神经网络的环路滤波器来提高 VVC 以外的压缩性能。但是,没有考虑帧间引用机制的影响,导致训练过程和最终测试过程不一致。为了解决这个问题,本文提出了一种迭代训练方法来进一步优化基于神经网络的环路滤波器。基于所提出的方法,可以实现高达 1.74% 的额外YUV BD 码率节省。与VVC相比,实验表明, 22 个模型的过滤器平均节省了14.00%的YUV BD-rate,而单个模型的过滤器平均节省了11.21%的YUV BD-rate。此外,主观评价已经证实单模型滤波器的性能明显优于 VVC。

  替代神经图像压缩

  Substitutional Neural Image Compression

  X. Wang, D. Ding, W. Jiang, W. Wang, X. Xu, S. Liu, B. Kulis, P. Chin 2022 IEEE PCS, Dec. 2022

  本文描述了替代神经图像压缩(SNIC),这是一种增强任何神经图像压缩模型的通用方法,不需要数据或对训练模型进行额外调整。它将压缩性能提高到灵活的失真度量,并使用单个模型实例实现比特率控制。关键思想是将要压缩的图像替换为以所需方式优于原始图像的替代图像。找到这样的替代品对于传统的编解码器来说本来就很困难,但由于其完全可微分的结构,对于神经压缩模型来说却出人意料地有利。通过将特定损失的梯度反向传播到输入,可以有效地迭代制作所需的替代品。研究人员展示了SNIC 在与各种神经压缩模型和目标指标相结合时在提高压缩质量和执行通过率失真曲线测量的比特率控制方面的有效性。

  腾讯多媒体实验室专注于多媒体技术领域的前沿技术探索、研发、应用和落地,音视频编解码、网络传输、实时通信、多媒体内容质量评估和沉浸式媒体的端到端解决方案,同时负责国际国内行业标准制定,包含多媒体数据压缩、网络传输协议、多媒体系统和开源平台等。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 长视频,要MCN化?

    过去十多年,长视频平台习惯用头部综艺与大剧撬动增长:内容够强,自然破圈,声量带动会员与广告。 这套“内容中心逻辑”曾行之有效。 但短视频重写了注意力分配。用户不再愿意投入整段时间追一个叙事,三十秒的情绪刺激就足以满足娱乐需求。内容生命周期被压缩,哪怕是重金制作,也可能上线当周见顶、难以延展。 在这种环境下,平台不得不寻找新的增长方式。�

  • 2025秋招白皮书深度解码:五大趋势重塑人才竞争新格局

    2025年校园招聘市场正经历结构性变革。面对1593万高校毕业生,企业招聘策略从“规模导向”转向“精准匹配”。五大趋势显现:求职者呈现“发展+稳定”双重诉求,企业需构建双维度吸引力;精准投递成主流,41.7%学生投递不超10家企业;行业偏好重构,互联网/IT仍居首但制造业占比提升;企业转向“实用主义”,本科与博士需求双升;AI招聘进入“好用”阶段,应用率达79%。企业需提升精准识人、差异化吸引和系统化管理能力,方能在人才竞争中占据先机。

  • 短视频加速跑入AI时代

    「现在是西天取经的第996天,刚把师父从妖怪嘴里救出来,师父身上都还是热乎的,我们就马不停蹄开始出发了。」在抖音,都能看到《西游记》里师徒四人的取经vlog了。 采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播,各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。 尽管在专业影视

  • 剪辑快人一步!索尼ICE-Cloud助力婚礼视频团队高效高质交付

    北京二十四格文化有限公司(24Frames)成立于2004年,专注极致纪实影像美学,深耕婚礼电影、商业宣传、纪录片、综艺及艺人合作等领域。团队以真实事件与情感为核心,融合高级审美与技艺,打造富有共情力的影片,助力品牌传递深度价值。面对跨地域协作与高清素材传输等挑战,公司通过索尼与分秒帧联合推出的ICE-Cloud云平台优化流程,实现拍摄至交付的高效协同,显著�

  • 美食视频神器?佳能R50V用清晰画质与诱人色彩,让你随手一拍即专业

    佳能R50V相机凭借卓越画质与色彩表现,成为摄影爱好者的得力伙伴。其针对人像、美食、街头三大高频场景深度优化:人像拍摄可呈现自然通透肤色,五级平滑皮肤模式保留肌理细节;美食记录通过2420万像素传感器与14种色彩滤镜,精准还原食材质感与诱人色泽;323克轻巧机身配合高速对焦系统,轻松捕捉街头瞬间。相机以“拍得好、美、轻松”为核心,精准满足用户日常拍摄需求,让高质量影像记录变得简单愉悦。

  • 君乐宝奶粉解码母源营养 产学研专家联合见证人乳低聚糖科学白皮书发布

    11月7日,君乐宝乳业集团举办营养专家研讨会暨《人乳低聚糖功能与应用白皮书》发布仪式。会议聚焦人乳低聚糖(HMOs)等前沿技术,探讨其在婴幼儿营养中的应用。白皮书作为国内首个HMOs权威指南,系统梳理了HMOs功能,为优化婴幼儿营养策略提供科学参考。君乐宝以“脑体双优”科研模型为核心,推出优萃宝贝奶粉,通过添加活性免疫球蛋白、新一代DHA等成分,支持婴幼儿认知力、自护力等“五力”全面发展。会议汇聚行业专家,强调HMOs研究对产业转型的重要性,推动婴幼儿营养从成分叠加转向功能机制创新。

  • Sora App的AI视频社交,给了百度们新希望

    Sora2发布两周后,百度的蒸汽机AI视频模型,和谷歌Veo3.1撞了档期。 两家公司选择同期发布并非有多默契,而是Sora2带来的压迫感促使它们不得不加快脚步。 奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”,不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。 这无疑是扔在AI视�

  • 音视频系统服务商推荐!itc保伦股份荣获全国声光视讯行业工匠杯“百强企业奖”

    近日,第五届全国声视讯行业“工匠杯”评选在深圳举行,近500家产业链企业参与。itc保伦股份凭借技术创新、优质产品与服务,历经网络投票和专家评审,从192个品牌中脱颖而出,荣获“百强企业奖”。该奖项肯定了itc在音视频领域的专业能力和持续创新精神。作为行业领军者,itc深耕三十余载,专注国产化音视频系统研发,拥有1678项知识产权,产品应用于北京奥运会等重大项目。未来,itc将继续加大研发,以工匠精神推动行业高质量发展。

  • 拍照视频,无需妥协:佳能R50V以全能双修定义创作新标准

    佳能R50V以“全能双修”定位成为市场焦点,在视频与摄影两大核心维度表现均衡专业。搭载2420万像素APS-C画幅CMOS与DIGIC X处理器,支持6K超采4K录制及专业格式,配备10bit色深。机身仅重323克,新增竖拍优化与14种滤镜,支持USB一线连播。具备1/8000秒快门与第二代全像素双核AF系统,可精准识别多类主体。配合RF-S电动变焦镜头实现广角自拍,覆盖Vlog、直播、人像等多场景,以约6000元定价降低专业创作门槛,成为内容创作者的热门选择。

  • 科大讯飞1024发布:讯飞翻译APP迭代焕新,同声传译+音视频翻译重构沟通体验

    在2025科大讯飞全球1024开发者节期间,讯飞翻译APP迎来关键升级,重点强化同声传译功能。通过搭载全新语音同传大模型,实现翻译更准、响应更快;新增实时分享、记录留存、悬浮字幕等特性,支持跨场景高效应用。该产品已在东盟博览会等国际场合验证实用性,结合IDC报告八大维度第一的权威背书,彰显了AI翻译技术从研发到落地的全链条优势,为跨语言沟通提供简单如母语的体验。

今日大家都在搜的词: