首页 > 传媒 > 关键词  > 正文

TencentAVS3编码器MSU大赛取得佳绩,国标编码助力腾讯视频更优画质体验

2023-10-18 16:14 · 稿源: 站长之家用户

导语:腾讯视频多终端支持国标AVS3,并于近期上线多部AVS3 格式超清国产大片。该格式视频基于腾讯多媒体实验室AVS3 编码压缩技术,其在最 新的MSU大赛中取得优异成绩,可给用户带来画质更优超清体验。这也标志着腾讯在视频编解码领域国产化方向,又迈出了坚实一步。

2023 年 10 月 17 日,最 新一期MSU 4K视频编码大赛结果揭晓,由腾讯多媒体实验室研发的TencentAVS3 编码器取得不俗成绩。在包括H.265/HEVC, AV1,H.266/VVC等一众编码器的角逐中,作为首 个参加MSU 4K赛道的国标AVS3 编码器,其参加的1fps速度档位全部 5 项指标均优于参赛H.265/HEVC与AV1 编码器。全部 5 项指标显示,在比赛测试条件,TencentAVS3 编码器相比x265,同速度档位可节省近40%带宽。

图1 · MSU比赛结果(同等YUV (6:1:1)-PSNR画质下,TencentAVS3 比参考编码器x265 节省39%带宽)

AVS3(Audio Video coding Standard,音视频编码标准)是我国自主知识产权的音视频编码标准组织的第三代标准,作为首 个面向5G+8K超高清产业应用的视频编码标准,国产化标准AVS3 从技术上完成了跟跑、并跑到领跑国际的跨越,同时,在当前时代背景下,采用AVS3 自主可控的重要性不言自明。TencentAVS3 通过深度优化,在符合AVS3 标准范畴内进一步大幅提升编码性能。这意味着相同画质下相比国际视频编码标准H.265/HEVC可节省更多流量,同时也意味着用户在相同流量下可以享受更高质量的画面。对于推动我国自主知识产权视音频标准的落地应用具有重要意义。

为让用户尽早体验到国产化标准带来的超清画质体验,腾讯视频于月初发布新版本,手机、iPad等各类移动终端设备均已适配支持AVS3。适逢国庆,腾讯视频精心挑选了一批红色电影、国产科幻大片,在相应机型,用户播放这些电影,即可体验到AVS3。在首批上线影片右上角,用户可以看到标记着“AVS3”的水印字样,也方便用户感知这一来自我国自主知识产权的视频编解码压缩标准。目前单周播放量已至百万量级。

据了解,AVS3 第 一阶段基准档次标准发布伊始,腾讯视频随即完成了AVS3 的链路验证与部署工作,并于 2020 年完成试播验证。而后,AVS3 标准技术持续演进,并于 2021 年完成第二阶段增强档的制定,最终标准定稿方案达到国际先进水平。此次腾讯视频与腾讯多媒体实验室的合作,基于MSU参赛的最 新AVS3 编码技术,并针对腾讯视频典型场景进行多项深度优化,持续打磨编码器性能,进一步节省带宽成本,提升画质,带来更优用户体验,助推国有技术标准应用迈上新台阶,也标志着腾讯在视频编解码领域国产化方向,又迈出了坚实一步。

腾讯公司长期关注先进技术研发并推动助力业务,对于我国自主制定的音视频编解码标准,一直作为深度参与方与坚定的实践者。据悉,不仅是AVS3,在AVS系列标准中,腾讯多媒体实验室有超过 150 项技术提案被AVS标准组织所采纳,并担任多个专题组主席,主导了包括AVS3 屏幕内容编码技术、点云压缩技术、沉浸式媒体系统,以及3D点云质量评价等技术的标准化工作。 2020 年,腾讯云与腾讯多媒体实验室共同开发AVS2 编解码引擎,并成为国内头家支持AVS2 视频处理业务的公有云厂商。如今,AVS2 与AVS3 视频编解码引擎均已通过腾讯云服务广电等行业应用。基于AVS2 标准的图片压缩引擎也广泛服务腾讯内外各类业务。今年年初,腾讯公司获得了 2022 年度AVS产业技术创新单位奖。

图2 ·2022 年度AVS产业技术创新奖颁奖

(右一:腾讯多媒体实验室高 级研究员朱文婕)

回顾AVS3 自主创新技术产业化的发展历史, 2019 年,上海海思技术有限公司、AVS产业联盟、当虹科技、广东省超高清视频创新中心和鹏城实验室联合发布了首 个基于AVS3 标准的8K端到端解决方案,推出首 个基于AVS3 标准的超高清解码芯片Hi3796CV300。而后,“天枢”编码器(又名“uAVS3e”)、SVT-AVS3 等AVS3 编码方案也为产业提速持续做出突出贡献。目前,AVS3 已通过电视、互联网、移动设备等方式在央视春节晚会、北京冬奥会、世界杯、亚运会等多个大型直播活动中广泛应用。并作为下一代视频编解码规范被成功纳入DVB标准体系,意味着AVS3 标准将在超高清产业体系内推荐给全球的电视和视频业务运营商使用。未来,AVS与产业的深度融合,会创造出更多可能。据悉,AVS系列标准的下一代探索已经开始展开,腾讯也将会持续跟进。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • 优设 AI 导航:专业 AIGC 网站导航,每周更新热门 AI 工具。

    优设 AI 导航是专业全面的 AIGC 网站导航,为 AI 创作者提供 AI 绘画、智能对话、翻译等 AI 工具指引。其主要优点在于定期更新热门 AI 工具,为用户提供最新的 AI 技术应用信息。

  • Hyper-SD:高效图像合成的新框架

    Hyper-SD是一个创新的图像合成框架,它通过轨迹分割一致性模型和低步数推理的优势,实现了高效的图像合成。该框架结合了ODE轨迹保留和重构的优势,同时通过人类反馈学习进一步提升了性能,并通过分数蒸馏技术增强了低步数生成能力。Hyper-SD在1到8步推理步骤中实现了SOTA性能,特别适合需要快速且高质量图像生成的应用场景。

  • Unsloth:快速训练和微调大型语言模型

    Unsloth 是一个旨在提高大型语言模型(LLMs)训练和微调速度的平台。它通过手动推导所有计算密集型数学步骤并手写GPU内核,实现了无需硬件更改即可显著加快训练速度。Unsloth 支持多种GPU,包括NVIDIA、AMD和Intel,并提供开源版本供用户在Google Colab或Kaggle Notebooks上免费试用。它还提供了不同级别的定价方案,包括免费版、Pro版和企业版,以满足不同用户的需求。

  • 有言一站式 AIGC 视频创作平台:无需拍摄、剪辑,一键生成 3D 视频

    有言是一站式 AIGC 视频创作平台,提供上千个高质量的 3D 虚拟人角色选择,无需真人出镜。用户无需拍摄、剪辑,一键生成场景、灯光、动画、运镜和镜头,还集成了智能镜头剪辑、高质量视频后期包装。价格分为免费和付费订阅两种模式,定位于帮助用户简单快速地制作高质量视频。

  • 蝉镜:AI 数字人视频创作平台

    蝉镜是一个在线数字人视频创作平台,利用 AI 简化视频创作过程,提供 AI 数字人播报、短视频制作、分身定制等服务。广告营销、跨境电商、短视频口播等领域的用户可以在此提升创作效率、降低成本。

  • SC-GS:用于编辑动态场景的稀疏控制高斯溅射技术

    SC-GS是一种新型表示技术,将动态场景的运动和外观分别用稀疏控制点和密集高斯函数表示。它使用少量控制点学习紧凑的6自由度变换基,这些基可通过插值权重在局部插值,得到3D高斯函数的运动场。它采用变形MLP预测每个控制点的时变6自由度变换,降低学习复杂度,增强学习能力,实现时空连贯的运动模式。同时联合学习3D高斯函数、控制点的规范空间位置和变形MLP,重建3D场景的外观、几何和动态。在训练过程中,控制点的位置和数量会自适应调整以适应不同区域的运动复杂度,并采用尽可能刚性的损失函数强制运动的空间连续性和局部刚性。由于运动表示的显式稀疏性和外观分离,该方法实现了用户控制的运动编辑,同时保留高保真度外观。大量实验表明,该方法在新视图合成和高速渲染方面优于现有方法,并支持新的保留外观的运动编辑应用。

  • XTuner:高效灵活的大规模模型微调工具包

    XTuner是一个为大型模型(如InternLM, Llama, Baichuan, Qwen, ChatGLM)设计的高效、灵活且功能齐全的微调工具包。它支持在几乎所有GPU上进行LLM和VLM的预训练和微调,能够自动调度高性能操作,如FlashAttention和Triton内核,以提高训练吞吐量。XTuner与DeepSpeed兼容,支持多种ZeRO优化技术。它还支持各种LLMs和VLM(如LLaVA),并设计了良好的数据管道,能够适应任何格式的数据集。此外,XTuner支持多种训练算法,包括QLoRA、LoRA和全参数微调,使用户能够选择最适合其需求的解决方案。

  • Neta:AI魔法,创造你的虚拟灵魂伴侣

    Neta是一个结合了AI技术的网站,用户可以自定义虚拟角色的服装,并通过AI技术让角色栩栩如生。用户可以与这些虚拟角色一起踏上冒险旅程,探索奇妙的世界,培养深厚的情感联系。Neta提供了一个充满想象力和创造性的平台,让用户在虚拟世界中体验不同的生活和情感。

  • VideoGigaGAN:视频超分辨率模型,细节丰富

    VideoGigaGAN是一款基于大规模图像上采样器GigaGAN的视频超分辨率(VSR)模型。它能够生成具有高频细节和时间一致性的视频。该模型通过添加时间注意力层和特征传播模块,显著提高了视频的时间一致性,并使用反锯齿块减少锯齿效应。VideoGigaGAN在公共数据集上与最先进的VSR模型进行了比较,并展示了8倍超分辨率的视频结果。

  • Llama3-8B-Chinese-Chat:专为中文优化的聊天模型

    Llama3-8B-Chinese-Chat 是一个专为中文优化的聊天模型,基于 Meta-Llama-3-8B-Instruct 模型并通过 ORPO 进行微调。该模型显著减少了中文问题英文回答以及回答中中英文混合的现象,同时减少了回答中表情符号的使用,使得回答更加正式。

  • SAM:智能视频对象分割技术

    SAM是一个先进的视频对象分割模型,它结合了光学流动和RGB信息,能够发现并分割视频中的移动对象。该模型在单对象和多对象基准测试中均取得了显著的性能提升,同时保持了对象的身份一致性。

  • Picture To Text:在线图片转文字

    Picture to Text是一款在线图片文字识别工具,能够批量提取和复制图片中的文字内容。它免费转换照片为可编辑的文字。

  • HueMan:开发者用户的人像 API

    HueMankey 是一个为开发者提供的用户人像 API。它能够为每个用户分配一个独特的人像头像,支持批量请求和直接存储在平台上。它提供轻量级的图像数据,动态适应用户规模,并具备灵活的订阅计划。

  • Santelmo:在线混音和母带处理服务

    使用我们的专业混音和母带处理服务,将您的音乐推向新的高度。通过AI的力量,将您的音轨转化为令人惊叹的杰作,让它在竞争激烈的音乐行业中脱颖而出。可靠的交付时间,无限修订,保证退款。

  • The best Suno AI Lyrics Generator:免费生成歌曲歌词

    Suno AI是一个专门用于生成歌曲歌词的在线工具。它只需指定一个歌曲主题,就能生成完整的歌词,包括歌词内容、旋律和伴奏。Suno AI可以生成2分钟的完整歌曲,支持各种音乐风格和流派。用户可以免费使用Suno AI网站或Discord频道生成歌曲。同时,Suno AI还提供付费版本,提供更多的生成点数和商业使用权。

  • Ongkanon:提升您每天的对话体验

    Ongkanon是一款智能对话AI助手,提供有意义且上下文相关的对话体验。它能够自然地与您交谈,就像与亲密的朋友聊天一样。Ongkanon会根据您的偏好进行个性化定制,还能记住以前对话的上下文,以便进行更连贯、有意义的交互。

  • X:生成你的AI头像视频!

    X Me是一个AI头像视频生成工具,通过输入文本即可快速生成个性化的AI头像视频。它使用轻量级的AI模型,无需复杂的训练过程,快速生成逼真的数字人物视频。X Me提供多种AI名人头像供用户选择,并支持将用户自己的面部特征和声音克隆到生成的头像视频中。用户可以根据自己的喜好和需求,自由创造个性化的AI头像视频。

  • Portrait Studio:AI生成专业商务头像

    Portrait Studio Pro是一款AI生成的专业商务头像服务。用户只需上传几张照片,我们的AI引擎将生成完美的商务照片,适用于LinkedIn等场景,无需进行实际拍摄。价格实惠,仅需191美元起,支持14天退款保证。

  • InterviewQueue:在线评估软件平台

    InterviewQueue是一个在线评估工具,帮助您轻松筛选候选人。通过ChatGPT集成,这个在线评估软件平台将帮助您创建逻辑评估,为您的组织找到理想的候选人!

  • Skyla:您的 Shopify 商店的 ChatGPT 客服聊天机器人

    Skyla 是专为 Shopify 商户打造的最佳客户支持聊天机器人。通过 ChatGPT 提供先进的 AI 动力,为您的商店提供最佳的客户支持体验。

今日大家都在搜的词: