首页 > 传媒 > 关键词  > Interdigital最新资讯  > 正文

腾讯多媒体实验室参与机器视频编解码标准研究,迈向视频技术探索新纪元

2023-04-12 10:03 · 稿源: 站长之家用户

后疫情时代,随着技术的不断发展,机器已经转化为人们生活中的第三只“眼”,如工业质检,无人驾驶,智慧城市等应用愈加依赖与视频信息分析与理解,而使得视频能够更利于机器分析的同时能够进一步节省带宽成的压缩技术成为了这一系列行业应用的刚需,面向机器的视频编码VCM(video coding for machine)应运而生。

2019 年运动图像专家组(Moving Picture Experts Group, MPEG)第 127 次会议宣布成立AHG VCM(Ad Hoc Group on Video Coding for Machines)机器视觉编码工作组,工作组研究面向机器视觉或者人机混合视觉的下一代视频编码标准,为机器视觉应用场景提供高压缩率、高任务精度的视频/特征压缩技术。Nokia, Ericsson, Intel, Sumsung, Interdigital, 腾讯, 阿里巴巴, 中国电信, oppo, vivo, 中科院等公司和组织参与该工作组。

腾讯在VCM的工作中担任了重要的角色,担任AHG联合主席,为工作组提供了包含标注的视频数据集(Tencent Video Dataset, TVD) [1][2], 并被工作组采纳成为检测、分割和跟踪任务的通用测试数据集。另外,腾讯牵头制定了通用测试条件(Common test conditions, CTC)和评测框架,为相关技术的验证提供规范化的流程。同时,腾讯也一直积极参与技术路线的推进,成功响应了工作组的多次证据征集(Call for Evidence, CfE)和提案征集(Call for Proposals, CfP),并在后续标准化进程中担任核心实验(Core experiments, CE)召集人等角色来推动技术方案的发展。

过去几年中,工作组进行了大量的基础调研,证明了在机器视觉任务场景下传统视频编码技术存在着较大的提升空间,同时针对目标检测、分割、跟踪等典型机器视觉任务建立了规范的测试数据集和通用测试条件。基于这些前期工作,工作组于 2022 年 4 月正式发布提案征集(Call for Proposal, CfP),获得了来自工业界和学术界的积极参与响应,展示了机器视觉编码的巨大应用潜力。目前,标准化仍在持续进行中。

去年,制定了H.266/VVC标准的工作组JVET(Joint Video Experts Team)也成立了新的 AHG 专题组(AHG15),该工作组将针对H.266/VVC与H.265/HEVC这一系列标准进行进一步优化,帮助其在面向机器场景下可以更大程度的提升机器识别精度和进一步节省带宽。目前比较新一代编码标准H.266/VVC相较上一代编码标准H.265/HEVC,在相同质量下可以节省约50%带宽,而该工作组预期可在H.266/VVC的基础上更近一步节省50%带宽。随着这一技术的逐渐成熟,可以预见未来面向机器的编码器将有更广阔的应用前景。

[1] An Open Dataset for Video Coding for Machines Standardization | IEEE Conference Publication | IEEE Xplore

[2] A Video Dataset for Learning-based Visual Data Compression and Analysis | IEEE Conference Publication | IEEE Xplore

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 超聚变探索者大会2025:算力焕新,开启智能新纪元

    4 月 15 日- 17 日,以“共建智能体时代”为主题的超聚变探索者大会 2025 在郑州成功举行。大会汇聚 2500 余名行业领袖、专家、媒体等伙伴及客户,提出并深入探讨智能体时代的发展趋势、驱动要素与价值应用,重磅发布超聚变算力业务、城企数智业务、智慧能源解决方案三大业务领域的全新产品矩阵,共同聚焦技术创新的广阔应用,与全球生态伙伴积极拥抱战略机遇,携手共

  • 科龙空调静省电Max:打破实验室数据滤镜,定制专属“气候空间”

    科龙空调推出静省电Max系列产品,主打超强省电性能。经中国家电研究院实测,该产品在模拟真实使用环境下,8小时制冷仅耗电2.5度(约1.4元/天),APF能效比达5.5,一年可省电403度。采用行业Top3大排量压缩机、48根双排紫铜冷凝管等优质配置,冷热效率提升11.4%。产品还具备15秒速冷、30秒暖房功能,运行噪音低至15分贝,并配备睡眠管家模式。作为2025世俱杯官方指定空调,科

  • LIFETOO品牌麦角硫因:开启抗衰养颜新纪元

    LIFETOO是一个专注于抗衰老营养健康的品牌,由多位生物学博士创立,依托美日先进营养科学技术研发产品。其明星产品麦角硫因胶囊具有强效抗氧化功效,能改善皮肤状态、增强弹性。品牌拥有专业研发团队和自有生产线,产品通过严格质量控制,在全球多个国家销售并获得消费者认可。LIFETOO坚持"探索营养与健康的未来"理念,致力于为消费者提供高品质、个性化的营养呵护方案。

  • 解码Z世代AI使用场景:Soul发布用户行为研究报告

    Soul App旗下Just So Soul研究院发布的《2025Z世代AI使用报告》显示:Z世代已成为"AI原住民",95%年轻人习惯用AI辅助工作学习,05后高频使用占比达62.5%。AI显著提升效率,近八成年轻人认为工作效率提升超50%。在情感领域,超四成年轻人每天使用AI获得情感陪伴,71.1%愿与虚拟人做朋友,平均每人拥有1.8个AI伙伴。尽管存在隐私安全等"AI焦虑",但年轻人积极应对:59.2%看到AI催生新职业的潜力,19.9%已通过AI创收。报告展现了Z世代与AI的深度共生关系,AI正重塑其工作、情感与经济价值创造方式。

  • 行业先行者,艾娑姟雅(EXOGAIA)开启抗衰护肤新纪元

    艾娆婵雅(EXOGAIA)在美博会上展示前沿细胞科研成果,推出"双外泌体"护肤理念。品牌采用TFF外泌体提取技术,从羊胎盘和莲叶中提取高活性物质,通过膜融合机制促进胶原再生。其产品线涵盖抗衰修护全系列,包括微囊精华液、人参精华油等明星单品。依托广东慈惠生物科技强大的科研团队,品牌专注于肌衰老机理研究,已获得国际INCI认证。艾娆婵雅通过创新技术重新�

  • 英氏携手中国营养学会开启科学喂养新纪元

    4月18日,中国营养学会与英氏控股集团在浏阳经开区共同举办"婴幼儿辅食科学5阶喂养标准体系化建设暨深度科研启动仪式"。活动聚焦婴幼儿辅食行业标准化发展,推出"科学5阶精准喂养体系",针对不同发育阶段婴幼儿营养需求进行精准划分。英氏与江南大学、湖南省农科院签署战略协议,共建"婴童未来食品实验室"和"婴幼儿辅食与营养产业发展研究院",推动产学研深度融合。英氏投资建设的婴幼儿营养与健康科学产业基地一期已在浏阳建成投产,致力于全生命周期营养产品研发。专家指出,科学喂养直接影响婴幼儿成长发育,行业标准实施将规范市场秩序,提升国民婴幼儿营养健康水平。

  • 深数所携手金蝶征信,共建全国首个企业信用数据联合实验室

    深圳数据交易所与金蝶征信宣布共建全国首个"企业信用数据联合实验室",聚焦"AI+数据要素"创新融合,助力信用经济建设。双方将结合深数所全国性数据要素流通平台优势与金蝶10年企业数字信用服务经验,依托其740万企业客户数据,激活数据要素在信贷、供应链等场景的应用潜力。实验室将研发智能信用评估产品,帮助金融机构优化风控,为中小微企业提供精准信贷支持。目前金蝶已服务200余家金融机构,促成1800亿元数字信贷。未来该实验室将持续吸纳数据与技术力量,探索数据要素与信用经济创新应用,助力深圳打造具有国际影响力的"数据新名片"。

  • 打破实验室滤镜!科龙省电静音空调Max:中家院真实场景实测8h花1.4元

    科龙空调联合中国家电研究院对静省电Max新品进行真实环境测试,APF值达5.5、噪音低至15分贝,实现"真省电、真静音、真速冷"三大优势。测试显示其8小时耗电仅2.579度(约1.4元/天),采用双排冷凝器+稀土永磁压缩机技术,换热效率提升30%。15秒速冷、30秒速热,防直吹功能通过三导板精准控风,冷风平行送出避免直吹。京东补贴后售价1999元,提供0元安装和10年整机保修服务。该产品突破行业实验室数据虚高问题,以真实性能重新定义省电静音空调标准,并布局磁悬浮电机等核心技术,推动行业向高效节能升级。

  • 妙音数科领航 VR 创新 ,《一念幻世》开启沉浸式科技新纪元

    北京妙音数科推出国内首个"AI觉醒与人类文明存续"主题VR大空间沉浸项目《一念幻世》。该项目融合AI与VR技术,采用厘米级精准追踪系统,支持玩家在数百平米真实场地自由探索虚拟场景。创新性地结合AI智能实时语音对话与手势识别技术,实现"所见即所感"的沉浸体验。项目以AI觉醒危机为主线,通过交互式解谜引导玩家思考科技伦理问题。首发落地河北邯郸�

  • 大规模专家并行推理集群实现性能3倍跃迁,联通元景开启推理新纪元

    中国联通持续技术攻坚,依托元景大模型MaaS平台成功搭建“大规模专家并行”推理集群,实现DeepSeekMoE大模型在多节点间的超高效集群推理,单卡吞吐提升3倍,解码时延降低50%。这一成果不仅为人工智能技术的创新发展提供了强大助力,也让各行业以更高效率应用AI技术,加速推动千行百业的数字化转型。这一推理创新举措必将助力各行业在复杂多变、竞争激烈的市场环境中抢占先机,以智能化驱动数字化转型,进推动实体经济高质量发展。

热文

  • 3 天
  • 7天