首页 > 传媒 > 关键词  > 正文

腾讯刘杉对话清华陶晓明,探索语义通信与视频编解码跨领域合作新方案

2023-10-11 11:28 · 稿源: 站长之家用户

近日,在腾讯全球数字生态大会“Techo前沿技术论坛”上,腾讯杰出科学家、腾讯云副总裁、腾讯多媒体实验室总经理、腾讯视频智能创作与内容平台部副总经理刘杉博士,与清华大学电子工程系教授、 2021 年"科学探索奖"信息电子领域获奖者陶晓明教授聚首,深入探讨了语义通信和视频编解码领域的交叉合作。

刘杉博士一直致力于多媒体及相关领域的技术研究,包括信号与信息处理、音视频与空间媒体数据压缩、传输交互和智能化应用等。她所带领的腾讯多媒体实验室,主要工作涉及两大方面:前沿技术的探索和标准制定,和面向产品的技术研发和应用落地。而陶晓明教授专注于广域特定场景下的语义通信,通过将人脑视觉感知、认知机理融入网络传输通信过程,解决大容量多媒体业务对无线网络带宽需求的压力。

两位专家结合各自领域的专业知识,围绕脑启发的视频质量评价、语义赋能视频编解码以及语义通信与视频编解码跨领域合作这三大方面展开了深入的讨论。

多媒体质量评价新思路,可引入人脑感知、认知、先验知识等特征

刘杉博士提及腾讯多媒体实验室面向产品的技术研发和应用落地,从技术细分领域来看主要分为三大方向:媒体的压缩传输,智慧融合媒体,以及互动沉浸式媒体。这些方向与当前热门的概念如AIGC、XR和元宇宙密切相关。她强调多媒体是一个系统,包括信号处理、压缩、传输、互动、渲染和建模等多个环节,需要联合优化以实现最 佳性能和用户体验。性能和用户体验需要有效的质量评价体系量化评价,在传统质量评价体系之上发掘借鉴大脑的特征,来完成多媒体的质量评价,是非常有意义的创新和探索。

陶晓明教授认为,大脑有三个特征能够与多媒体通信相关。第 一是在感知,人脑对于QoE能够有主观和定性的判断,能够直接感知到好还是不好;第二是在认知,人脑全局搜索和推理的能力,如果能引入通信的编解码里面,一方面可以降低视频编码的复杂度,还能在传输过程中更好地保护上下文重要的语义信息;第三是在先验知识方面,大脑能够自动匹配之前接触过的认知,如果应用到通信中,能够降低一些特殊场景下对带宽的需求。

深度学习、机器视觉等方法,能够解决更多通用和特殊场景下的编解码需求

视频编解码,在如今5G甚至6G蓬勃发展的现在尤为重要,特别是在多媒体数据压缩中。音频、视频、图像以及新兴的VR、高维度数据等,其数据量通常很大,需要大量存储空间和传输带宽。为了解决这个问题,视频编解码技术应运而生,经过几代标准的发展,如H.264/AVC、H.265/HEVC、H.266/VVC等。深度学习在音频信号压缩方面已经取得了一些进展,但在视频信号压缩方面仍然具有挑战性。

刘杉博士指出,在机器视觉、信息(如语音和图像)处理等方面,深度学习和人工智能已经在不少实际应用中发挥作用,进而推动在视频编解码中的使用探索。目前在视频编解码标准制定中,腾讯多媒体实验室也发现了许多技术提案和趋势,以适应不同应用和环境的需求。

陶晓明教授也表示,在乡村、留守老人和儿童等特殊情境,可以通过引入脑科学的思想,使用脑电图分析来提取人的主观感知,以改善用户体验。此外,陶晓明教授还介绍了一种基于时空素描图的编解码方法,通过提取视频的轮廓、语义和关系等特征,以减小数据量。因此在接收端,需要使用生成式机器学习和强化学习方法,能够实现在特殊长江下降低数据传输量,以满足用户的需求,生成优质用户体验的视频。

语义通信与视频编解码,或能达成跨领域合作

刘杉博士认为,质量评价是无所不在的,包括目前腾讯多媒体工作室正在研究的3D空间视频压缩传输。她认为这些领域尚未成熟,有很大的探索空间,从人脑反馈出发的研究方法十分具有潜力,未来也许会对多媒体编解码标准的改进起到推动作用。陶晓明补充说,在AR、VR和游戏等领域,脑电信号可以提供有关用户体验的宝贵信息,如交互性、感觉和延时等,这对语义通信的研究也是一个新的维度,期待未来能够与腾讯多媒体实验室一道,了解更多用户需求。

腾讯多媒体实验室自 2018 年初开始代表腾讯公司参与国际标准制定,迄今为止已有超过 800 项技术提案被多项国际标准采纳并积累超过 1500 项已授权专利,数十人次在国际标准制定过程中担任重要职务,技术贡献赢得国际标准组织和业界广泛认可。实验室荣获ISO/IEC 杰出贡献奖、AVS产业技术创新单位奖、技术与工程艾美奖(Technical Emmy Award)、技术卢米埃奖(Technology Lumiere Award)、数博会领先科技成果奖、世界人工智能大会“镇馆之宝”。同时研发多媒体核心技术应用于腾讯旗下多款产品,为亿级用户提供优质服务。从 2018 年开始投入包括VR在内的沉浸式媒体XR技术研发和系统建设以及AIGC能力智能内容生产,在 2019 年首 次将VR应用于腾讯产品,之后又陆续为新华社、故宫、敦煌等合作项目以及腾讯WE大会、腾讯全球数字生态大会、东北虎国家公园提供技术支持,以多媒体实验室技术为核心的“VR全景”、“自由视角”、“点云建模”、“点云压缩”等通用解决方案已上架腾讯云官网。 2019 年,腾讯杰出科学家刘杉博士,向其所领导的多媒体实验室团队提出展开面向“智能化内容生产”技术研发的要求,并在此后的时间里带领团队打造多项核心技术并逐步完善能力矩阵,应用于多个内容生产和创作的业务场景。 2023 年团队产品XMusic荣获 2023 年世界人工智能大会“镇馆之宝”。未来多媒体实验室将持续投入相关技术建设,持续为教育、工业、医疗、文旅、地产家居、金融等to B产业场景的建设做底层技术投入。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 海尔智慧楼宇与中建三局深化战略合作

    在2025世界智能产业博览会上,海尔展示智慧楼宇"软硬一体化"方案,实现设备节能50%与AI算法节能20%的双重突破。通过磁悬浮中央空调、AI多联机等核心技术,结合人流、天气等数据优化运行,已在郑州地铁、成都轨交等项目中验证节能效果。该方案推动建筑从"钢铁混凝土"向可呼吸、能思考的"生命体"进化,重新定义人与建筑关系,开启绿色智慧建筑新篇章。

  • 黑科技破圈!3i携F1 Pro成「无忧之夜」唯一家电合作伙伴

    2025年10月30日,无忧传媒在海南三亚举办“无忧之夜”年度行业盛典,湖南卫视同步推出特别节目,实现线上线下联动。科技家电品牌3i作为唯一官方合作伙伴亮相,展示旗舰产品净地站F1Pro,其蒸汽热活水洗与净水循环系统突破传统扫地机形态,实现免换水、免上下水的自循环体验,引发行业关注。盛典汇聚张韶涵、吴克群等明星及行业领袖,共话消费趋势。3i与无忧传媒达成“内容共创×技术体验”合作,未来将探索智能家电与传媒内容的深度融合,共同推动中国智造在全球的传播影响力。

  • 中航未来丨马来西亚管理与科学大学代表团到访 中马教育与产业深度合作

    近日,马来西亚管理与科学大学校长丹斯里·莫赫德·舒克里博士率团访问中航未来集团总部,双方就中马两国在高等教育与职业教育领域的合作展开深入交流。代表团考察了中航未来航空实训基地及滁州中航中职学校,对集团在航空职业教育、实训体系及国际化项目建设方面的成果给予高度认可。双方围绕国际合作办学、专业共建及产业资源共享等议题进行洽谈,旨在推动中马教育合作深化发展。

  • 600亿小游戏市场或迎“大玩家” 盛趣游戏与芒果TV达成战略合作

    中国小游戏市场四年暴增14倍,2024年规模有望突破600亿元。世纪华通旗下盛趣游戏与芒果TV达成独家合作,共同拓展“芒好玩”小游戏平台。芒果TV依托85%女性用户占比与自制内容优势,盛趣游戏则凭借《热血传奇》等国民IP及AI技术布局,双方将在内容开发、用户运营、产品引进等领域深度协同,通过“影游联动”模式破解行业同质化难题,构建健康向上的小游戏生态,引领行业进入“生态竞合”新阶段。

  • 31岁男子因腿型修长走红 有丝袜厂家求合作 本人:没有开拉长特效

    近日,武汉一位31岁的男子凭借修长笔直的腿型,引得一众打底裤、光腿神器、鲨鱼裤等众多厂家纷纷主动寻求合作走红。 该男子透露,自己身高177厘米,体重仅120斤,而且从未针对腿部进行过专门的训练。 他觉得自己的好腿型或许得益于遗传,自己妈妈的腿型就很不错。 面对网友质疑其照片开了拉长特

  • 最期待的破次元壁式合作:《逆水寒》手游联动《尼尔》系列

    《逆水寒》手游官方宣布,正式与《尼尔》系列展开联动,包括NieR Automata尼尔机械纪元(又名自动人形)、NieR Replicant尼尔人工生命。 《逆水寒》曾面向全体玩家举办IP联动投票,邀请玩家们选出最想联动的IP,最终尼尔系列入围TOP10。 《尼尔》系列以其深刻的哲学思考、卓越的音乐、动人的叙事而闻名,全球销量已突破900万份,成为最受期待的联动IP之一不足为奇,被玩家称为

  • 贸易通与法大大签署战略合作协议,推动香港跨境合规电子签署解决方案

    10月20日,香港贸易通与法大大达成战略合作,共同推动电子签名服务在香港落地。贸易通将成为法大大旗下Nota Sign全球签署平台的香港独家经销商,聚焦本地客户需求。双方将基于贸易通T+数字平台开展系统集成,优化跨境文档签署流程,提升企业合规管理能力。此次合作整合了法大大的全球产品优势与贸易通的可信数字身份认证能力,旨在为香港及区域企业提供安全、合规、高效的跨境数字签约解决方案。

  • 声网与Oopz达成战略合作 共同打造游戏语音场景AI降噪极致体验

    游戏语音头部平台Oopz与声网达成战略合作,聚焦游戏开黑场景中的噪音问题。双方将结合AI降噪技术,针对复杂多变噪音环境,解决降噪不彻底、过度降噪等痛点,提升玩家沉浸式开黑体验。未来合作将覆盖连麦降噪、环境音消除等方向,优化主播端功能,共同打造更稳定流畅的语音解决方案。

  • 一加哈苏合作结束:一加15首次搭载OPPO LUMO凝光影像

    一加中国区总裁李杰宣布,一加和哈苏的合作结束,一加15首次搭载OPPO LUMO凝光影像。 李杰指出,一加15是一加有史以来拍照效果最好的产品,它将首次搭载OPPO LUMO凝光影像,这是一加影像的一次战略升级和重要选择。LUMO凝光影像是OPPO集团最高规格的影像技术,也是迄今为止一加最强的影像表现底层实力。 大家关心的一加与哈苏的合

  • 海尔智家与三花智控签订战略合作协议

    11月3日,海尔智家与三花智控签署战略合作协议。双方将在协同研发、实验室共建、新兴领域布局等方面深化合作。三花智控聚焦绿色低碳与智能化领域,是制冷家电、新能源汽车热管理行业领军企业;海尔智家致力于提供智慧家电到智慧生活的一站式解决方案。双方已有近40年合作历史,此次合作标志着关系升级,未来将聚焦三大方向:协同研发打造更具竞争力产品,共建实验室攻克行业共性难题,布局家庭机器人等新兴领域,推动“无人家务”转型,并为全球用户创造更智慧、绿色、美好的生活体验。

今日大家都在搜的词: