首页 > 传媒 > 关键词  > 正文

腾讯刘杉对话清华陶晓明,探索语义通信与视频编解码跨领域合作新方案

2023-10-11 11:28 · 稿源: 站长之家用户

近日,在腾讯全球数字生态大会“Techo前沿技术论坛”上,腾讯杰出科学家、腾讯云副总裁、腾讯多媒体实验室总经理、腾讯视频智能创作与内容平台部副总经理刘杉博士,与清华大学电子工程系教授、 2021 年"科学探索奖"信息电子领域获奖者陶晓明教授聚首,深入探讨了语义通信和视频编解码领域的交叉合作。

刘杉博士一直致力于多媒体及相关领域的技术研究,包括信号与信息处理、音视频与空间媒体数据压缩、传输交互和智能化应用等。她所带领的腾讯多媒体实验室,主要工作涉及两大方面:前沿技术的探索和标准制定,和面向产品的技术研发和应用落地。而陶晓明教授专注于广域特定场景下的语义通信,通过将人脑视觉感知、认知机理融入网络传输通信过程,解决大容量多媒体业务对无线网络带宽需求的压力。

两位专家结合各自领域的专业知识,围绕脑启发的视频质量评价、语义赋能视频编解码以及语义通信与视频编解码跨领域合作这三大方面展开了深入的讨论。

多媒体质量评价新思路,可引入人脑感知、认知、先验知识等特征

刘杉博士提及腾讯多媒体实验室面向产品的技术研发和应用落地,从技术细分领域来看主要分为三大方向:媒体的压缩传输,智慧融合媒体,以及互动沉浸式媒体。这些方向与当前热门的概念如AIGC、XR和元宇宙密切相关。她强调多媒体是一个系统,包括信号处理、压缩、传输、互动、渲染和建模等多个环节,需要联合优化以实现最 佳性能和用户体验。性能和用户体验需要有效的质量评价体系量化评价,在传统质量评价体系之上发掘借鉴大脑的特征,来完成多媒体的质量评价,是非常有意义的创新和探索。

陶晓明教授认为,大脑有三个特征能够与多媒体通信相关。第 一是在感知,人脑对于QoE能够有主观和定性的判断,能够直接感知到好还是不好;第二是在认知,人脑全局搜索和推理的能力,如果能引入通信的编解码里面,一方面可以降低视频编码的复杂度,还能在传输过程中更好地保护上下文重要的语义信息;第三是在先验知识方面,大脑能够自动匹配之前接触过的认知,如果应用到通信中,能够降低一些特殊场景下对带宽的需求。

深度学习、机器视觉等方法,能够解决更多通用和特殊场景下的编解码需求

视频编解码,在如今5G甚至6G蓬勃发展的现在尤为重要,特别是在多媒体数据压缩中。音频、视频、图像以及新兴的VR、高维度数据等,其数据量通常很大,需要大量存储空间和传输带宽。为了解决这个问题,视频编解码技术应运而生,经过几代标准的发展,如H.264/AVC、H.265/HEVC、H.266/VVC等。深度学习在音频信号压缩方面已经取得了一些进展,但在视频信号压缩方面仍然具有挑战性。

刘杉博士指出,在机器视觉、信息(如语音和图像)处理等方面,深度学习和人工智能已经在不少实际应用中发挥作用,进而推动在视频编解码中的使用探索。目前在视频编解码标准制定中,腾讯多媒体实验室也发现了许多技术提案和趋势,以适应不同应用和环境的需求。

陶晓明教授也表示,在乡村、留守老人和儿童等特殊情境,可以通过引入脑科学的思想,使用脑电图分析来提取人的主观感知,以改善用户体验。此外,陶晓明教授还介绍了一种基于时空素描图的编解码方法,通过提取视频的轮廓、语义和关系等特征,以减小数据量。因此在接收端,需要使用生成式机器学习和强化学习方法,能够实现在特殊长江下降低数据传输量,以满足用户的需求,生成优质用户体验的视频。

语义通信与视频编解码,或能达成跨领域合作

刘杉博士认为,质量评价是无所不在的,包括目前腾讯多媒体工作室正在研究的3D空间视频压缩传输。她认为这些领域尚未成熟,有很大的探索空间,从人脑反馈出发的研究方法十分具有潜力,未来也许会对多媒体编解码标准的改进起到推动作用。陶晓明补充说,在AR、VR和游戏等领域,脑电信号可以提供有关用户体验的宝贵信息,如交互性、感觉和延时等,这对语义通信的研究也是一个新的维度,期待未来能够与腾讯多媒体实验室一道,了解更多用户需求。

腾讯多媒体实验室自 2018 年初开始代表腾讯公司参与国际标准制定,迄今为止已有超过 800 项技术提案被多项国际标准采纳并积累超过 1500 项已授权专利,数十人次在国际标准制定过程中担任重要职务,技术贡献赢得国际标准组织和业界广泛认可。实验室荣获ISO/IEC 杰出贡献奖、AVS产业技术创新单位奖、技术与工程艾美奖(Technical Emmy Award)、技术卢米埃奖(Technology Lumiere Award)、数博会领先科技成果奖、世界人工智能大会“镇馆之宝”。同时研发多媒体核心技术应用于腾讯旗下多款产品,为亿级用户提供优质服务。从 2018 年开始投入包括VR在内的沉浸式媒体XR技术研发和系统建设以及AIGC能力智能内容生产,在 2019 年首 次将VR应用于腾讯产品,之后又陆续为新华社、故宫、敦煌等合作项目以及腾讯WE大会、腾讯全球数字生态大会、东北虎国家公园提供技术支持,以多媒体实验室技术为核心的“VR全景”、“自由视角”、“点云建模”、“点云压缩”等通用解决方案已上架腾讯云官网。 2019 年,腾讯杰出科学家刘杉博士,向其所领导的多媒体实验室团队提出展开面向“智能化内容生产”技术研发的要求,并在此后的时间里带领团队打造多项核心技术并逐步完善能力矩阵,应用于多个内容生产和创作的业务场景。 2023 年团队产品XMusic荣获 2023 年世界人工智能大会“镇馆之宝”。未来多媒体实验室将持续投入相关技术建设,持续为教育、工业、医疗、文旅、地产家居、金融等to B产业场景的建设做底层技术投入。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 创造丰盛发布速建技术:2小时搭住房,馨月老师见证灾后新方案

    甘肃积石山地震灾区采用创新模块化住房技术,2小时即可完成组装,为灾民提供临时住所。这种"折叠式钢结构+气凝胶隔热层"的房屋具备保温、抗震、隔音功能,同时通过居民参与壁画创作提升心理重建效率40%。团队还开发"气候适应性社区工具包",已在东南亚6国23个灾区推广。此外,研发的"管网泄漏预警算法"使杭州爆管事故率下降67%,修复时效缩短至45分钟。馨月老师团队通过三维语音技术收录132位亲历者口述历史,被哈佛纳入全球灾害叙事研究。这些创新不仅解决物理重建,更注重保留社区文化基因,为全球灾后重建提供新思路。

  • 锚定运动人群 iRest艾力斯特按摩椅打造运动康复新方案

    iRest艾力斯特按摩椅作为中国按摩器具行业领先品牌,积极拓展运动康复领域。其创新亮点包括:1. 接入Deepseek AI智能助手,实现个性化按摩方案推荐;2. 与美国运动科学院院士朱为模合作开发专业运动康复程序;3. 与温州医科大学开展多项临床研究,验证按摩椅在消除乳酸、缓解肌肉疲劳等方面的显著效果;4. 与华为运动健康APP数据互通,实现"运动-监测-康复"全链路智能化;5. 引入脑机接口技术,通过生物信号感知实现动态按摩调节。这些创新使产品突破传统按摩局限,为运动康复带来智能化新体验。

  • 腾讯2026青云计划正式启动,首次开放课题资源库,探索校企合作新模式

    腾讯启动2026"青云计划",面向全球招募顶尖技术人才。该计划为2024-2026年毕业的博士生和2025-2026年毕业的本硕生提供行业顶级师资、充足算力资源和极具竞争力的薪酬。相比往年,新一期计划打造校企合作新模式,首次开放青云课题资源库,并推荐优秀人才直通招聘绿色通道。计划覆盖AI大模型、基础架构、高性能计算等十大技术领域,设置100余项技术课题。腾讯将持续投入基础科研和青年人才培养,2024年研发投入达706.86亿元,2018年以来累计投入3403亿元。多位青年人才已在导师带领下快速成长,部分研究成果已应用于微信等核心业务。腾讯还携手清华大学设立博士生联合培养实践基地,共同探索前沿科技边界。

  • 寒武纪:携手合作伙伴 共同繁荣合作生态

    东方证券研报显示,寒武纪2024年业绩表现亮眼:全年营收11.74亿元,同比增长65.56%,其中云端产品线收入占比高达99.30%,同比暴增1187.78%。公司实现连续两个季度盈利,2025年一季度营收同比激增4230.22%至11.11亿元。作为专注AI芯片研发的企业,寒武纪通过产业生态建设和技术开源,持续推动半导体领域创新,产品覆盖物联网、金融、医疗等多个场景。2024年公司深化合作伙伴生态共建,完成多项产品兼容适配认证,并通过开发者社区运营和技术开源支持AI生态发展。

  • 腾讯与高通骁龙X系列合作:打造面向PC端的游戏安全解决方案

    腾讯游戏安全中心5月16日宣布,在2025游戏安全行业峰会上,腾讯与高通达成战略合作。双方将在骁龙X系列上深化合作,打造面向PC端的高性能游戏安全解决方案。腾讯游戏安全ACE是其自主研发的拥有20年反作弊经验的产品,覆盖游戏加固、反外挂、内容审核等全生命周期安全能力。此次合作将把腾讯20年游戏安全技术部署于高通专为AI+PC设计的骁龙X系列,为《无畏契约》等重点PC游戏提供支持。峰会由广东省游戏产业协会指导,腾讯游戏安全ACE、腾讯云等主办。

  • 破局同质化,重构价值链!TCL光伏科技携创新方案即将亮相SNEC 2025

    2024年全球光伏新增装机容量达530GW,同比增长35.9%,但行业面临同质化竞争加剧、收益率承压等挑战。TCL光伏科技将在SNEC2025展会上展示AI全链条渗透成果,并全球首发"电碳业务",重构光伏行业生态。针对分布式光伏发展痛点,TCL推出"特能发"解决方案矩阵,构建"零风险、高效益、稳收益"模式。同时,TCL创新打造家庭能源全生态方案,并开创"整村推�

  • 广东省出版集团与腾讯达成战略合作,已联合研发十余个图书智能体

    5月25日,广东省出版集团与腾讯签署战略合作协议,双方将在文化数字化、教育数字化领域展开合作,共同打造"人工智能+"时代新质生产力。合作内容包括智能内容推荐、交互式阅读等创新成果,已联合研发"岭南城市通"等十余个图书智能产品。广东省出版集团成立于1999年,业务涵盖图书出版、数字教育等领域。腾讯云将提供AI、大数据等技术支持,助力出版业数字化转型。此次合作将推动文化出版产业高质量发展,打造全国领先的文化科技融合示范区。

  • 云盯与腾讯云达成战略合作 共探智慧零售新未来

    腾讯云凭借巨大的社交流量体系、成熟的私域运营能力、丰富的零售行业经验及强大的产品技术能力,成为零售企业数字化转型的重要合作伙伴。

  • 解码张家港鲲之益:AI 数字直播基地如何领跑长三角数实融合赛道?

    张家港市乐余镇与上海鳐之益科技合作打造长三角首个AI数字直播基地,以"AI新质生产力赋能实体经济"为核心,构建集技术研发、场景应用、产业孵化于一体的全栈式生态。该基地仅用6个月建成2000㎡运营空间,具备数字人克隆、智能对话系统等12项专利技术,覆盖政务、农业、工业等多领域定制化AI工具。通过50+智能直播间和产业大数据平台,助力企业降本增效,并联�

  • 万亿赛道的领跑者:解码恩捷股份李晓明的成功密钥

    恩捷股份从传统包装材料成功转型为全球锂电池隔膜行业龙头。创始人李晓明敏锐把握新能源机遇,2010年创立上海恩捷,通过持续技术创新打破国外垄断:开发3微米超薄基膜、快充隔膜等核心技术,2024年研发投入超6亿元,专利近600项。公司2024年湿法隔膜出货量超70亿平方米,国内市占率第一,并布局美国、匈牙利工厂,服务松下、LG等国际客户。未来将继续深耕技术创新,巩固全球领先地位,助力中国新能源产业链升级。