首页 > 传媒 > 关键词  > 正文

腾讯刘杉对话清华陶晓明,探索语义通信与视频编解码跨领域合作新方案

2023-10-11 11:28 · 稿源: 站长之家用户

近日,在腾讯全球数字生态大会“Techo前沿技术论坛”上,腾讯杰出科学家、腾讯云副总裁、腾讯多媒体实验室总经理、腾讯视频智能创作与内容平台部副总经理刘杉博士,与清华大学电子工程系教授、 2021 年"科学探索奖"信息电子领域获奖者陶晓明教授聚首,深入探讨了语义通信和视频编解码领域的交叉合作。

刘杉博士一直致力于多媒体及相关领域的技术研究,包括信号与信息处理、音视频与空间媒体数据压缩、传输交互和智能化应用等。她所带领的腾讯多媒体实验室,主要工作涉及两大方面:前沿技术的探索和标准制定,和面向产品的技术研发和应用落地。而陶晓明教授专注于广域特定场景下的语义通信,通过将人脑视觉感知、认知机理融入网络传输通信过程,解决大容量多媒体业务对无线网络带宽需求的压力。

两位专家结合各自领域的专业知识,围绕脑启发的视频质量评价、语义赋能视频编解码以及语义通信与视频编解码跨领域合作这三大方面展开了深入的讨论。

多媒体质量评价新思路,可引入人脑感知、认知、先验知识等特征

刘杉博士提及腾讯多媒体实验室面向产品的技术研发和应用落地,从技术细分领域来看主要分为三大方向:媒体的压缩传输,智慧融合媒体,以及互动沉浸式媒体。这些方向与当前热门的概念如AIGC、XR和元宇宙密切相关。她强调多媒体是一个系统,包括信号处理、压缩、传输、互动、渲染和建模等多个环节,需要联合优化以实现最 佳性能和用户体验。性能和用户体验需要有效的质量评价体系量化评价,在传统质量评价体系之上发掘借鉴大脑的特征,来完成多媒体的质量评价,是非常有意义的创新和探索。

陶晓明教授认为,大脑有三个特征能够与多媒体通信相关。第 一是在感知,人脑对于QoE能够有主观和定性的判断,能够直接感知到好还是不好;第二是在认知,人脑全局搜索和推理的能力,如果能引入通信的编解码里面,一方面可以降低视频编码的复杂度,还能在传输过程中更好地保护上下文重要的语义信息;第三是在先验知识方面,大脑能够自动匹配之前接触过的认知,如果应用到通信中,能够降低一些特殊场景下对带宽的需求。

深度学习、机器视觉等方法,能够解决更多通用和特殊场景下的编解码需求

视频编解码,在如今5G甚至6G蓬勃发展的现在尤为重要,特别是在多媒体数据压缩中。音频、视频、图像以及新兴的VR、高维度数据等,其数据量通常很大,需要大量存储空间和传输带宽。为了解决这个问题,视频编解码技术应运而生,经过几代标准的发展,如H.264/AVC、H.265/HEVC、H.266/VVC等。深度学习在音频信号压缩方面已经取得了一些进展,但在视频信号压缩方面仍然具有挑战性。

刘杉博士指出,在机器视觉、信息(如语音和图像)处理等方面,深度学习和人工智能已经在不少实际应用中发挥作用,进而推动在视频编解码中的使用探索。目前在视频编解码标准制定中,腾讯多媒体实验室也发现了许多技术提案和趋势,以适应不同应用和环境的需求。

陶晓明教授也表示,在乡村、留守老人和儿童等特殊情境,可以通过引入脑科学的思想,使用脑电图分析来提取人的主观感知,以改善用户体验。此外,陶晓明教授还介绍了一种基于时空素描图的编解码方法,通过提取视频的轮廓、语义和关系等特征,以减小数据量。因此在接收端,需要使用生成式机器学习和强化学习方法,能够实现在特殊长江下降低数据传输量,以满足用户的需求,生成优质用户体验的视频。

语义通信与视频编解码,或能达成跨领域合作

刘杉博士认为,质量评价是无所不在的,包括目前腾讯多媒体工作室正在研究的3D空间视频压缩传输。她认为这些领域尚未成熟,有很大的探索空间,从人脑反馈出发的研究方法十分具有潜力,未来也许会对多媒体编解码标准的改进起到推动作用。陶晓明补充说,在AR、VR和游戏等领域,脑电信号可以提供有关用户体验的宝贵信息,如交互性、感觉和延时等,这对语义通信的研究也是一个新的维度,期待未来能够与腾讯多媒体实验室一道,了解更多用户需求。

腾讯多媒体实验室自 2018 年初开始代表腾讯公司参与国际标准制定,迄今为止已有超过 800 项技术提案被多项国际标准采纳并积累超过 1500 项已授权专利,数十人次在国际标准制定过程中担任重要职务,技术贡献赢得国际标准组织和业界广泛认可。实验室荣获ISO/IEC 杰出贡献奖、AVS产业技术创新单位奖、技术与工程艾美奖(Technical Emmy Award)、技术卢米埃奖(Technology Lumiere Award)、数博会领先科技成果奖、世界人工智能大会“镇馆之宝”。同时研发多媒体核心技术应用于腾讯旗下多款产品,为亿级用户提供优质服务。从 2018 年开始投入包括VR在内的沉浸式媒体XR技术研发和系统建设以及AIGC能力智能内容生产,在 2019 年首 次将VR应用于腾讯产品,之后又陆续为新华社、故宫、敦煌等合作项目以及腾讯WE大会、腾讯全球数字生态大会、东北虎国家公园提供技术支持,以多媒体实验室技术为核心的“VR全景”、“自由视角”、“点云建模”、“点云压缩”等通用解决方案已上架腾讯云官网。 2019 年,腾讯杰出科学家刘杉博士,向其所领导的多媒体实验室团队提出展开面向“智能化内容生产”技术研发的要求,并在此后的时间里带领团队打造多项核心技术并逐步完善能力矩阵,应用于多个内容生产和创作的业务场景。 2023 年团队产品XMusic荣获 2023 年世界人工智能大会“镇馆之宝”。未来多媒体实验室将持续投入相关技术建设,持续为教育、工业、医疗、文旅、地产家居、金融等to B产业场景的建设做底层技术投入。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 碳中和怎么改变生活?海尔智家以全新方案解题

    海尔智家通过绿色创新将碳中和融入生活,让节能从理念变为行动。其产品如省时超50%的洗衣机和日耗电不足一度的冰箱,畅销全球。通过AI智能和绿色制造,海尔智家推动从单品节能到全场景节能,实现高效低碳生活。企业倡议产业协同,用户选择节能产品即参与碳中和。碳中和就在日常选择中,关乎每个人的生活品质与健康。

  • 聚力成林丨观测云荣膺华为云年度生态合作共赢奖

    12月18日至19日,华为云零售峰会2025在成都举行,汇聚了美宜佳、泸州老窖等零售领军企业与技术专家,共同探讨智能时代零售业务增长路径与数字化转型实践。美宜佳作为标杆案例,通过接入观测云全链路监控平台,打通了从基础设施到POS终端的端到端实时监控,显著提升了故障排查效率与系统稳定性。观测云凭借在云原生可观测性领域的技术创新与零售场景的深度实践,荣获华为云“聚力成林”年度生态合作共赢奖,充分验证了其与华为云协同赋能客户的价值。未来,观测云将继续深化与华为云的战略合作,围绕重点行业推进更多标杆项目落地,助力企业实现可观测能力与业务场景的深度融合。

  • CES前瞻︱INDEMIND助力多个合作伙伴携全新机器人产品全球首发

    CES 2026将于2026年1月6日开幕,聚焦具身智能领域,见证终端产品规模化落地的关键一步。届时,以INDEMIND的机器人物理AI大脑“ROBOMIND”为核心,多个合作伙伴将携全新具身智能产品全球首发。这些产品聚焦“主动智能、深层交互”,覆盖家庭智能终端、老人看护、儿童陪伴、宠物互动等场景,探索机器人深度融入家庭的全新可能。ROBOMIND采用“低算力端侧感知+全参数云端推理”协同架构,实现性能与效率的平衡,具备理解空间、融入空间、空间交互、执行空间任务的全链路能力,旨在推动家用机器人产业摆脱碎片化发展,迈向高效开放的生态化阶段。

  • 母子一体化养殖新思路,君乐宝校企合作解锁牧场新效能

    君乐宝旗下乐源牧业与西北农林科技大学联合召开专题科研研讨会,聚焦奶牛营养高效利用等关键技术及行业前沿研究。双方通过交流在相关课题上取得积极进展,不仅为牧场实践带来技术启发,也反映出君乐宝在提升牧场科技水平、促进奶业产业链源头创新方面的稳步推进。西北农林科技大学教授姚军虎、张俊分别作专题报告,系统阐述了提高饲料利用率、精准营养调控等核心技术,为牧场管理提供了理论支撑和实用指南。此次合作是君乐宝强化全产业链科技支撑的体现,也是产学研深度融合助推中国奶业转型升级的典范。双方成果在奶牛精准营养、健康养殖、降本增效等方面提供了宝贵的技术路径和行业洞见,具有极强的示范和推广价值。

  • AI日报:火山引擎成春晚独家AI合作伙伴;元宝 AI上线任务提醒;开源神器ClipSketchAI视频一键变手绘分镜

    本期AI日报聚焦多项AI领域新动态:火山引擎成为2026年春晚独家AI云伙伴,将提升互动体验;元宝AI上线任务提醒功能,支持一句话设定循环定时任务;B站开源神器ClipSketch AI可将视频一键转为手绘分镜;阶跃星辰推出高性价比深度研究模型Step-DeepResearch;广州海珠区成立全国首个区级人工智能发展局,每年投入3.1亿支持产业发展;AI编程工具Windsurf Wave13发布,集成SWE-1.5模型;Meta AI推出Pixio图像模型,凭借像素重建刷新3D重建纪录;开源框架VideoPipe简化视频AI应用开发,降低CV门槛。

  • 海尔智家为合作伙伴颁发“可持续发展生态伙伴卓越奖”

    12月23日,海尔智家在青岛举办“智绘零碳未来+共赴绿色新程”碳中和战略发布会,并颁发“可持续发展生态伙伴卓越奖”,表彰在绿色供应链、低碳创新、循环经济等领域与海尔智家同心同行的伙伴。获奖伙伴来自认证咨询、食品消费、钢铁制造、商贸流通、新材料及绿色包装等多个领域。未来,海尔智家将进一步凝聚伙伴力量,推动形成更紧密的绿色发展共同体,共赴零碳新程。

  • 抖音与杜比实验室达成合作:iPhone用户可刷、可剪、可发杜比视界视频

    抖音与杜比实验室今日宣布达成合作,将面向抖音用户开放杜比视界体。 iPhone用户现可通过抖音App分享和观看杜比视界视频。 用户还可使用抖音内置编辑工具或剪映等软件,来创作杜比视界内容。 杜比视界可通过动态元数据对每一帧画面的色彩、亮度与对比度进行精准优化。 抖音相关负责人表示,目前抖音已逐步实现对杜比视界的支持。

  • vivo成为博鳌亚洲论坛2026年战略合作伙伴

    2025年12月25日,vivo与博鳌亚洲论坛在vivo总部举行签约仪式,正式成为论坛2026年战略合作伙伴。双方代表出席,标志着合作迈入第五年。vivo将聚焦科技创新,分享高端化、智能化成果,洞察人工智能趋势,为论坛提供技术支持。新合作中,vivo还将参与论坛25周年特别策划,提供移动直播与拍摄方案,融合科技与人文视角。vivo多款产品获评“博鳌亚洲论坛官方指定手机”。未来,vivo将继续依托论坛这一国际窗口,与全球伙伴共同探索科技赋能美好未来。

  • 地域特色快餐的规模化探索:解析嘎嘎香老饭盒品牌2025年发展密码

    2025年中国快餐行业迎来规模与竞争的双重升级。行业规模预计达1.08万亿元,连锁化率有望升至29%。市场竞争激烈,已从单一产品比拼延伸至全链条较量。以“嘎嘎香东北老饭盒”为代表的地域特色快餐,凭借独特口味和标准化运营实现逆势增长,门店突破600家,线上年销量超千万份,并获得权威机构五项认证,成为行业规模化突围的典型案例。其发展路径为地域特色快餐的规范化、规模化提供了有益借鉴。

  • 预约人次突破100万!腾讯视频自制动漫《仙剑奇侠传三》今日开播

    腾讯视频自制动漫《仙剑奇侠传三》将于今天10:00在腾讯视频全网首播,每周二10:00更新一集,会员提前看一集。 目前,动画《仙剑奇侠传三》在腾讯视频的预约人次已突破100万,动画改编自软星科技单机游戏《仙剑奇侠传三》。 据了解,单机游戏《仙剑奇侠传三》于2003年8月4日在中国内地正式发行。

今日大家都在搜的词: