X
广告
首页 > 传媒 > 关键词  > 腾讯云最新资讯  > 正文

腾讯云Techo Hub技术巡回北京站聚焦音视频,用技术打开云上新“视”界

2021-09-16 18:04 · 稿源: 站长之家用户

9月11日,以《音视频技术探索与实践》为主题的腾讯云Techo Hub技术巡回北京站活动大幕开启。疫情之下,远程办公、视频会议、在线教育等模式的应用越来越多,极大地增加了音视频技术的市场需求。本次活动聚焦音视频领域,多位技术专家与众多开发者一起探索了技术如何赋能云上新“视”界。

实时音视频在泛娱乐行业的落地实践

移动互联网经历十年发展,即将步入全真互联网时代,实时音视频作为全真互联网的基础设施,为用户提供高并发、低延时、高清流畅、安全可靠的全场景、全互动、全实时的音视频服务。腾讯实时音视频(Tencent Real-Time Communication,TRTC),是基于腾讯21年来在网络与音视频技术上的深度积累,以多人音视频通话和低延时互动直播两大场景化方案,通过腾讯云服务向开发者开放,致力于帮助开发者快速搭建低成本、低延时、高品质的音视频互动解决方案,在娱乐社交、在线教育、互动游戏、协同通信、在线医疗、在线金融等场景下都有着广泛应用。

腾讯云TRTC架构负责人崔立鹏

腾讯云TRTC产品架构负责人崔立鹏老师在演讲中表示,TRTC拥有三大优势:低延时低卡顿,高音质高画质和全平台覆盖。

TRTC整体架构

泛娱乐场景中,用户对画质音质要求很高,在画质方面,TRTC支持全链路H.265,实现了同等码率下的画质提升。在音质方面,TRTC内置“腾讯天籁”音频引擎,针对多人、多场景实时通信系统中3A问题(降噪、回声抑制、增益控制)提供了低复杂度、高鲁棒性解决方案,致力于让用户 “听得见、听得清、听得真”。

弱网场景下更好保障通话语音质量

随着今年6.1日新著作权法的实施,直播场景下的音乐版权成为行业关注的焦点问题。TRTC携手腾讯云正版曲库直通车,于 5 月研发上线了直播互动曲库。

通过音乐上云,一站式解决了版权音乐在在线直播、语聊业务场景中使用过程中信息安全,精准按量付费的版权方管理需要,和应用方原生化的集成版权曲库服务,敏捷、小成本的创新,实现自身业务更加快速增长的需求。

接下来,崔立鹏老师详细介绍了TRTC泛娱乐行业的典型应用。如:在线KTV、语音聊天室/语音沙龙、语音互动游戏、电台FM、秀场直播、游戏陪玩、多人互动直播、赛事直播等。

音视频内容风控应用实践

近年来,随着国家对互联网内容安全的持续关注,制定了一系列的法律法规,明确要求互联网企业采取技术手段确保网络环境安全健康,内容安全问题已经成为企业的生命线。在音视频领域中,有效地发现和处置含有淫秽色情、血腥恐怖等违法违规内容对企业健康发展至关重要。

腾讯云高级研发工程师蔡飞

腾讯云高级研发工程师蔡飞老师指出,在当前音视频领域的内容安全风控中依然存在着很多挑战,比如内容审核维度越来越多,需要满足更加精细化的运营需求;内容审核标准也不统一,不同业务场景需要运营不同的审核策略;同时新增风险类型需要对海量历史数据再次审核,对审核系统提出更高的要求。

接下来,蔡飞老师详细介绍了音频图文内容识别模型框架、音视频直播内容风控系统、音视频文件内容风控系统的详细架构,以及审核策略定制化调优过程。

腾讯云内容风控产品经过22年的行业审核经验积累,通过亿级的样本数据的训练,支持超过300多种审核标签识别能力,高达95%以上的识别准确率,并提供7*24小时的策略调优,以及弹性扩容支撑大规模识别的需求,为腾讯云用户提供实时、精准、高效、易用的内容审核整体解决方案。

云点播媒体处理平台技术实践

云点播是集音视频上传、媒体资源管理、媒体处理、分发加速、视频分发于一体的解决方案。其中媒体处理是云点播的一项核心功能,支持如转码、截图、视频AI、视频加密等能力。

一站式视频点播解决方案

腾讯云高级研发工程师颜楚雄老师介绍了媒体处理中离线任务的特点,从模块设计、算法设计、队列选型等角度,介绍了云点播具体如何实现一个公平、可靠、高效调度的媒体处理平台。

最后,引出了媒体处理平台在实际运营过程中,出现的容灾存在风险、集群利用率低、新业务接入难等几个挑战。颜楚雄老师对这些问题的原因和优化策略进行了详细介绍。

腾讯云高级研发工程师颜楚雄

Xe GPU创新微架构 打造云游无界畅玩体验

随着5G、光纤等高速网络的发展和普及,云游戏成为游戏行业的必然趋势,也是音视频技术应用的下一个市场。

英特尔(中国)研究中心有限公司视觉云首席架构师余志洪

英特尔第一代GPU产品是以游戏作为重点,并且以安卓游戏手游、云游作为突破口来打造市场。英特尔(中国)研究中心有限公司视觉云首席架构师余志洪老师表示,“它并不是追求极致性能的GPU,而是从低功耗、高密度的思路出发,在一个板卡上堆叠多个GPU。手游云游是一个成本非常敏感的业务,英特尔第一代GPU在单卡上能支持更多的路数,可以将成本压的更低。”英特尔把它做成了一个卡上有4个小的GPU,功率只有150瓦。针对云游戏的场景,英特尔与腾讯有紧密的合作,对一些特定场景需求进行了了定制化,在编解码密度方面也进行了相应的匹配。

英特尔(中国)研究中心有限公司视觉云首席架构师余志洪老师表示,英特尔研发GPU的思路是以开放的形式提供软件和生态,因此大部分驱动代码都是开源的,可以从开源社区得到,在安卓层面进行了定制化,这样方便贴心的软件支持在行业里是少有的。英特尔提供了一整套的软件,与腾讯一起合作开发了高密度的方案,两卡可以支持160个实例。

H3C XG310采用4个Intel®Server GPU,内置行业领先的媒体IP和低功耗固定功能块。使用基于Intel®服务器GPU的卡,供应商可以实现: 与目前的安装基础相比,增加了5.5倍的流,同时提高了22%的比特率效率。通过降低准备和分发成本,增加TCO节约。英特尔自研的Xe架构GPU,包括四大级别,Xe_LP、Xe_HP、Xe_HPG和Xe_HPC,其中,HPG面向发烧级游戏玩家,同时还支持硬件级实时光线追踪加速。

余志洪老师透露,英特尔前段时间发布了全新高性能显卡产品品牌------英特尔锐炫(Intel® Arc),将于2022年上市。Intel®Arc显卡产品基于Xe HPG微架构设计,其硬件产品将涉及多代,不仅包括首代基于Xe HPG微架构的Alchemist显卡,还将包括代号分别为Battlemage、Celestial和Druid的后续几代产品。

下一代Overlay网络架构探索

进入互联网的下半场即产业互联网时代,是物的互联网时代,是以数据为中心的时代,面临着比以往更加艰难的挑战,比如人口红利的终结、流量红利的终结,但并不代表着超常规高速增长的终结。之前成功的互联网基础设施,支撑了互联网的高速发展,其成功可以总结为OSI分层模型成功,TCP-HTTP协议大放异彩。但是在产业互联网时代,日益增长的数据量级、分发效率低下、用户数据主权意识觉醒等因素的影响,使得只能客户端访问服务端的C/S、B/S架构不再适用产业互联网,需要有新的网络架构来支撑。

腾讯云专家工程师张鹏

腾讯云专家工程师张鹏老师认为,新的网络架构首先需要更低廉(To B领域)、更高效,并且更容易使用,还需要打破架构束缚。当今,所有的数字化基本上都是经过云中转而产生的数字化。数据经过云中转能并不能覆盖现实世界所有场景,世界应该很复杂,靠关系数据其实能做的还是很少的,最适用的行业再回头来看,仅有社交、电商、内容传播和数据录入/管理等领域。架构需要打破只能云中转的方式,从而达成更加分布式的网络。新的网络架构还要结合5G,但是边缘服务器无法部署到每一个5G基站,所以还要依赖连接上的进一步解放,尽量让同一个5G基站的设备相互连接访问,提供就近服务,就能发挥5G巨大的优势了,这才是5G的正确使用方式,而这方面对等网络技术正当时。

张鹏老师表示,未来的数据很可能不会存放在公司的云数据中心,而是托管在各种各样的小的银行保险箱里,或者社区性质的存储箱中,存储数据上反垄断,应用产生的数据主权不是属于应用本身,而是属于个人,而且分发访问速度更快,存储成本更低。直播这个形态就非常具有代表性:媒体内容例如图片、文字、视频等资料存放在云上,云服务商拥有绝对控制权,在直播形态下,云服务供应商却无法再对直播有绝对的控制权,主播下线就是下线了,云想让直播内容续上都没法子,主播对直播内容有绝对主权。

最后,张鹏老师详细介绍了网络、存储、计算三大落地实践,当然终究离不开以云为基础,为此腾讯云推出了RT-ONE三网合一。

以云为基:三网合一,RT-one助力

RT-one整合了腾讯云实时通信网络(TRTC)、即时通信网络(IM)以及流媒体分发网络(CDN)三张网络,是完整的音视频通信PaaS平台构建基座。

智能语音技术在新居住领域的应用

智能语音是指一种以语音信号识别为基础,搭配自然语言处理和对话管理技术,将语言输入信息提取、分析,最终通过语音合成或文字等方式输出并完成响应的人机语言交互技术。智能语音技术是人工智能的核心基础技术之一,在人工智能技术中占据重要地位。权威数据显示,2019年智能语音占据我国人工智能22%的市场份额,仅次于已经大规模商用的机器视觉。经过多年的发展,智能语音技术已经进入落地期,智能语音助手、智能音箱等产品也相继落地。在消费级市场,语音应用立足于个人日常生活,主要应用场景包括智慧生活、智能家居、智能办公、智能驾驶等。在企业级市场,语音应用服务于特定场景,如智慧医疗、智慧教育、智慧电信/金融/电商等。而在新居住领域,语音应用主要应用于智能家居、智能客服场景中。

贝壳找房语音技术负责人邹伟

贝壳找房语音技术负责人邹伟在演讲中表示,智能家居的目标是实现全屋产品的智能化,智能音箱、扫地机器人、智能电视等都是人们生活中经常使用的产品,这些产品可以进行语音交互,实现智能中控。这些智能产品、智能硬件首先通过信息音频,进行语音处理,语音唤醒,之后进行语音识别,通过语音理解来识别请求,比如询问天气,通过对话管理和用户进行交互,之后进行语音合成,通过语音的方式和用户交流,形成语音全链路。

接下来,邹伟老师还详细介绍了智能客服应用。

智能客服技术架构

腾讯视频云明眸技术演进之路

随着显示设备分辨率的增大,大众对于超高清视频的诉求越来越高,但是视频的制作和生产端常见的分辨率还是1080P,对于广电行业来说,急需使用AI技术将原来不够清晰的视频转换成超高清视频,进而真正达到了4K的人眼感官。对于广大互联网企业来说,在直播、短视频突飞猛进发展的情况下,带宽和存储成本飞速的增加是一大难题。同时,对互联网行业客户来说,视频播放的流畅性也是用户体验的重要衡量标准。因此,基于AI的高清低码和画质增强等能力越来越受到行业内客户的关注。

腾讯云高级研发工程师刘兆瑞

腾讯音视频AI产品解决方案-腾讯明眸,可以实时对视频流进行识别,并进行AI化处理。腾讯明眸包含“极速高清”、“视频超分辨率”等产品,其中,极速高清能在保持视频清晰度的情况下,相对于普通转码提升40%的压缩率,画质重生能大幅提高视频的人眼感官,为在线视频、泛娱乐直播、短视频等行业助力,可有效节省带宽资源,提升观看体验。

接下来,腾讯云高级研发工程师刘兆瑞老师详细介绍了极速高清演进之路和画质修复演进之路。

音视频内容风控中的AI实践

在信息爆炸的时代,每天都产生大量的数字化信息,但其中包含了很多不良内容,这极大地影响社会良性发展,内容净化迫在眉睫。在内容风控领域采用AI技术可以极大地减少人力的投入,帮助企业降本增效,为健康内容保驾护航。

腾讯安全高级应用研究员周维聪

各式各样的场景产生的信息归根结底以音、视、图、文的形式呈现,而内容风控产品就以音、视、图、文技术为基础,向上构建整体的审核能力。内容风控面临的挑战与困难有:强对抗,各形式的内容存在大量对抗变异、多模态结合;不同业务场景上的标准不同,需要能灵活响应不同场景的策略;有些业务场景复杂,存在长尾问题;时效性,能对新增风险快速响应。

腾讯安全高级应用研究员周维聪老师在演讲中详细介绍了图像视频风控、音频风控、文本风控的具体实现之路。周维聪老师表示,在内容风控中,各模块之间的适配衔接需要优化,对于噪音、背景音、远场下的ASR准确提升等疑难问题要重点解决。多模态技术的应用探索可以提升各类审核效果,同时需要对抗生成技术的应用,增强对对抗样本的审核能力。

至此,腾讯云Techo Hub技术巡回北京站圆满结束。接下来,活动还将走进成都、杭州、上海,为更多开发者带来学习、交流的机会!

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 大家在看
  • 腾讯云于重庆成立新公司,经营范围含计算装备技术服务等

    企查查APP显示,10月8日,腾讯云(重庆)智能科技有限公司成立,法定代表人为香文斌,注册资本1000万元人民币,经营范围包含:软件开发;技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;信息技术咨询服务;云计算装备技术服务;平面设计。企查查股权穿透显示,该公司由腾讯云计算(北京)有限责任公司、成都腾云忆想科技有限公司共同持股。

  • 登顶CLUE榜单,腾讯云小微与腾讯AI Lab联合团队提出基于知识的中文预训练模型

    2018 年以来,以BERT、GPT等为代表的大规模预训练模型,带来了人工智能领域新的突破,由于其强大的通用性和卓越的迁移能力,掀起了预训练模型往大规模参数化发展的浪潮。其中微软、谷歌、Facebook、NVIDIA等诸多公司在预训练算法上持续大量投入。国内如百度、华为、阿里等公司也相继投入到大规模预训练模型算法的研究中。现阶段,在中文自然语言处理方向上,预训练也如雨后春笋一样涌现。现有算法主要依赖纯文本学习,缺少知识指导

  • 全国首发!腾讯云第六代100G服务器正式规模应用

    腾讯云日前正式发布规模应用的第六代100G云服务器机型。此次发布的机型包括标准型 SA3、标准型 S6、内存型 M6、计算型 C6 等多种机型选择,以及 1 核到 232 核的多种灵活算力配置,可覆盖全行业客户使用场景;为典型的企业级软件、数据库、搜索、高性能计算等应用带来全方位的性能与稳定性升级,尤其适用于视频弹幕、直播、游戏等网络应用场景。第六代云服务器性能全面提升此次腾讯云发布的第六代云服务器属于全新一代的云基础设施

  • 智慧金融新力量 从科技荣登2021“IDC中国FinTech 50”榜单

    近日,由国际数据公司IDC(International Data Corporation)举办了“2021 IDC中国数字金融论坛”,本次论坛聚焦于大数据、人工智能、云计算、区块链、隐私计算等领域的各类创新性技术,且论坛发布了2021“IDC中国FinTech50”榜单。此榜单旨在评选出具有对相关场景进行技术赋能、痛点解决及差异化服务能力的金融科技服务商,由此全面洞察中国金融科技生态全局,衡量金融机构的数字化能力及业务增长能力。云从科技成功入选“IDC中国

  • 腾讯云鼎实验室发布安全攻防矩阵,绘制九大攻防路径全景图

    随着云计算技术和产业的蓬勃发展,企业上云已是数字化转型的必然趋势。但云上千般好,却也给企业带来了全新的安全挑战。云平台不仅要应对传统网络架构中存有的DDoS、入侵、病毒等常态问题,还要高度重视技术架构中虚拟机逃逸、资源滥用、横向穿透等新安全问题。守护云上安全,是数字时代的重中之重。 9 月26日,2021首届-西部云安全峰会在西安成功举办。会上,腾讯安全云鼎实验室首次披露云端攻防最新成果——云安全攻防矩阵。该矩

  • Satechi发布的多功能适配器将USB扩展坞与M.2 SSD存储相结合

    最新推出的一款面向MacBook Pro和USB-CiPad外围设备是来自Satechi的混合多端口适配器,它汇集了一个强大的USB扩展坞以及固态硬盘的空间。该扩展坞为Mac增加了四个端口--HDMI、两个USB和USB-C。两个USB端口都是USB-A3.0端口,而HDMI端口支持60Hz的4K输出。USB-C PD电源可以为Mac或iPad的USB-C连接装置提供最大100W的电力。但这并不是去哪不,滑开USB-C集线器的顶部,还可以发现一个M.2固态硬盘插槽,可以在那里添加SSD存储装置。通?

  • CCF CTO Club(深圳)第二站活动在天励飞圆满举行

    9 月 28 日,CCF CTO Club(深圳)第二站活动来到云天励飞,CCF CTO CLUB(深圳)主席李世鹏、副主席田奇、常委乐中英,CCF深圳分部副主席谢全锋等近 30 位特邀嘉宾出席,云天励飞首席科学家王孝宇主持了会议。CCF CTO CLUB(深圳)主席李世鹏CCF CTO CLUB(深圳)副主席田奇云天励飞首席科学家王孝宇会议上,港中大深高金、政策与实践研究所所长、香港国际金融学会主席肖耿以“深港合作:一体化还是双体系并行”为主题发表讲话。?

  • 融慧金科蝉联2021 IDC中国FinTech50强榜单

    近日,全球知名研究机构IDC正式对外发布2021 IDC中国FinTech 50强榜单。融慧金科凭借在科技赋能、创新变革和金融服务三个维度上的均衡表现,连续两年入选该榜单。一同上榜的还有工银科技、建信金科、平安科技、蚂蚁集团等知名金融科技机构。“IDC中国FinTech 50”榜单于2020年首次推出,主要从科技赋能、创新变革、金融服务三大维度进行评选,旨在全面深入了解中国金融科技生态全局。据IDC中国介绍,今年的榜单评选更多从技术输出?

  • 腾讯云音视频V+生态计划全面升级,微赞直播携手V+俱乐部共创生态经济

    面对音视频技术演进、场景丰富和行业发展带来的新机遇,9月23日,腾讯云宣布全面升级V+生态计划。23日上午,腾讯云音视频V+生态合作签约会在深圳腾讯滨海大厦成功落下帷幕。大会以新业态·新生态为主题,汇集了V+俱乐部全球100+优质生态合作伙伴,共同探讨产业互联网的新应用、新趋势,分享音视频技术在各垂直领域的赋能实践。微赞直播创始人兼CEO周鹏鹏受邀出席本次签约会,作为首批生态合作伙伴在会上签署V+生态合作协议并获腾讯

  • StarTech.com推出一款带NFC的高端蓝牙5.0音频接收器

    今天,StarTech.com 推出了一款高端软件狗,能为你的有线扬声器和音箱提供蓝牙无线连接。最重要的是,这款软件狗通常使用起来非常简单。StarTech 称其为“带 NFC 的蓝牙 5.0 音频接收器”,不仅提供模拟连接和光学输出,还支持 48KHz/24 bit 采样率。StarTech.com 解释说:用这款蓝牙 5.0 音频接收器将你的家庭音响或任何音频输出变成一个蓝牙兼容的媒体网关,它具有 HiFi 级的 Wolfson WM8524 数模转换器(DAC),并提供丰富和高?

这篇文章对你有价值吗?

  • 热门标签