首页 > 传媒 > 关键词  > 正文

海外语聊房通话时长提升5%的背后,声网AI降噪送出助攻

2023-07-17 14:11 · 稿源: 站长之家用户

在社交出海的大潮中,语聊房一直是最热门的社交场景之一,尽管社交玩法一直在迭代创新,但经典的语聊房场景凭借互动性强、聊天话题广、陌生人社交等属性备受国内外用户的喜爱。在海外市场,Yalla、Clubhouse、Uplive、Mico等都已是人们熟知的语聊房平台。

但在海外市场开疆拓域,其实并没有想的那么简单。相比国内成熟的网络条件、设备性能,海外地区普遍存在网络条件差、设备参差不齐等情况,严重影响语聊房中的用户互动体验,也对APP厂商出海带来了严峻的技术挑战。

海外语聊房音频质量面临痛点:开播环境差、网络条件差、设备参差不齐

1、语聊房场景需要频繁的开麦互动,但海外地区用户的开播环境普遍不好,例如东南亚、南美等地区,环境噪声较大,通过传统降噪技术往往无法有效消除复杂的噪音,特别是在唱歌互动的场景,降噪算法可能会抑制唱歌的尾音,严重影响演唱效果,影响用户体验。

2、海外运营商数量多且类型复杂,各地区网络条件参差不齐,例如东南亚诸多岛国尤为明显、OpenSignal的一份报告就发现,新加坡的移动数据下载速度最快,为47.5 Mbps,而速度第二的越南连新加坡一半都不到,才到20.6 Mbps,马来西亚、印度尼西亚、泰国、菲律宾则更低。 在印尼,市场上就有 6 个主流的运营商,而当地还有大量3G、4G的用户,网络环境更加复杂,几乎很难顺畅地进行跨国跨地区群聊。

3、海外用户设备和国内差别较大,尤其是第三世界国家设备类型复杂且低端机覆盖很大,来自声网《实时万象》的数据显示,印度、中东、南美地区使用 RTC 应用的低端机占比高,均超过30%,南美为45.8%,接近中国大陆(23.9%)的 2 倍。想要把用户体验做到较好,就需要兼顾到产品在不同机型上的运行状况,因此设备适配是每个出海产品都要投入大量资源来解决的问题。

针对以上海外音频场景中的用户体验痛点,声网通过凤鸣AI引擎、全球化服务部署以及弱网对抗策略、复杂机型适配等技术能力,可以对音频质量的提升实现多重优化,带来较好的的高音质音频体验。据悉,某东南亚头部语音社交应用在线上虚拟社交场景中使用声网凤鸣·AI降噪后,通话时长增加了5%。

凤鸣AI引擎支持100+非稳态噪声消除 兼顾语音高保真

相比传统的降噪算法,声网凤鸣AI引擎的 AI 降噪算法在降噪效果上有巨大提升,传统降噪算法在处理稳态噪声时效果较好,在处理非稳态噪声时,降噪效果会有明显回退,稳态噪声一般指噪声声压级的变化较小,且不随时间有大幅度的变化,如电机声、固定转速的摩擦、转动等噪声。非稳态噪声指噪声强度随时间而有起伏波动,有的呈周期性噪声,如锤击,有的呈无规律的起伏噪声,如交通噪声、小孩哭叫等。声网自研的 AI 降噪算法可以支持实时互动中100+非稳态噪声消除,降噪效果实现了巨大提升。

同时,针对语聊房、直播等场景下用户会外放唱歌的情况,声网也进一步优化了唱歌场景下的AI降噪模型,并提供 48khz 的高音质降噪算法,一方面可有效避免降噪算法抑制唱歌的尾音,保障演唱效果,另一方面还可以消除插拔耳机等操作引入的电流音噪声。我们可以通过声网微信公众号找到这篇文章,在文章中的对比音频可以更直观的体验电流音噪声的消除效果。

降噪会导致声音失真,是大家常常会担心的问题。声网 AI 降噪在强降噪的同时还能兼顾高保真,即使在语聊房多人同时说话的场景下,也可以做到在抑制噪声的同时不对说话人语音产生损伤,使每个人的声音都听得清晰。同时,还实现了在不增加额外运算量的前提下,对远场语音具有明显的混响抑制能力。当一位用户在房间里离麦克风比较远的时候,也依然可以使对端听到清晰的声音,而不是模糊的声音。

声网 AI 降噪算法相比传统降噪算法,计算复杂度都要高很多,对此一些选择在东南亚、南美等低端机覆盖率高地区的出海企业也会担心,既要享受 AI 算法带来的良好效果体验,又要有媲美传统算法的性能,真的能做到两全其美么?答案就是声网自研的 AI 推理引擎,

通过计算图优化等一系列优化加速技术,在保障降噪算法精度的同时,可以使得 AI 降噪算法在 Android、iOS、Mac、Windows、Web 等主流平台以低精度损伤、高性能、低功耗方式运行,使海外很多地区用户的低端机设备不卡不烫,帮助出海企业解决后顾之忧。

全球化部署与弱网对抗 保障流畅的互动体验

海外复杂的网络环境会造成实时互动中的卡顿、延时高等糟糕体验,这也是困扰很多出海企业的重要因素。声网凭借在出海市场的多年沉淀与打磨,具备全球化服务部署的能力。在海外底层网络优化方面,声网一方面使用网络覆盖质量评价标准来指导建设全球边缘基础资源、提高网络覆盖,调整接入策略,优化关键性指标,提升用户体验。另一方面,声网还拥有完善的全球供应商管理体系,采用公有云、私有云等多种资源,覆盖200+国家和地区,特别针对东南亚、中东、北美和国内中小城市、小运营商做网络优化。

以印度地区为例,印度地域辽阔,有 28 个邦,数字消费人口规模世界第二,仅次于中国。但印度的通信基础设施短板却较为明显,印度拥有数百家网络运营商,网络关系错综复杂,具有基站数量不足、频带有限、数据容量不足等问题,导致用户的网络体验不佳。为了保证用户接入能够做到低延迟、低抖动、降低端到端延迟,声网在各个邦采用不同的网络运营商资源进行测试,得出用于覆盖不同邦特出的接入网络运营商资源,通过理想覆盖点和理想网络运营商组合的模式在当地建立了多个覆盖节点,提升了印度地区的用户体验。

面对海外地区普遍存在的弱网环境,很多出海企业往往束手无策,对此,声网拥有一套抗弱网传输与抗丢包算法,结合网络探测(如延时估计、带宽估计等)、抗丢包技术、自适应jitter buffer、网络拥塞控制策略等,可以实现80%丢包情况下,依然能保障音视频通话流畅,为用户在各种网络环境下提供流畅的互动体验。

对于欠发达地区参差不齐的设备状况,在与众多出海客户的多年实践与打磨中,声网已经可以支持适配30000+终端机型,例如One Plus 3T、Samsung Galaxy A10s、Redmi Note7 Pro 等在某地区还依然流行的特殊老旧机型,为每位用户带来流畅丝滑的体验。

凤鸣·空间音频带来沉浸式音频体验

伴随元宇宙、AIGC 等技术的发展,在语聊房等社交场景加入沉浸式的音频效果也成为一种趋势,海外市场亦是如此。声网凤鸣AI引擎同样具备空间音频的技术能力,通过纯软件算法方案,模拟头部球面区域立体声场,利用范围音频、人声模糊、空气衰减模拟等能力,美好模拟现实听觉感受。当用户操作相应角色在虚拟场景里移动,可以实现根据虚拟人物的面部朝向、音源朝向、远近距离与上下高度,呈现不同声音效果。

以范围音频为例,在空间听觉的研究和实现中,头部相关联的传递函数(HRTF)(Head Related Transfer Functions)与头部相关联的冲激响应(HRIR)占有十分重要的地位。而声网基于 HRTF 头相关传递函数、心理感知声学、声源指向模拟等算法自研了一整套 3D 声场渲染引擎。可以动态模拟空间中任意角度、朝向的声音在传递到左右耳时声音发生的变化从而实现了高精度的声音方位渲染。并且为了追求较好的的听感与较好的的可用性,渲染引擎以极小的算力要求,支持 48kHz全频带、多路音频渲染,让你在移动端不多费流量、不用担心算力也能畅享多人高清音质互动。

音源的朝向对我们的听觉也会有直接的影响,例如一个人背对着你说话相比正对着你说话声音会显得比较“闷”,因为背对着你说话时声音需要绕过身体这个障碍,不同频率的声波绕过障碍物时的能量衰减程度不同。声网 3D 空间音效还提供音源朝向功能,通过声学建模的方式可以模拟任意角度的音源方向带来的音色差异,最终通过模拟不同音源的位置与朝向,实现音量、音色的差异,从而美好模拟现实听觉的感受。

此外,人在真实环境中对上下、前后这两个方向的感知是比较模糊。这是因为人的耳朵基本上是对称的,相比水平方向,在垂直方向上左右耳声音的音量、延迟基本相同就不足以用来区分方向了。所以在虚拟空间中,声网还对这些方向的听感区分做了增强,让用户在“虚拟空间”中可以拥有超越现实的听音辨位能力。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 女子吃桃子咬开发现里面一堆树叶 网友笑称“误食切叶蜂精装房”

    北京一女子吃桃子时发现怪事:外表完好的桃子内部竟藏有新鲜碎树叶。经网友指认,这是切叶蜂的巢穴。切叶蜂会用新鲜叶片筑巢,而这次发现的叶片异常新鲜,推测可能是刚筑好的新巢。该女子表示既惊奇又有趣,网友调侃"你把切叶蜂的精装房给吃了"。这一发现引发网络热议,展现了自然界昆虫的奇妙行为。

  • 《歌手2025》背后,伊利伏击蒙牛

    全网喧哗。 当《歌手2025》在陈楚生拿下歌王之后成功掀起舆论风暴,这档跌宕起伏的“年度大戏”终于落下帷幕。 相比去年石破天惊的直播One Take改造音综掀起全民浪潮,《歌手2025》依旧在相同模式之下以更残酷的赛制、每期都有淘汰让话题度拉满,“爆爆爆”背后是观众们各种情绪的叠加,而“做局”这一表达贯穿始终,无论是上场顺序、PK对象、歌曲选择、编曲反馈,�

  • 来一次涨粉100万,海外网红扎堆来中国,真爱还是掘金?

    “甲亢哥”效应触动了更多网红们的“中国梦想”,国际顶流网红开启中国行正在成为新的流量密码。 今年3月下旬,美国博主“甲亢哥”(IShowSpeed)开启了中国行,其中在上海的6小时直播就收获了560万次观看。在中国行期间,甲亢哥还多次登上微博的总榜热搜,这些热度也让他成为2025年上半年在中国最火的海外博主之一。 除了热度之外,甲亢哥的商业化价值也开始凸显。

  • 非遗科技双王炸!星群二天油凭啥6小时长效安全防蚊?

    2025年8月9日,广药白云山星群公司发布"二天油防蚊虫研究成果",该产品对传播基孔肯雅热、登革热的白纹伊蚊具有显著效果:驱避时效达6小时(国标认证),致死率100%,0.025%超低浓度即可灭杀90%以上幼虫。这项百年非遗技艺经现代科技赋能,实现从传统"黑油炼制"到"主动防护"的升级,兼具驱蚊、醒脑、抗病毒等多元功效。研究显示其天然成分可形成长效防护屏障,避免化学驱蚊剂的潜在毒性。企业同步启动公益行动,向医疗机构捐赠防疫物资,为户外工作者提供防暑驱蚊包,助力南方地区基孔肯雅热疫情防控。未来将继续深化对病毒抑制作用的研究,推动非遗技艺在现代公共卫生体系中发挥更大价值。

  • 海尔冰箱全球第一品牌的背后支撑是科技第一

    海尔冰箱凭借科技创新实现全球领先:2025年1-7月以47%国内市场份额稳居第一,连续17年全球销量冠军。其成功源于持续创新:1)专利技术领先,全球发明专利公开量连续7年行业第一;2)差异化创新:在欧洲推出"三重独立制冷系统"解决串味问题,在东南亚开发干区保鲜技术,在国内首创磁控全空间保鲜技术;3)主导制定全球首个IEC冰箱保鲜国际标准,填补行业119年空白。目前该标准已被30多国采用,助力海尔打破本土品牌壁垒,在欧美亚多国市场占据第一。

  • 上海月薪过万白领健身房偷东西成癖 三年打卡超1500次

    ​2025年3月,上海市黄浦区一家高端健身房内发生了一起离奇的失窃案。事主林先生在锻炼结束后,发现存放在更衣柜中的一块价值14万元的劳力士手表不翼而飞。警方接报后迅速展开调查,发现更衣柜并无破坏痕迹,初步判断密码可能已被窃取。通过调阅健身房监控录像,一名行为异常的男子宋威进入了警方视线——该男子在案发当晚竟8次进出更衣室,并多次尾随其他会员。

  • 全球化布局多点爆发,泡泡玛特海外业务收入突破50亿

    泡泡玛特2024年财报显示全年营收130.4亿元,同比增长106.9%,净利润34亿元增长185.9%。海外及港澳台业务收入50.7亿元,同比暴涨375.2%,占总营收38.9%,其中东南亚市场表现最突出(营收24亿,占比47.4%,增速619.1%)。全年新增130家门店(含合营),机器人商店达192台。品牌通过开设越南、印尼等五国首店,入驻巴黎卢浮宫等国际地标,持续强化全球影响力。线上渠道收入14.6亿元,增长834%,其中TikTok渠道增速达5779.8%。泡泡玛特通过"IP生态+全球化"战略,正成为跨文化交流的新符号。

  • 国内有哪些AI工具导航网站?2025年最全AI工具导航网站盘点

    本文介绍了国内主要AI工具导航网站,帮助用户快速找到合适的AI资源。重点推荐了AIbase、AI工具集、人工智能导航和AI导航站等平台,这些网站收录了上万种AI工具,涵盖聊天助手、办公、视频、编程、写作、图像等多个领域。文章分析了各平台特色:AIbase规模大、分类全;AI工具集界面简洁更新快;人工智能导航提供综合学习资源;AI导航站有智能推荐系统。建议用户根据需求选择内容丰富、分类清晰、体验良好的导航网站,并关注更新和社区互动,以充分利用AI工具提升效率。

  • 持续领跑行业!海辰储能背后的故事:专注只做一件事

    厦门海辰储能科技成立五年即实现跨越式发展:2019年成立后,2023年储能电池出货量跃居全球前三,2024年上半年升至全球第二。其成功源于专注储能赛道的差异化战略,通过技术创新构建全产业链研发体系(全球专利超3900项),推出314Ah电池、∞Cell1175Ah等标杆产品,并首创循环寿命超2万次的钠离子电池。全球化布局成效显著,海外收入从2022年33万元飙升至2024年37亿元,美国得州工厂投产加速本土化。海辰以"极致专注"重塑行业格局,在长时储能、钠电等领域的持续投入,正推动全球能源转型进程。

  • iKF Mars:贵得有理?硬核拆解“高价”背后的声学革命

    iKF Mars耳机以600元价位段挑战高端市场,通过创新声学架构实现突破性音质表现。其核心采用"四单元协同"设计,结合异轴双动圈和同轴双动圈单元,配合40mm+20mm微晶阻尼复合振膜,实现深度低频控制与高解析力。支持Hi-Res双金标认证和LDAC无损传输,动态范围达96dB。降噪方面配备6颗ANC麦克风和三重智能降噪系统,最高降噪深度达-58dB。产品通过硬件堆料与技术创新,在音质、降噪、交互等维度实现全面越级体验,重新定义了中高端耳机的"高性价比"标准。

今日大家都在搜的词: