首页 > 业界 > 关键词  > 正文

Google发布Lyra V2超低比特率语音编解码器

2022-10-01 08:10 · 稿源: cnbeta

去年,Google宣布了用于低比特率的Lyra语音编解码器,与开放的AV1编解码器相结合,可以在20多年前的56kbps的Modem连接上实现语音聊天。Lyra利用机器学习和其他技术进行极低比特率的语音压缩后,甚至可以在3kbps的速度下顽强工作。Google去年开放了Lyra的源码,而今天他们宣布了Lyra V2的可用性。

Google将Lyra V2总结为"一个更好、更快、更通用的语音编解码器......一个新的架构,享有更广泛的平台支持,提供可扩展的比特率能力,具有更好的性能,并产生更高质量的音频。"

Camp Compose (6).png

Lyra V2利用SoundStream端到端神经音频编解码器,继续显示出比Opus音频编解码器好得多的性能,改善了音频质量,以及更多。

Lyra V2的开源代码今天已经可以使用。更多细节可以通过Google开源博客找到:

https://opensource.googleblog.com/2022/09/lyra-v2-a-better-faster-and-more-versatile-speech-codec.html

代码可以在GitHub上找到:

https://github.com/google/lyra/releases/tag/v1.2.0

Lyra image 2.pngLyra image 3.png

GitHub的发布说明提到Lyra V2在Android设备上的表现可以快上5倍,编解码器的延迟从100毫秒减少到20毫秒,现在还支持Mac和Windows,以补充Linux和Android的支持。

举报

  • 相关推荐
  • 语音唤醒来了!特斯拉春节OTA更新2025.45.32.1版发布

    特斯拉中国于2月6日正式推送2025.45.32.1版本OTA升级,覆盖全系在售车型。此次更新重点加入语音指令唤醒功能,用户轻呼“嘿,特斯拉”即可快速唤醒系统,提升交互便捷与驾驶安全。同时推出“自动化”应用程序,支持用户自定义个性化任务流程。行车记录仪根据USB驱动器容量动态调整视频存储时长,最高可达24小时。此外,新增酷狗音乐、QQ音乐伴唱等娱乐功能,并优化超级充电站显示、玩具箱喷漆车间等实用服务,同步更新车机地图包,提供更精准导航体验。

  • 终于有语音唤醒!特斯拉史诗级大更新 车主:终于等到了

    等了多年,特斯拉车主终于等来语音唤醒。博主@科技新一发微博称:诗级大更新!*部分功能实现时间和效果可能根据车型和车辆配置存在差异,请以实际收到的推送为准。

  • 京东AI付正式上线!支持语音快捷安全支付

    京东今日正式宣布入局AI支付领域,推出京东AI付”,用户凭借语音即可便捷、安全支付。 据悉,该功能搭载京东JoyAI大模型能力,适用于AI助手、智能终端等多种软硬件载体。 用户通过简单的语音指令即可完成支付全流程,例如在支付过程中直接语音切换绑定的银行卡。

  • 钛动科技助力品牌远征:从“场域复制”到“心智解码”的直播出海

    全球直播电商正以前所未有的速度扩张,预计2025年市场规模将突破2万亿美元。然而,品牌出海面临“无形门槛”急剧升高,文化差异导致用户获取成本上涨40%-65%。成功关键在于从“区域复制”转向“心智解码”,即深入理解目标市场的文化符号与情感叙事,实现本土化价值连接。系统化能力构建成为破局之道,需整合达人资源、内容创新与本地运营,通过数据驱动的场景创新(如虚拟场景A/B测试)优化直播效果。未来,AI驱动的自适应直播系统将实现个性化体验,虚实融合场景打破物理界限,全球供应链与直播实时联动,最终编织一张感知文化温差、适应市场节奏的全球直播网络。

  • AI日报:可灵3.0发布;阿里大模型品牌正式更名为千问;Mistral AI 发布 Voxtral Transcribe 2 语音模型

    本期AI日报聚焦多领域进展:可灵AI 3.0发布,开启15秒视频AI导演时代;阿里AI品牌统一为“千问”,战略升级;Mistral AI推出低延迟语音转文字模型;上海AI实验室发布全球最大开源科学多模态模型“书生Intern-S1-Pro”;谷歌Gemini月活用户突破7.5亿,并推出低价订阅方案;华为Mate 80系列新增AI消除屏幕摩尔纹功能;米兰冬奥会将启用阿里“千问”大模型;我国生成式AI用户规模破6亿,普及率超四成,算力水平全球领先。

  • 三角洲必看游戏工具使用教程 这几个工具让你解码快人一步直接拿下九格大红

    《三角洲行动》是一款快节奏搜刮撤离射击游戏,持续更新吸引玩家。新春版本上线,提供登录奖励如三角券、六套福袋等,并推出“阿萨拉年货节”和“威龙年味食堂”活动,可兑换外观、武器等奖励。游戏需破解物资点密码,新手易遇挫。推荐使用“古怪加速器”优化网络,降低延迟,并提供密码助手、互动大地图等工具,帮助玩家快速获取资源、规划路线,提升游戏体验。

  • 微信电脑版支持语音输入了:支持文字整理 方言及中英文混合识别

    腾讯公关总监张军今日宣布,微信PC端4.1.7版本正式推出语音输入功能,目前正通过内测版向全体用户逐步推送。这项被用户称为"办公神器"的新功能,不仅支持全局调用,更通过智能优化技术将口语转化为规范书面语,重新定义了电脑端文字输入方式。 据实测体验,用户只需点击聊天框左侧麦克风图标或按下Ctrl+Win组合键即可激活语音输入,系统实时将语音转化为文字

  • 浏览器端语音交互指南:如何用低代码快速集成AI语音智能体?

    本文探讨了AI时代语音交互技术的发展与应用。文章指出,AI正深刻改变生产生活方式,语音输入需求快速增长,尤其在需要双手作业的场景中,语音交互能提供无缝高效的工作流程。文章以活字格低代码开发平台为例,详细介绍了如何在浏览器端实现实时语音交互,包括通过麦克风权限获取、语音识别模型实时转写文本、并与AI大模型进行智能对话的完整方案。该方案不仅提升了交互效率和准确性,还保障了用户隐私安全。最后,文章展望了语音交互在智能家居、医疗健康、教育等领域的广泛应用前景,同时也指出了隐私保护、准确性提升和无障碍访问等面临的挑战。

  • 充电1分钟战10小时!前行者S9 V2系列秒充鼠标深度评测

    本文介绍了前行者S9V2系列游戏鼠标,作为S9大师版的升级款,它专注于核心性能提升。S9 Ultra V2搭载旗舰级PAW3950传感器,支持最高42000 DPI;S9 Pro V2则采用PAW3395传感器,性能同样出色。全系配备满血版Nordic主控、500mAh电池及“充电1分钟,续航10小时”的快充技术,连接稳定,续航无忧。手感方面,经典造型配合约63克(Ultra版)的重量,兼顾灵活与稳定。结合219元起的首发价和丰富赠品,该系列以精准刀法重新定义了高性能全能鼠标,为不同需求的玩家提供了清晰选择。

  • 7.8英寸大屏融汇HiFi交互逻辑:开博尔DMP-K8 PRO高端数播解码一体机,全面提升烧友的听音体验!

    开博尔DMP-K8PRO以7.8英寸超大高清触控屏提升传统HiFi台机交互体验。搭载双ES9039PRO解码芯片,实现140dB信噪比与高动态范围,支持硬解DSD512与PCM768kHz。采用专业排线屏蔽技术,确保大屏无电磁干扰。支持跨设备APP操控与本地/云端存储,内置CD机与SSD插槽。配备8GB内存与可升级系统,构建“大屏+移动端”双生态,为用户提供全面进化的居家HiFi体验。

今日大家都在搜的词: