首页 > 业界 > 关键词  > 腾讯最新资讯  > 正文

腾讯实时语音编码大突破:电梯、地库里通话也不卡顿

2024-06-27 15:00 · 稿源: 快科技

腾讯将于近期正式发布其主导的下一代实时语音编码行业标准——AVS3P10

由腾讯会议天籁实验室与腾讯人工智能实验室共同研发的Penguins编解码器(AVS3P10的原型),巧妙融合了传统信号处理技术和前沿深度学习算法,打破了传统编码器的局限。

广泛测试表明,腾讯提出的AVS3P10已达到目前人工智能编解码器行业的顶尖水准。

该标准可在码率低于 6kbps 的情况下实现高质量通话,其音频品质堪比行业现有主流标准在 20kbps 的质量。

腾讯强调,现有的实时语音编解码技术即使在信号不佳的情况下也能确保通话质量。使用腾讯会议时,甚至在电梯间、地下停车场或高铁隧道中,也极少会发生卡顿。

据悉,AVS3P10 标准的原型是腾讯研发的首个神经网络语音编解码器——腾讯会议Penguins人工智能语音引擎。在为腾讯会议和 QQ 语音通话的亿级用户提供稳定服务后,腾讯开始利用这一技术推动行业进步。

举报

  • 相关推荐
  • 山石网科叶海强解码“双A战略”:ASIC 解放算力、AI 解放人力

    山石网科通过自主研发ASIC安全专用芯片实现战略变革,构建"双A战略"(ASIC+AI)突破行业同质化竞争。其ASIC芯片将高频调用代码固化,释放CPU算力,显著提升系统性能与稳定性,同时通过AI优化研发流程和服务效率,实现人力成本降低。公司规划2023-2025年完成全产品线向ASIC平台切换,2026-2028年进入规模跃升期,目标收入突破20亿元。山石网科强调不盲目追逐AI风口,而是聚焦"流程优化",通过AI提升编码效率30%,运维问题解决效率提升25%。这种"技术筑基、效率突围"的策略,正在帮助公司在行业洗牌中构建差异化竞争优势。

  • MCP服务库完整指南:如何选择最适合的Model Context Protocol服务

    本文介绍了MCP(Model Context Protocol)作为连接大型语言模型与外部数据源的重要桥梁。随着AI技术发展,选择合适的MCP服务库对开发者至关重要。文章分析了MCP服务库的核心价值:提升开发效率、增强系统互操作性、降低技术门槛。评估MCP服务库质量需考虑协议兼容性、安全性、生态系统丰富度及社区活跃度等维度。建议开发者根据业务需求选择服务,初创公司可侧重简便性,大型企业应关注安全性和扩展性。文章还指出MCP服务未来将向云原生化、智能化运维和标准化方向发展,并推荐使用专业对比平台(如mcp.aibase.cn)辅助决策。

  • AI日报:腾讯混元开源Hunyuan-GameCraft;最强图像编辑器nano-banana发布;字节开源Agent专用模型 M3-Agent-Control

    本文介绍了AI领域最新动态:1)腾讯开源Hunyuan-GameCraft框架,可快速生成高质量游戏视频;2)Nano-Banana模型在图像编辑领域超越FLUX+Kontext;3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型;4)Kimi将推出PPT生成功能;5)阿里1688将上线"诚信通AI版"会员服务;6)苹果智能家居中心推迟至2026年发布;7)万兴科技接入GPT-5;8)全球AI独角兽达498家,总估值2.7万亿美元;9)谷歌为Slides和

  • 豪掷流量现金,抖音加码优质内容,MCN新机会来了?

    ​抖音加码优质内容。 近日,抖音面向MCN机构推出激励政策,创作者完成指定任务最高可获25000元流量券,机构更有机会斩获10万元现金激励。 这是继“抖音精选计划”后,抖音再度明确释放扶持优质内容的强烈信号。 对MCN机构而言,这既是新的机遇,也意味着内容升级的新挑战。

  • 谷歌DeepMind发布Genie 3世界模型:支持实时生成交互式3D环境

    据媒体报道,谷歌DeepMind正式发布了其新一代通用世界模型Genie 3。 该模型能够根据用户的文本提示,快速生成丰富多样的交互式虚拟环境。Genie 3不仅能够以每秒24帧的速度生成720p分辨率的高清交互式3D世界,更创新性地引入了 可提示世界事件” 功能。用户通过简单文本指令,即可实时修改虚拟环境,显著提升了沉浸感与创造力。 DeepMind视Genie 3为迈向通用人工智能(AGI) 的�

  • AI日报:百度推全球首批AI数字员工;Claude Opus4.1出世;谷歌DeepMind发布世界模型Genie 3

    AI日报栏目聚焦人工智能领域最新动态:1)Claude Opus4.1发布,编程能力提升74.5%;2)OpenAI开源GPT-OSS-120B和20B模型;3)谷歌DeepMind推出革命性3D世界模型Genie3;4)谷歌Gemini新增AI故事书生成功能;5)ElevenLabs推出商用AI音乐生成器;6)百度智能云发布首批AI数字员工;7)OpenAI估值或达5000亿美元;8)00后创业者推出云端AI协作开发工具Vinsoo;9)腾讯启动2026校园招聘,重点培养AI人才;10)马斯克宣�

  • CoinW 全栈融合 ,智能驱动——开启未来交易新格局

    全球领先加密货币交易平台CoinW宣布全面升级,构建"交易无界"一体化生态。平台通过统一账户体系整合中心化与去中心化交易、底层公链基础设施及机构级服务,形成协同互通的全球数字资产生态系统。升级后的CoinW具备三大核心特性:1)智能策略执行系统自动优化交易路径;2)支持链上结算、MPC自托管及RWA等多元资产接入;3)模块化功能组合满足不同交易需求。平�

  • GPT-5和Claude 4 Opus谁更强?用这个AI大模型对比工具一眼明了

    OpenAI正式发布GPT-5,与Claude4Opus和Gemini2.5Pro进行对比测试。GPT-5在编程能力(SWE-bench测试74.9%)和数学推理(AIME2025测试94.6%)表现突出;Claude4Opus编程优异(72.5%)但数学较弱(33.9%);Gemini2.5Pro擅长长文本处理(100万token窗口)和多模态应用。价格方面,GPT-5和Gemini2.5Pro定价相近($1.25-$10),Claude4Opus较高($15-$75)。建议根据需求选择:GPT-5适合综合应用,Claude4Opus适合专业编程,Gemini2.5Pro适合长文档�

  • “无限量”供应Claude,就是AI IDE们的百亿补贴

    Anthropic于2025年7月28日宣布,将从8月28日起对Claude Code工具新增每周调用限额——因为少数重度用户全天候高频使用,一次使用成本甚至高达数万美元,远远超过普通订阅预期。 同样在上个月,Cursor曾因其“I’ll keep it unlimited”的Pro收费模式悄然变更为计算tokens限制,导致大量用户抱怨“实际上并非无限”,纷纷在社群中吐槽,迫使公司CEO出面道歉、甚至给出退款补偿。 这两�

  • AI日报:B站测试AI视频工具花生AI;腾讯发布多模态模型Large-Vision;昆仑万维开源Skywork UniPic 2.0

    【AI日报】主要内容: 1. B站测试"花生AI"视频工具,3分钟可成片,同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0,实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI,苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐,仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新:恢复GPT-4o默认模式,为GPT-5引入多模式选择,优化交互体验

今日大家都在搜的词: