首页 > AI头条  > 正文

Kyutai Labs 开源 Kyutai TTS:低延迟流式文本转语音技术

2025-07-04 09:48 · 来源: AIbase基地

7月3日,法国AI研究机构Kyutai Labs宣布开源其最新文本转语音(TTS)技术——Kyutai TTS,为开发者与AI爱好者带来高效、实时的语音生成解决方案。Kyutai TTS以低延迟与高保真声音为亮点,支持文本流式传输,无需完整文本即可开始生成音频,特别适合实时交互场景。

Kyutai TTS在性能上表现卓越。使用单块NVIDIA L40S GPU,该模型可同时处理32个请求,延迟仅为350毫秒。此外,系统不仅生成高质量音频,还能输出单词的精确时间戳,方便实时字幕生成或交互式应用,如Unmute平台的中断处理功能。

在语言支持与质量评估方面,Kyutai TTS目前支持英语和法语,单词错误率(WER)分别为2.82和3.29,展现出高准确度。说话者相似度达到77.1%(英语)和78.7%(法语),确保语音自然且接近原始样本。模型还能处理长篇文章,突破传统TTS的30秒限制,适合新闻、书籍等长篇内容生成。

Kyutai TTS采用延迟流建模(DSM)架构,结合Rust服务器实现高效批处理,已在GitHub和Hugging Face开放源码与模型权重,助力全球开发者推动语音技术创新。

开源地址:https://kyutai.org/next/tts

  • 相关推荐
  • iTAP完成“大考”,这些应用场景将率先落地!

    2025年7月11日,首届iTAP测试大会在西安成功举办。华为、支付宝、华大电子等产业链头部企业共同完成了支付、门禁、票务三大场景下的协议互通性验证,标志着iTAP技术正式通过商用化验证。华为Pura80手机和Watch GT5智能手表成为首批通过全部测试的设备。测试结果显示,iTAP技术突破传统NFC协议痛点,交互效率提升300%,支持存量设备通过软件升级接入,显著降低硬件迭代成本。产业协同效应显现,多家芯片厂商已制定明确技术路线图,加速生态布局。未来iTAP技术将在智慧交通、数字生活等领域加速商业化落地,ITMA协会拟于2025年第四季度再次举办测试大会,持续推动产业协同发展。

  • Jinfiniti佘金雄与崔圻羽亮相深圳国际大会 解读TAO闭环引领长寿医疗新革命

    2025年深圳国际医疗旅游展会上,精准医疗企业Jinfiniti创始人余金雄教授与亚太区执行官崔园羽女士共同发表主题演讲,介绍其首创的"检测-干预-优化"(TAO)闭环抗衰模式。该企业拥有全球首个商用NAD+检测技术,市场占有率95%,其明星产品Vitality NAD+ Booster在临床中展现出显著效果。余教授深耕抗衰领域40余年,发表400篇同行评审论文,谷歌H指数76。演讲深入解析了通过精准检测、靶向干预和动态优化三步实现科学抗衰的路径,并展望了"健康百岁"的八大TAO支柱。崔女士则分享了亚太本土化实践,计划通过"医疗3.0时代"战略帮助10亿人延长健康寿命10年以上。目前Jinfiniti产品已覆盖60余国,形成全球化服务网络。

  • 马斯克xAI推出Grok - 4 大模型将至,Meta/微美全息深耕开源AI融合加速

    埃隆·马斯克旗下xAI即将发布Grok-4大模型,该模型将在语言、数学和推理方面超越OpenAI和谷歌最新AI产品。同时苹果低调收购两家AI公司TrueMeeting和WhyLabs,加速布局Vision Pro头显和Apple Intelligence领域。Meta计划投入数百亿美元扩建AI基础设施,扎克伯格亲自招募顶尖AI人才。微美全息聚焦高性能算力与多模态模型,推动AI产业升级。当前AI赛道竞争激烈,大模型正向通用多模态演进,商业化落地成为关键。

  • 技嘉科技 STEALTH Revolution 玩转简约装机美学 力邀创作者打造纯白梦幻桌机

    技嘉科技推出STEALTH Revolution活动,主打纯白美学装机概念。活动以X870AORUS STEALTH ICE主板为核心,邀请全球创作者打造个性化桌机。该系列采用背插式设计,简化装机流程,释放机箱空间,便于展示水冷设备和RGB灯效。新品涵盖X870/B850主板、RTX5090显卡及全景机箱等,联合10余家机箱品牌推出20余款兼容产品。活动提供限量主板供参赛者使用,并开放大众投票评选优秀作品,参与者有机会赢取丰厚奖品。技嘉旨在推动"背插主板×纯白机身"的装机新潮流,满足市场对简约风格的需求。

  • Checkout.com正加速北美扩张:加拿大本地收单业务正式上线并宣布新管理层任命

    全球领先支付公司Checkout.com宣布进军加拿大市场,推出本地收单服务,并任命Zack Levine为北美地区营收负责人。该公司2024年北美业务增长超80%,在加拿大推出服务后将提供更全面的交易数据掌控和支付成功率。加拿大作为全球第九大电商市场,规模达520亿加元,62%消费者进行跨境网购。Checkout.com已在旧金山设立新办公室,战略布局北美增长引擎。Levine将统筹北美和以色列业务,助力企业把握数字支付转型机遇。公司目前为eBay、Klarna等国际品牌提供支付服务,通过集成多种支付方式提升商户支付体验。

  • 微软以Maia 280开启新局对垒英伟达,Meta/微美全息开源联动引领AI创新

    微软自研AI芯片Braga因设计问题延期至2026年,将推出过渡产品Maia280,性能或提升30%。微软原计划2025年量产Braga芯片以减少对英伟达的依赖,但延期导致后续产品线同步推迟。面对英伟达在AI芯片领域的主导地位(市占率超80%,年销售额增长10倍),微软正调整战略转向更务实的迭代路线。与此同时,Meta成立"超级智能团队"加速AI研发,微美全息押注量子计算等前沿技术。行业分析师认为,由于英伟达技术迭代速度极快(年增长32%),多数企业自研芯片计划可能最终难以抗衡其市场领导地位。

  • iOS 26 Beta 3发布 苹果又砍一刀!液态玻璃再被削弱

    今日,苹果发布iOS26第3个开发者预览版,液态玻璃设计再被削弱,玻璃感的通透高级氛围没了。 许多升级iOS26Beta3的用户反馈称液态玻璃质感削弱、类似毛玻璃和液态玻璃的中间值,液态玻璃0.5的感觉。 数码博主i冰宇宙”也表示,iOS26Beta3的液态玻璃基本上砍没了,现在基本上就是磨砂玻璃。

  • 苹果发布iOS 18.6开发者预览版Beta 3:国行AI遥遥无期

    今日,苹果向iPhone用户推送了iOS 18.6开发者预览版Beta 3。 开发者可在兼容设备上通过设置”应用,进入通用软件更新”下载该测试版。 目前尚未发现有可见更新内容,不过此前有消息称,iOS 18.6将会针对欧盟地区用户进行实用性更新。 苹果当前在欧盟地区的iOS版本虽然支持上述两种行为,但会插入一些警告屏幕,这引起了欧盟监管机构的关注,将会进行一些调整。 值得注意�

  • Meta高薪挖人!苹果AI大牛跳槽了

    Meta首席执行官扎克伯格正以高薪挖角竞争对手的AI人才,苹果一名核心工程经理已决定跳槽加入。 据悉,负责苹果基础模型团队的Ruoming Pang从苹果跳槽至Meta,他曾在苹果管理着约100名员工的团队,该团队致力于苹果大型语言模型的研发。 Ruoming Pang团队开发的模型已经应用到iPhone中,比如邮件摘要、生成式表情(Genmoji)等等。 Meta以每年数千万美元的待遇成功吸引了Ruoming Pan

  • Aqara 携手西门子西碳迹SiTANJI,发布亚马逊 CPF 绿标解决方案标杆案例

    7月17日,Aqara与西门子碳足迹SiTANJI在第三届中国国际供应链促进博览会上签署碳足迹解决方案协议,标志着双方首个亚马逊CPF绿色标签项目正式启动。该项目将帮助Aqara智能家居产品获取欧盟市场准入所需的碳足迹认证,打造中国智造绿色出海新范例。方案提供一站式碳核算、减排建议及国际认证服务,助力产品高效获取亚马逊CPF绿色标签。此次合作实现了从产品低碳设计到获取国际认证的闭环,为行业探索绿色供应链与低碳出海提供了可复制的实践样本。Aqara作为绿米联创旗下品牌,其智能照明、暖通等产品通过AI技术实现节能降耗,已广泛应用于智慧建筑领域。未来双方将继续深化合作,为地产、酒店等企业客户提供具备国际碳认证的智能家居解决方案。

今日大家都在搜的词: