首页 > AI头条  > 正文

0.33秒生成1秒音频!Muyan-TTS 开源上线,播客、有声书场景完美适配

2025-05-13 08:55 · 来源: AIbase基地

开源语音合成迎来新突破!近日发布的开源 TTS 模型 Muyan-TTS 专为播客、有声书、长视频等场景设计,具备零样本语音合成、极速生成与高连贯性朗读能力,是当前最适合批量化长语音生成的模型之一。

QQ20250513-085410.png

Muyan-TTS 基于超10万小时播客数据预训练,仅需 0.33秒即可生成1秒高质量音频,支持无需打断地朗读数分钟文本,语音自然流畅。更支持说话人定制,任意声音克隆,一键生成具有个性化语气与节奏的语音内容。

模型已开放至 Hugging Face,支持离线部署,开发者可轻松本地推理,适配多样应用场景:播客生成、有声书制作、英文视频配音、AI角色朗读、智能音箱播报等,极大提升内容生产效率。

感兴趣的开发者可前往 Hugging Face 获取模型权重与示例代码,开启你的 AI 语音创作之旅。

GitHub 开源地址:https://github.com/MYZY-AI/Muyan-TTS

HF 模型地址:https://huggingface.co/MYZY-AI/Muyan-TTS

  • 相关推荐
  • 火山引擎推出豆包·语音播客模型:文本秒变双人对话播客,5 生成热点音频

    5月20日,火山引擎推出豆包·语音播客模型,实现文本秒转专业播客内容。该模型三大优势:1)自然流畅的双人对话效果,语音拟真度高;2)支持热点话题即时生成,5秒产出最新资讯播客;3)提供端到端创作链路,支持超长文本/网页链接转播客。相比传统AI播客,解决了内容重复、机械感强等问题。模型即将登陆豆包APP及PC端,6月11日将在火山引擎大会上展示更多功能。

  • 比眨眼还快!机器人0.103秒还原魔方破世界纪录

    美国普渡大学学生团队研发的机器人系统Purdubiks Cube以0.103秒打破魔方还原世界纪录,比此前日本三菱电机0.305秒的纪录快近3倍。该系统整合了机器视觉、定制算法和工业级运动控制硬件,每个动作都经过轨迹优化实现亚毫秒级同步控制。该团队在2024年12月校园设计比赛中首次亮相并获得第一名后持续改进,突破了自动化与高速计算的极限。魔方机器人纪录自2009年的1分4秒不断刷新,2016年首次突破1秒大关。

  • C盘从此成历史!华为鸿蒙电脑硬盘不用分区:支持开机1秒唤醒 大文件

    华为鸿蒙电脑将于5月19日正式发布,官方公布三大亮点:1)支持1秒开机唤醒,即开即用;2)三指上滑可打开任务中心;3)应用和大文件秒开无延迟。实测显示其开机速度明显优于Mac和Windows系统,流畅度完全碾压Windows。系统采用EROFS高性能只读压缩文件系统,随机读取性能比EXT4提升300%,节省1.6GB以上存储空间。文件管理系统类似安卓平板设计,左侧设快速访问入口。此外,系统取消传统C/D盘分区,仅区分本地存储和云盘,并自带底层自动优化清理功能,无需额外加速工具。

  • 机器人0.103秒还原魔方破世界纪录 来自美国普渡大学

    5月13日,美国普渡大学发布一则引人关注的视频。视频中,该校学生成功打造出一台刷新纪录的魔方复原机器,该机器仅需0.103秒便能解开三阶魔方,其速度之快甚至超过人类眨眼时间。 此前,机器人复原魔方的吉尼斯世界纪录保持者是日本三菱电机开发的一款机器人,成绩为0.305秒。此次普渡大学学生打造的这台机器,成功将纪录大幅缩短。

  • 雅迪发布全球首款“碰一下”电动车:支付宝1秒解锁

    雅迪与支付宝达成战略合作,推出全球首款支持"碰一碰"解锁的智能电动车。用户只需用手机解锁后轻碰车身标识区,1秒即可开锁,比传统方式提速90%以上。该车还支持通过支付宝完成开座垫、设防、寻车等功能。每次"碰一碰"骑行可获得39克绿色能量,全年最多可种植2.4棵梭梭树。支付宝"碰一碰"功能上线321天已覆盖全国400+城市,接入5000+品牌和千万商家,用户数破亿,其中半数为30岁以下年轻人。

  • 又一款动力猛兽!小米YU7最大马力690匹 零百加速3.23秒

    小米在15周年战略新品发布会上推出第二款车型YU7豪华高性能SUV。该车四驱双动力版最大马力690匹,零百加速仅3.23秒,最高时速253公里,性能超越特斯拉Model Y和Macan Electric Turbo。搭载小米超级电机V6S PLUS,采用分段磁钢和电压过调制技术,最高转速达22000rpm,峰值扭矩528Nm。底盘配置豪华,标配连续阻尼可变减震器,提供五档高度调节,最大离地间隙222毫米。推出单电机后驱、双电机四驱及双电机高性能四驱三个版本。

  • 续航最高835km、零百最快3.23秒!小米YU7三个版本公布:配置差异一览

    小米汽车5月22日发布三款SU7车型:后驱版(835km续航)、Pro四驱版(770km续航)和Max高性能版(760km续航)。全系标配800V碳化硅高压平台,搭载英伟达Thor智驾芯片(算力700TOPS)、激光雷达和4D毫米波雷达。Max版零百加速3.23秒,配备101.7kWh三元电池,支持15分钟快充620km。Pro版采用闭式双腔空气弹簧,后驱版CLTC续航达中大型纯电SUV第一。智能驾驶系统升级至第三代骁龙8移动平台,应用ALD镀膜摄像头技术提升夜视能力。

  • AI日报:GPT-4.1正式上线ChatGPT;阿里通义万相Wan2.1-VACE开源;可灵大模型视频生成量约占30%份额

    本文报道了AI领域最新动态:1)阿里通义万相开源视频编辑统一模型VACE;2)OpenAI发布GPT-4.1增强编码能力;3)Stability AI推出超轻量341M文字转语音模型;4)快手可灵视频生成模型占据30%市场份额;5)微软WizardLM团队整体加入腾讯混元大模型研发体系;6)腾讯宣布混元图像2.0将于5月16日发布;7)上海成立人工智能标识生态联盟;8)Lightricks发布13B参数视频生成模型LTX-Video;9)谷歌DeepMind推出AlphaEvolve优化AI训练速度;10)腾讯元宝浏览器插件上线Chrome平台。这些进展展示了AI技术在视频处理、大模型、语音合成等领域的快速发展。

  • BOYA博雅发布BOYAMIC 2&BOYALINK 3,AI降噪重新定义无线音频纯净时代

    2025年5月14日,国产音频品牌BOYA博雅发布两款创新产品:旗舰级真AI无线麦克风BOYAMIC2和纽扣式无线麦克风BOYALINK3。两款产品均搭载自主研发的"AI深度降噪3.0"技术,具备-40dB行业顶尖降噪能力,基于70万+噪声样本数据库和毫秒级实时处理能力,重新定义了无线麦克风性能标准。BOYAMIC2采用6mm电容麦,支持32-bit浮点内录;BOYALINK3仅重9克,支持动态降噪和EQ调音。此次发布标志着音频行业从硬件堆砌迈入AI驱动新时代,BOYA以技术创新引领行业升级,产品畅销全球132个国家,服务超3000万用户。

  • 33届深圳国际礼品展:罗马仕全场景充电赋能礼赠新生态

    2025年4月25-28日,第33届深圳国际礼品展将在深圳国际会展中心举行。中国充电行业领军品牌罗马仕(ROMOSS)将以"全场景充电解决方案"为主题参展,展示多款创新产品:磁吸系列产品支持多设备同时充电;COOL电系列采用氮化镓技术,支持30W快充;液态硅胶数据线支持100W快充。罗马仕通过"一线三充"等专利技术,重新定义礼品实用价值与科技体验。展会期间,罗马仕期待与全球合作伙伴探讨如何通过高复购率、高感知度的充电科技产品,在礼品场景中创造持久情感连接与品牌价值。

今日大家都在搜的词: