首页 > 传媒 > 关键词  > SoulX-Podcast最新资讯  > 正文

Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

2025-10-30 17:37 · 稿源: 站长之家用户

根据开源社区Hugging Face10月29日最新榜单数据,SoulX-Podcast模型在发布第二天登顶TTS(Text To Speech,从文本到语音)趋势榜。

此前,Soul App AI团队(Soul AI Lab)联合西北工业大学ASLP@NPU团队和上海交通大学X-LANCE Lab正式开源SoulX-Podcast,该模型是一款专为多人、多轮对话场景打造的语音生成模型,支持中、英、川、粤等多语种/方言与副语言风格,能稳定输出超60分钟、自然流畅、角色切换准确、韵律起伏丰富的多轮语音对话。

传统语音合成系统在多人、多轮对话场景常面临一些痛点问题,例如上下文衔接不自然;缺少副语言(如笑/叹气)、方言等的可控生成能力,缺少“活人感”;情绪状态无法随对话内容流畅改变,影响沉浸体验等。SoulX-Podcast致力于解决这些核心问题,其在播客场景、通用语音合成或克隆场景下出色表现,以及生动、真实的语音体验也让该模型在开源社区发布后迅速获得关注。

作为全球最大AI开源社区,Hugging Face汇聚了超百万开发者,海量开源模型在此发布,全球活跃开发者们则“用手投票”,让高性能表现、高效易用的模型脱颖而出。SoulX-Podcast在发布第二天快速冲上Hugging Face TTS趋势榜榜首,并且在趋势总榜排名持续上升中。这也证明了行业对AI语音对话的关注,以及模型本身的较高吸引力和讨论度。

在开源社区受到广泛关注之外,SoulX-Podcast在发布后也引发了众多AI从业者、AI发烧友的讨论,以及对国产语音合成开源模型能力的认可。

Hugging Face CEO Clément Delangue 转发相关讨论内容

据了解,Soul AI团队未来将持续聚焦语音对话合成、全双工语音通话、拟人化表达、视觉交互等核心交互能力的提升,并加速技术在多样化应用场景与整体生态中的融合落地,为用户带来更加沉浸、智能且富有温度的交互体验,持续提升个体的幸福感与归属感。同时,团队将进一步深化开源生态建设,与全球开发者携手,共同拓展 AI 语音等前沿能力的边界,探索 “AI +社交” 的更多可能。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • AI日报:AI动画神器Seko 2.0上线;超强语音模型Qwen3-TTS发布;2025 年度字词候选公布

    本文介绍了近期AI领域多项重要进展:阿里发布Qwen3-TTS语音合成模型,支持49种音色和10种语言;推出全模态大模型Qwen3-Omni-Flash,支持实时流式交互。谷歌上线Gemini TTS 2.5,具备情绪化表达和多语言支持。商汤科技推出Seko 2.0,可一句话生成百集连贯动画。此外,DeepSeek入选年度汉字候选,Adobe与ChatGPT合作推出图像与PDF编辑功能,腾讯元宝AI推出QQ群消息总结功能,以及ChatGPT登顶美国苹果应用商店免费榜。这些进展展示了AI技术在语音、多模态、内容生成及日常应用方面的快速发展与普及。

  • EPR家电榜:海尔、TCL、美的位列前三

    12月11日,2025中国家电科技年会发布了“2025EPR公众对话先锋”榜单,海尔智家、TCL、美的位列前三。该榜单由中国家用电器研究院等机构联合评定,旨在表彰在生产者延伸责任(EPR)领域表现突出的企业,为行业绿色发展树立标杆。评选依据企业公开的年度报告、可持续发展报告等,系统评估其EPR责任履行及信息公开程度。近年来,家电企业持续深化EPR探索,推动行业可持续发展。以海尔为例,其构建了家电循环一体化闭环体系,在回收规模、拆解效率、再生利用方面领先行业。随着双碳目标推进,EPR已成为衡量企业可持续发展能力的重要维度,头部企业的实践为行业绿色转型提供有力借鉴。

  • AI日报:阿里Qwen3-TTS上线;可灵 AI上线主体库

    本期AI日报汇总了多项AI领域新进展:可灵AI推出“主体库”解决视频角色变脸问题;阿里Qwen3-TTS支持多语言多音色;腾讯混元2.0大模型开启内测;美团开源图像生成模型LongCat-Image;京东云支持千卡训练推动具身智能;英伟达小模型NVARC成本优势显著;微博CEO回应AI手机自主发博功能;微软推出轻量级实时TTS模型VibeVoice。

  • 首款骁龙8E5双潜望旗舰来了!OPPO Find X9 Ultra明年Q1见

    从OPPO Find X7 Ultra开始,OPPO超大杯旗舰一直延续双潜望长焦的策略,双潜望已成为OPPO影像旗舰的标签。 对比传统的单潜望镜,双潜望长焦的核心优势在于焦段更全,各类场景适应性更强。 以OPPO Find X8 Ultra为例,该机同时配备3倍潜望中焦和6倍潜望超长焦,拍人像时用3倍,背景虚化自然、肤色还原准;拍远景时用6倍,细节清晰,避免了单潜望镜一镜走天下” 的尴尬,双潜望焦

  • ChatGPT成人模式最快明年一季度上线!正测试年龄验证

    OpenAI的CEO Sam Altman此前多次暗示ChatGPT将开放成人内容,如今,相关功能的推出时间表变得更加清晰。 OpenAI应用主管Fidji Simo在近日一场关于GPT-5.2模型的简报中透露,她预计ChatGPT的成人模式”将在2026年第一季度推出。 Simo强调,在正式引入这项新功能之前,OpenAI的首要任务是确保年龄预测的准确性,目前,OpenAI正处于年龄预

  • 中东社交修罗场里,SoulChill的“慢哲学”

    常被认为是“娱乐荒漠”的中东,实则是全球社交娱乐应用竞争最激烈的战场之一。 自2016年起,这里见证了红利期的狂飙,也经历了随之而来的波折与淘汰——从早期的娱乐直播,到后续的语音社交、游戏社交、视频互动,不少产品已在短暂爆发后悄然退场。 在机遇与挑战并存的市场中,2019年进

  • 华为nova 15/Pro/Ultra上架华为商城官网

    华为nova 15系列将于12月22日14:30发布,包括nova 15、nova 15 Pro和nova 15 Ultra三款机型。nova 15延续上代设计,采用单挖孔屏;Pro和Ultra则首次采用横向大矩阵模组设计,预计搭载红枫原色镜头,提升辨识度与摄影体验。存储方面,nova 15和Pro提供12GB+256GB/512GB版本,Ultra额外增加12GB+1TB超大存储。四款时尚配色满足个性化需求,引发消费者期待。

  • AI日报:Kling 2.6将发布;千问APP推学习大模型;Z-Image-Turbo-Fun-Controlnet-Union 开源

    本期AI日报聚焦多领域AI进展:Kling 2.6发布,支持音频同步生成,AI视频进入有声时代;千问APP推出学习大模型,提升拍照答疑与作业批改能力;阿里通义实验室开源图像生成模型,实现精准控制;豆包手机助手遭遇微信登录异常,凸显生态兼容挑战;米哈游推出带猫语特色的AI聊天模型AnuNeko;亚马逊云科技发布三款新型AI智能体,其中Kiro可自主编程数日;IDC报告预测具身智能�

  • 修图神器PS引入ChatGPT:用户一句话即可编辑

    Adobe正式宣布,在ChatGPT中推出Photoshop、Express和Acrobat的集成功能。 用户现可通过对话界面,直接在ChatGPT内调用这些工具进行创作、编辑与文档处理。 Adobe数字媒体总裁David Wadhwani表示,此次集成将Adobe的创意创新能力与ChatGPT的便捷交互相结合,助力更多人轻松实现创作。 这一发布基于Adobe在对话式人工智能和模型上下文协议(MCP)领域的持续创新。此前,Adobe已推出Acrobat Stud

  • 卡萨帝抽屉洗碗机ToC转型稳居行业TOP1

    卡萨帝洗碗机连续三年线下销量第一,市场份额超90%,今年前十个月全网销售额增长130%。其成功源于全面ToC战略转型,从单品销售转向提供智慧厨房场景解决方案。新品抽屉式洗碗机通过优化开门方式、原创抽拉设计及液力悬浮科技,精准破解安装缝隙大、弯腰取放不便等用户痛点。同时,卡萨帝推出“全嵌全隐厨电+抽屉式洗碗机”组合方案,重构厨房全流程体验,并牵头制定《零嵌洗碗机》技术标准,引领行业规范发展。这一切都源于始终以用户为中心,未来将继续深化需求、产品与场景生态的结合。

今日大家都在搜的词: