11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。
Soul App近日开源其播客语音合成模型SoulX-Podcast,专为多人多轮对话场景设计。该模型支持中、英、川、粤等多语言及方言,可生成超60分钟流畅自然、角色切换准确、韵律丰富的语音对话。除播客场景外,在通用语音合成及克隆任务中表现优异,能灵活调节节奏与副语言元素(如笑声),提升语音真实感与表现力。此次开源旨在携手开发者探索AI语音在内容创作与社交生态中的更多可能。
当地时间12日,印度航空事故调查局披露了此前印度航空波音787-8型客机坠毁事故的初步调查结果。 报告显示,飞机起飞后数秒内,两台发动机的燃油开关几乎同步从运行”位切换至切断”位,导致发动机燃料供应中断而空中熄火。 报告称,在驾驶舱语音记录中,可以听到一名飞行员向另一名飞行员提问说,为什么切断”。而另一名飞行员回答说,他没有这么做。”
今日,荣耀手表Fit正式发布,带来雅致版、活力版两种版本,售价分别为499元和699元。 荣耀手表Fit采用1.32英寸圆形AMOLED屏幕,466*466分辨率,活力版为硅胶表带、雅致版为皮表带,表体尺寸(长/宽/高)44mm x 44mm9.9mm,含表带重约44g。 荣耀手表Fit搭载Deepseek语音对话、支持AI语音对话,首发健康能量评估,可全天候计算身体能量值,并随着白天活动和睡眠状态灵敏调整,智能提醒
今日,字节跳动豆包大模型团队宣布,豆包实时语音大模型今日正式上线,并在豆包App全量开放,将App升级至7.2.0版本即可体验。豆包实时语音大模型是一款语音理解和生成一体化的模型,实现了端到端语音对话。豆包大模型团队也坦言,现阶段的模型主要支持中文,其他语种尚未较好支持,中文范围内,模型也仅支持小部分方言和地方口音的理解和表达。
在今天凌晨的OpenAI发布会上,最新升级的大模型GPT-4o正式发布。GPT-4o的o”代表omni”。OpenAI还推出了ChatGPT的桌面版应用,不过目前只有MacOS版本,Windows版要稍晚一些亮相。
**划重点:**1.🎙️实时语音转文本:利用OpenAIWhisperLive实现即时将口语转换为文本。2.🧠大型语言模型整合:集成Mistral大型语言模型,提升对转录文本的理解和上下文把握。-推理加速:利用torch.compile对WhisperSpeech进行优化,通过即时编译PyTorch代码,进一步加快了处理速度。
ChatGPT的语音功能现已免费向所有用户开放。在一篇发布在X上的帖子中,OpenAI宣布用户现在可以通过点击耳机图标,在移动应用中使用他们的声音与ChatGPT交谈,并获得语音回复。Brockman也对重返OpenAI持开放态度。
Ridgelinez是日本富士通的子公司宣布,该公司开发了一种生成式人工智能系统,可以与人进行语音交流。该系统的应用场景包括协助企业召开会议,或是为员工提供职业生涯规划的意见。该公司是富士通于2020年成立的。
近日,抖音正在内测“一起看视频”功能,将社交玩法进一步升级。该功能允许用户通过创建房间的方式,邀请好友一起观看自己正在观看的视频,并支持实时语音对话。