11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
下面的两个有声书演播片段,你能分辨是真人还是AI合成的吗?实际上这两个小说片段都是AI合成的,方案来自于豆包语音模型团队。为了逼近一流真人主播的演播效果,豆包语音模型基于原有Seed-TTS框架进一步加入上下文理解,最终实现了高表现力、高自然度、高语义理解的小说演播效果。未来豆包语音模型会继续探索前沿科技与业务场景的结合,追求更极致的“听”体验。
今日,字节跳动豆包大模型团队宣布,豆包实时语音大模型今日正式上线,并在豆包App全量开放,将App升级至7.2.0版本即可体验。豆包实时语音大模型是一款语音理解和生成一体化的模型,实现了端到端语音对话。豆包大模型团队也坦言,现阶段的模型主要支持中文,其他语种尚未较好支持,中文范围内,模型也仅支持小部分方言和地方口音的理解和表达。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、月之暗面Kimi多模态图片理解模型API发布2025年1月15日,北京月之暗面科技有限公司正式发布了全新多模态图片理解模型moonshot-v1-vision-preview,该模型在原有moonshot-v1系列的基础上进一步增强了多模态能力,旨在帮助Kimi更好地理解世界。通过模块化设计,MiniCPM-o2.6集成了多种强大组件,支持实时处理和多语言功能。
出门问问多模态大模型又添新备案!出门问问语音大模型「序列猴子」成功通过上海市生成式人工智能服务备案,这是出门问问继「序列猴子」大模型完成相应备案后的又一次成就。出门问问将继续AIGC应用场景中深耕,借助公司的领先及先发优势,持续探索AIGC的技术与应用边界,为推动我国生成式人工智能的建设与发展贡献力量。
10月24日,趣丸科技宣布与香港中文大学联合研发的语音大模型“MaskGCT”正式在Amphion系统中开源,面向全球用户开放使用。区别于传统TTS模型,该模型采用掩码生成模型与语音表征解耦编码的创新范式,在声音克隆、跨语种合成、语音控制等任务中展现出卓越效果。以“趣丸千音”为代表的产品的出现,将加速国产短剧“走出去”,进一步推动中华文化在全球不同语境下的传播。
近日灰豚数字人发布首个为直播生的AI语音大模型。该声音大模型在我国获得多个之最。灰豚AI语音大模型还将推出独立的AI配音品牌APP,做一个让短视频创作者用得好、让人人用得起的大平台。
9月5日,在外滩大会“大模型的创造力边界与应用想象力”论坛上,大模型创业企业西湖心辰正式发布并上线国内首个端到端语音大模型“心辰Lingo”。“心辰Lingo”实现了端到端语音技术,在处理对话时直接理解语音,捕捉语气、节奏和情绪,并进行语音回复,减少了信息处理过程中的损失,让“机器”更懂人。西湖心辰已获得汤姆猫、蓝驰创投、凯泰资本、百度风投、西湖科创投,西湖教育基金会可持续发展平台等知名机构数千万美金投资。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Anthropic发布企业版AI助手ClaudeEnterpriseAnthropic最近推出了企业级AI助手ClaudeEnterprise,旨在帮助企业提升工作效率,利用内部知识资产。最新发布的Qwen2-VL视觉语言模型在多项评测中表现优异,超越业界领先的闭源模型。
社交平台SoulApp语音大模型再次升级,上线自研端到端全双工语音通话大模型,具备超低交互延迟、快速自动打断、超真实声音表达和情绪感知理解能力等特点,能够直接理解丰富的声音世界,支持超拟人化的多风格语言,实现更接近生活日常的交互对话和“类真人”的情感陪伴体验。Soul自研的端到端语音通话大模型能力已上线旗下“异世界回响”实时通话场景,并将在后续拓展至AI苟蛋等多个AI陪伴、AI互动场景。Soul将持续推进多模态端到端大模型能力建设和应用落地,以AI辅助社交、提升关系建立的质量和效率的同时,构建人机交互新场景,让用户可以与AI进行更加有温度、沉浸、趣味的互动交流,不断创新社交体验。
和喜欢的虚拟人实时通话是一种什么样的体验?近日,社交平台SoulApp语音生成大模型上线,同时自研语音大模型“伶伦”正式升级,现阶段,Soul语音大模型“伶伦”包括了语音生成大模型、语音识别大模型、语音对话大模型、音乐生成大模型等,可支持真实音色生成、语音DIY、多语言切换、多情感拟真人实时对话等能力。“伶伦”已应用于Soul“AI苟蛋”、站内狼人游戏“狼人魅影”AI语音实时互动、独立新产品“异世界回响”等场景。”基于对社交场景的深刻理解,Soul将围绕用户的实际使用场景和核心社交需求,不断提升技术能力,从AI推荐关系到AI辅助对话,从降低表达门槛到提升互动体验,推进AIGC技术与社交场景的深度融合,实现AI原生社交场景创新。