2025 年 8 月 20 日,全球领先的 AI 语音技术公司 ElevenLabs 正式宣布推出其最新的 Eleven v3 Alpha API,为开发者提供了一个突破性的文本转语音(Text-to-Speech, TTS)工具。
Eleven v3 Alpha API 被誉为“地球上最具表现力的文本转语音模型”,其核心优势在于支持超过 70 种语言,能够生成自然、流畅且富有情感的语音输出。
该 API 引入了全新的对话模式(Dialogue Mode),允许开发者创建多角色对话场景,支持无限数量的虚拟角色,并能处理语气变化、情感波动和对话中的自然中断。这种功能使其特别适用于制作多角色互动的音频内容,例如有声书、互动游戏叙述和多媒体项目。
此外,Eleven v3 Alpha API 还支持高级音频标签(Audio Tags)功能,开发者可以通过在脚本中插入如 [happy]、[whispering] 或 [sighs] 等标签,精确控制语音的语气、情感和节奏。这种技术突破使得 AI 语音不仅能“说话”,还能“表演”,为用户带来更真实、更具沉浸感的听觉体验。例如,开发者可以轻松实现从戏剧性独白到轻松幽默对话的动态语音生成。