ElevenLabs 发布 Scribe 语音转文本模型，准确率创新高、英语达 96.7%

2025-02-27 09:56 · 来源： AIbase基地

ElevenLabs 是一家备受瞩目的人工智能语音克隆与生成初创公司，近日推出了其最新的语音转文本模型 ——Scribe v1。该模型声称在多种语言中都达到了最高的准确性，用户可以通过其官网进行体验。

根据 ElevenLabs 的基准测试，Scribe 在将口语准确转换为文本方面，超越了谷歌的 Gemini2.0Flash、OpenAI 的 Whisper v3和 Deepgram Nova-3，取得了前所未有的低错误率。该公司表示，Scribe 支持99种语言的高精度转录，其中包括在以前被忽视的语言，如塞尔维亚语、粤语和马拉雅拉姆语。

ElevenLabs 的首席研究员 Flavio Schneider 在社交平台 X 上表示，Scribe 是公司迄今发布的 “最聪明的音频理解模型”。他强调，Scribe 不仅仅是转录工具，还能理解音频内容，能够检测非语言事件（如笑声、音效、音乐和背景噪音），并在复杂环境下分析长时间的音频内容进行准确的说话者区分。值得一提的是，Scribe 能够在同一个音频文件中识别并隔离多达32位不同的说话者。

ElevenLabs 提醒用户，Scribe“最适合需要高精度转录的场合，而非实时转录”。该公司还计划推出低延迟版本，以扩大其在实时应用中的使用。

根据 FLEURS 和 Common Voice 的基准结果，Scribe 在处理现实世界音频挑战方面表现出色，尤其在意大利语（准确率98.7%）和英语(准确率96.7%)的单词错误率方面达到了最低。

Scribe 现已通过 ElevenLabs 官网和 API 提供使用，定价为每小时输入音频0.40美元，未来六周还将享受50% 的折扣。此外，针对实时应用的低延迟版本也在开发中。

对于企业决策者而言，Scribe 为高精度转录提供了一种可扩展的工具，适用于需要自动化文档、会议转录和内容可及性的行业。该模型对多种语言的高精度处理也将惠及跨国公司、媒体公司和客户支持应用。

值得注意的是，Scribe 的发布与竞争对手 Hume 的文本转语音模型 Octave 的发布同日进行。Octave 是一种基于大型语言模型的文本转语音工具，用户可以根据情感需求自定义 AI 生成的声音，旨在用于内容创作，如有声书、播客和视频游戏配音。尽管 Scribe 和 Octave 的功能不同，但二者的发布反映了 AI 驱动音频模型日益激烈的竞争。

产品入口:https://elevenlabs.io/blog/meet-scribe

划重点:
🌟 Scribe v1是 ElevenLabs 最新推出的语音转文本模型，准确率在多语言中创下新高。
🗣️ 支持99种语言，能够区分多达32位不同的说话者，适应复杂音频环境。
💰 当前定价为每小时0.40美元，未来六周享受50% 折扣，低延迟版本正在开发中。

相关推荐

荐AI日报：通义千问开源Qwen3向量模型；字节跳动图像编辑模型SeedEdit 3.0；ElevenLabs推v3语音模型

本文汇总了近期AI领域的重要动态：1)通义千问发布Qwen3-Embedding系列模型，在多语言文本处理表现优异；2)字节跳动推出图像编辑模型SeedEdit3.0，提升细节保持能力；3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha；4)Anthropic推出面向国家安全的Claude Gov模型；5)可灵AI月收入连续两月超1亿元；6)Meta公布智能眼镜Aria Gen2技术细节；7)爱诗科技上线AI视频工具"拍我AI"；8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

人工智能深度学习文本处理
OpenAI发布云端AI编程智能体Codex：代码准确率高达90%

OpenAI于5月19日正式推出基于Codex-1模型的云端AI编程智能体Codex。该工具具备强大的代码生成与理解能力，支持Python、JavaScript、C等主流语言，覆盖前后端开发、算法实现等多个领域。测试显示其处理常规编程任务的速度远超人工，代码准确率达90%以上，能显著提升开发效率。Codex深度集成GitHub，支持智能代码补全和结构化代码自动生成，使开发者平均编码时间缩短30%。目前该服务已面向ChatGPT+Pro等高级用户开放，未来有望成为软件开发领域的标配工具，推动AI辅助编程进入新阶段。

OpenAI Codex AI编程
孩子健康不能赌！血糖仪准确率排名领先的三诺是真靠谱

一位母亲分享孩子确诊1型糖尿病后的经历：起初购买无创血糖仪发现不准，差点耽误病情。后来选用三诺优佳血糖仪，其精准度通过CE和ISO认证，临床测试达标率99.2%。专利采血笔9档可调，孩子不再抗拒检测。三色指示灯直观显示血糖状态，便于及时调整饮食。与医院静脉血检测对比误差仅0.2mmol/L，医生认可其准确性。现在孩子能主动配合检测，血糖管理更科学。618期间该产品有优惠活动，建议糖友家庭趁活动入手这款可靠的健康管理工具。

1型糖尿病无创血糖仪血糖监测
年轻人氪金“塑料茅台”，Labubu养肥了谁？

去年开始，一个名叫Labubu的新系列潮玩在北美悄然走红。这个有着尖耳朵和“邪恶笑容”的小怪物，突然出现在各大社交平台的热搜榜上。从洛杉矶的网红咖啡馆到纽约的潮流买手店，年轻人开始热衷于分享自己与Labubu的合影，这种热潮像一阵风似的越刮越猛。这股风潮很快跨过大洋吹到了国内。几乎是一夜之间，泡泡玛特店门口排起了长队，地铁里能看到年轻人手机壳上�

Labubu 潮玩社交媒体
天猫618品牌成交创新高：苹果、小米、华为等217个品牌成交破亿

天猫表示，今年天猫618折扣力度堪称史上最大，使用规则也是史上最简单。在品牌官方立减85折的基础上，天猫618第二波推出全新升级88VIP大额消费券，无凑单门槛，笔笔可打9折。此外，可再叠加行业品类券、国补等优惠，部分品类低至5折。

天猫618 品牌成交消费市场
销量再创新高！鸿蒙智行端午假期全系车型大定突破10683台

，鸿蒙智行官方宣布，端午假期期间，其全系车型大定订单量突破10683台，销量再创新高。 6月1日，鸿蒙智行官方还宣布，5月全系交付新车44454辆，再次刷新交付记录，进一步巩固了其在高端汽车市场的地位。具体来看，2025款问界M9在5月交付了15481台，2025年累计交付量达到48716台；问界M8在5月交付了12116台，单周交付量突破5000台；问界新M7在5月交付了4139台；

鸿蒙智行高端汽车市场问界车型
99元的泡泡玛特溢价到2000元 LABUBU3.0系列热销

近日，泡泡玛特现象级IP LABUBU第三代搪胶毛绒产品“前方高能”系列自四月底发售以来，热度持续不减。新品上架即遭抢购，官方小程序显示预售产品要到6月15日起才发售。在二手平台

泡泡玛特 LABUBU系列搪胶毛绒产品
火山引擎推出豆包·语音播客模型：文本秒变双人对话播客，5 秒生成热点音频！

5月20日，火山引擎推出豆包·语音播客模型，实现文本秒转专业播客内容。该模型三大优势：1）自然流畅的双人对话效果，语音拟真度高；2）支持热点话题即时生成，5秒产出最新资讯播客；3）提供端到端创作链路，支持超长文本/网页链接转播客。相比传统AI播客，解决了内容重复、机械感强等问题。模型即将登陆豆包APP及PC端，6月11日将在火山引擎大会上展示更多功能。

火山引擎豆包语音播客 AI创作
极光旗下EngageLab及GPTBots双品牌通过SOC 2 Type II认证

极光旗下EngageLab和GPTBots双品牌通过SOC 2 Type II认证，彰显数据安全与国际合规能力。该认证由美国注册会计师协会制定，覆盖安全性、可用性等五大维度，验证了平台在连续数月的稳定运营表现。作为中国领先的客户互动与营销科技服务商，极光通过旗下客户互动平台EngageLab和企业级AI智能体GPTBots，为全球客户提供行业领先的数据安全保障。此次认证巩固了极光在智能客户互动与AI服务领域的行业地位，其客户覆盖科技、金融等多个领域，遍布全球多个国家和地区。

数据安全国际合规 EngageLab
荐Labubu在欧美“杀疯了”：3000亿泡泡玛特点燃海外“超级燃料”？

东南亚的火爆销量还在持续时，泡泡玛特的出海奇迹已经指向下一站:欧美。 “理财产品”Labubu第三代系列发布后，引发全球排队抢购潮，多地限购、断货售罄。据七麦数据显示，4月25日，泡泡玛特APP首次登顶美国App Store购物榜。近日，蕾哈娜、Lisa、Dua Lipa、贝克汉姆争相晒出自己的Labubu，英国伦敦发生“黄牛斗殴事件”，泡泡玛特已宣布暂停Labubu在英国的销售。

泡泡玛特 Labubu 出海销量

今日大家都在搜的词：

热文

3 天
7天

ElevenLabs 发布 Scribe 语音转文本模型，准确率创新高、英语达 96.7%

荐AI日报：通义千问开源Qwen3向量模型；字节跳动图像编辑模型SeedEdit 3.0；ElevenLabs推v3语音模型

OpenAI发布云端AI编程智能体Codex：代码准确率高达90%

孩子健康不能赌！血糖仪准确率排名领先的三诺是真靠谱

年轻人氪金“塑料茅台”，Labubu养肥了谁？

天猫618品牌成交创新高：苹果、小米、华为等217个品牌成交破亿

销量再创新高！鸿蒙智行端午假期全系车型大定突破10683台

99元的泡泡玛特溢价到2000元 LABUBU3.0系列热销

火山引擎推出豆包·语音播客模型：文本秒变双人对话播客，5 秒生成热点音频！

极光旗下EngageLab及GPTBots双品牌通过SOC 2 Type II认证

荐Labubu在欧美“杀疯了”：3000亿泡泡玛特点燃海外“超级燃料”？

今日大家都在搜的词：

热文

华为Pura 80 Pro/Pro+在华为官方商城上架

迅雷完成对虎扑的收购斥资5个亿

小鹏宣布将联手华为打造“世界上最好”的AR-HUD

站长商机

​ElevenLabs 发布 Scribe 语音转文本模型，准确率创新高、英语达 96.7%

今日大家都在搜的词：

热文

站长商机

ElevenLabs 发布 Scribe 语音转文本模型，准确率创新高、英语达 96.7%