首页 > AI头条  > 正文

​ElevenLabs 发布 Scribe 语音转文本模型,准确率创新高、英语达 96.7%

2025-02-27 09:56 · 来源: AIbase基地

ElevenLabs 是一家备受瞩目的人工智能语音克隆与生成初创公司,近日推出了其最新的语音转文本模型 ——Scribe v1。该模型声称在多种语言中都达到了最高的准确性,用户可以通过其官网进行体验。

QQ_1740621264139.png

根据 ElevenLabs 的基准测试,Scribe 在将口语准确转换为文本方面,超越了谷歌的 Gemini2.0Flash、OpenAI 的 Whisper v3和 Deepgram Nova-3,取得了前所未有的低错误率。该公司表示,Scribe 支持99种语言的高精度转录,其中包括在以前被忽视的语言,如塞尔维亚语、粤语和马拉雅拉姆语。

ElevenLabs 的首席研究员 Flavio Schneider 在社交平台 X 上表示,Scribe 是公司迄今发布的 “最聪明的音频理解模型”。他强调,Scribe 不仅仅是转录工具,还能理解音频内容,能够检测非语言事件(如笑声、音效、音乐和背景噪音),并在复杂环境下分析长时间的音频内容进行准确的说话者区分。值得一提的是,Scribe 能够在同一个音频文件中识别并隔离多达32位不同的说话者。

QQ_1740621326377.png

ElevenLabs 提醒用户,Scribe“最适合需要高精度转录的场合,而非实时转录”。该公司还计划推出低延迟版本,以扩大其在实时应用中的使用。

根据 FLEURS 和 Common Voice 的基准结果,Scribe 在处理现实世界音频挑战方面表现出色,尤其在意大利语(准确率98.7%)和英语(准确率96.7%)的单词错误率方面达到了最低

Scribe 现已通过 ElevenLabs 官网和 API 提供使用,定价为每小时输入音频0.40美元,未来六周还将享受50% 的折扣。此外,针对实时应用的低延迟版本也在开发中。

对于企业决策者而言,Scribe 为高精度转录提供了一种可扩展的工具,适用于需要自动化文档、会议转录和内容可及性的行业。该模型对多种语言的高精度处理也将惠及跨国公司、媒体公司和客户支持应用。

值得注意的是,Scribe 的发布与竞争对手 Hume 的文本转语音模型 Octave 的发布同日进行。Octave 是一种基于大型语言模型的文本转语音工具,用户可以根据情感需求自定义 AI 生成的声音,旨在用于内容创作,如有声书、播客和视频游戏配音。尽管 Scribe 和 Octave 的功能不同,但二者的发布反映了 AI 驱动音频模型日益激烈的竞争。

产品入口:https://elevenlabs.io/blog/meet-scribe

划重点:  

🌟 Scribe v1是 ElevenLabs 最新推出的语音转文本模型,准确率在多语言中创下新高。  

🗣️ 支持99种语言,能够区分多达32位不同的说话者,适应复杂音频环境。  

💰 当前定价为每小时0.40美元,未来六周享受50% 折扣,低延迟版本正在开发中。

  • 相关推荐
  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • OpenAI发布云端AI编程智能体Codex:代码准确率高达90%

    OpenAI于5月19日正式推出基于Codex-1模型的云端AI编程智能体Codex。该工具具备强大的代码生成与理解能力,支持Python、JavaScript、C等主流语言,覆盖前后端开发、算法实现等多个领域。测试显示其处理常规编程任务的速度远超人工,代码准确率达90%以上,能显著提升开发效率。Codex深度集成GitHub,支持智能代码补全和结构化代码自动生成,使开发者平均编码时间缩短30%。目前该服务已面向ChatGPT+Pro等高级用户开放,未来有望成为软件开发领域的标配工具,推动AI辅助编程进入新阶段。

  • 孩子健康不能赌!血糖仪准确率排名领先的三诺是真靠谱

    一位母亲分享孩子确诊1型糖尿病后的经历:起初购买无创血糖仪发现不准,差点耽误病情。后来选用三诺优佳血糖仪,其精准度通过CE和ISO认证,临床测试达标率99.2%。专利采血笔9档可调,孩子不再抗拒检测。三色指示灯直观显示血糖状态,便于及时调整饮食。与医院静脉血检测对比误差仅0.2mmol/L,医生认可其准确性。现在孩子能主动配合检测,血糖管理更科学。618期间该产品有优惠活动,建议糖友家庭趁活动入手这款可靠的健康管理工具。

  • 年轻人氪金“塑料茅台”,Labubu养肥了谁?

    去年开始,一个名叫Labubu的新系列潮玩在北美悄然走红。 这个有着尖耳朵和“邪恶笑容”的小怪物,突然出现在各大社交平台的热搜榜上。从洛杉矶的网红咖啡馆到纽约的潮流买手店,年轻人开始热衷于分享自己与Labubu的合影,这种热潮像一阵风似的越刮越猛。 这股风潮很快跨过大洋吹到了国内。几乎是一夜之间,泡泡玛特店门口排起了长队,地铁里能看到年轻人手机壳上�

  • 天猫618品牌成交创新高:苹果、小米、华为等217个品牌成交破亿

    天猫表示,今年天猫618折扣力度堪称史上最大,使用规则也是史上最简单。 在品牌官方立减85折的基础上,天猫618第二波推出全新升级88VIP大额消费券,无凑单门槛,笔笔可打9折。 此外,可再叠加行业品类券、国补等优惠,部分品类低至5折。

  • 销量再创新高!鸿蒙智行端午假期全系车型大定突破10683台

    ,鸿蒙智行官方宣布,端午假期期间,其全系车型大定订单量突破10683台,销量再创新高。 6月1日,鸿蒙智行官方还宣布,5月全系交付新车44454辆,再次刷新交付记录,进一步巩固了其在高端汽车市场的地位。 具体来看,2025款问界M9在5月交付了15481台,2025年累计交付量达到48716台; 问界M8在5月交付了12116台,单周交付量突破5000台; 问界新M7在5月交付了4139台;

  • 99元的泡泡玛特溢价到2000元 LABUBU3.0系列热销

    近日,泡泡玛特现象级IP LABUBU第三代搪胶毛绒产品“前方高能”系列自四月底发售以来,热度持续不减。新品上架即遭抢购,官方小程序显示预售产品要到6月15日起才发售。 在二手平台

  • 火山引擎推出豆包·语音播客模型文本秒变双人对话播客,5 秒生成热点音频!

    5月20日,火山引擎推出豆包·语音播客模型,实现文本秒转专业播客内容。该模型三大优势:1)自然流畅的双人对话效果,语音拟真度高;2)支持热点话题即时生成,5秒产出最新资讯播客;3)提供端到端创作链路,支持超长文本/网页链接转播客。相比传统AI播客,解决了内容重复、机械感强等问题。模型即将登陆豆包APP及PC端,6月11日将在火山引擎大会上展示更多功能。

  • 极光旗下EngageLab及GPTBots双品牌通过SOC 2 Type II认证

    极光旗下EngageLab和GPTBots双品牌通过SOC 2 Type II认证,彰显数据安全与国际合规能力。该认证由美国注册会计师协会制定,覆盖安全性、可用性等五大维度,验证了平台在连续数月的稳定运营表现。作为中国领先的客户互动与营销科技服务商,极光通过旗下客户互动平台EngageLab和企业级AI智能体GPTBots,为全球客户提供行业领先的数据安全保障。此次认证巩固了极光在智能客户互动与AI服务领域的行业地位,其客户覆盖科技、金融等多个领域,遍布全球多个国家和地区。

  • Labubu在欧美“杀疯了”:3000亿泡泡玛特点燃海外“超级燃料”?

    东南亚的火爆销量还在持续时,泡泡玛特的出海奇迹已经指向下一站:欧美。 “理财产品”Labubu第三代系列发布后,引发全球排队抢购潮,多地限购、断货售罄。 据七麦数据显示,4月25日,泡泡玛特APP首次登顶美国App Store购物榜。近日,蕾哈娜、Lisa、Dua Lipa、贝克汉姆争相晒出自己的Labubu,英国伦敦发生“黄牛斗殴事件”,泡泡玛特已宣布暂停Labubu在英国的销售。

今日大家都在搜的词: