首页 > AI头条  > 正文

小红书开源的语音识别模型FireRedASR,中文识别准确率优越

2025-02-12 09:14 · 来源: AIbase基地

在语音识别领域,中文识别的技术发展一直备受关注。近日,小红书的 FireRed 团队发布了一个全新的开源语音识别模型 ——FireRedASR。这个基于大模型的语音识别系统在多个标准测试集上取得了优异的成绩,标志着中文语音识别技术的一次重大突破。

144649d6-0590-4a91-b080-0db2afdf54a9.png

FireRedASR 的核心指标是字错误率(CER),该指标越低,表示模型的识别效果越好。在最近的公开测试中,FireRedASR 的 CER 达到了3.05%,较之前的最佳模型 Seed-ASR 降低了8.4%。这一结果显示出 FireRed 团队在语音识别技术上的创新能力。

FireRedASR 模型分为两种核心结构:FireRedASR-LLM 和 FireRedASR-AED。前者专注于极致的语音识别精度,后者则在准确率与推理效率之间实现了良好的平衡。团队提供了不同规模的模型和推理代码,以满足各种应用场景的需求。

在多个日常应用场景中,FireRedASR 同样展现了强大的性能。在由短视频、直播和语音输入等多种来源组成的测试集中,FireRedASR-LLM 的 CER 相较于业内领先的服务提供商降低了23.7% 至40%。特别是在需要歌词识别的场景中,该模型的表现尤为突出,CER 实现了50.2% 至66.7% 的相对降低。

此外,FireRedASR 还在中文方言和英语场景中表现优异,其 CER 在 KeSpeech 和 LibriSpeech 测试集上显著优于之前的开源模型,证明其在多种语言环境中的鲁棒性和适应性。

FireRed 团队希望通过开源这一新模型,推动语音识别技术的发展和应用,为语音交互的未来贡献力量。所有模型和代码已在 GitHub 上公开,鼓励更多开发者和研究者参与其中。

huggingface:https://huggingface.co/FireRedTeam

github:https://github.com/FireRedTeam/FireRedASR

划重点:

- 🎤 FireRedASR 是小红书团队新发布的开源语音识别模型,中文识别准确率表现优异。

- 🚀 模型分为 FireRedASR-LLM 和 FireRedASR-AED,分别针对精度和效率需求。

- 🌍 FireRedASR 在多种场景下表现优异,适用于普通话、中文方言及英语等多种语言环境。

  • 相关推荐
  • 小红书评论区,被麦霸占领了

    原来大家只是不爱去KTV了,不是不爱唱歌了。 最近点开小红书,经常出现一些点赞只有十几个,评论却成百上千条的“点歌帖”。发帖人一句“进来唱两句”,评论区挤满了语音条,各种歌声此起彼伏,宛如一个即时响应的“互联网电子K歌房”。

  • Hugging Face创始人x小红书技术副总裁对谈:开源、AI与技术人的成长

    小红书科技与Red++ Academy在1024程序员节举办直播,技术副总裁凯奇、语音模型负责人风龙与Hugging Face联合创始人Thomas Wolf围绕三大核心观点展开AMA对话:AI编程正成为基础能力;开源是技术发展的核心引擎;实现有"人味"的AGI路径清晰但仍需攻克创造力、复杂环境感知等难题。讨论覆盖开源价值、AGI发展瓶颈、AI人味化实践,强调技术人需提升问题定义与框架性解决能力,并分享了AI编码提效、学习新技术的方法。直播展现小红书从文本模型到语音模型的开源布局,旨在降低技术使用门槛,推动社区共进。

  • 小红书,正在批量造富

    小红书员工身价又要涨了。 10月17日,小红书正式宣布上调员工期权价格,并即时生效: 调整后,授予价为25美元/股,行权价2美元/股,每股收益23美元。同时,在职回购价也会相应上调,具体以回购窗口开启时的通知为准。 这是今年小红书第三次上调期权价格,相比3月

  • 当小红书和高德坐在同一牌桌

    千团大战后,沉寂多年的「本地生活」赛道战火重燃,新旧玩家再次竞逐万亿市场。 淘宝闪购一夜之间成为阿里最强增长板块,小红书推出「小红卡」以会员制探索新路径,高德「扫街榜」上线首日访问量超4000万。而此前京东高调入局外卖行业,抖音和快手本地生活也在寻求差异化突破。 如果算上原本布局最深的美团,以及借助小程序渗透的微信,本地生活大概是汇聚互联

  • 低门槛、0保证金:小红书能“复制”闲鱼吗?

    ​近期,小红书开始内测“快捷售卖”功能,用户只需账号注册时间大于180天并完成个人专业号认证,即可免保证金申请体验这一新功能。 这标志着内容社区起家的小红书正式进军二手电商市场。与以往需要开设店铺并缴纳1000元保证金的复杂流程不同,“快捷售卖”功能更为轻便,相当于为普通用户开放了一个“个人小卖部”。

  • 创立不到一年,月度GMV超5千万,这家MCN如何抓住小红书电商红利

    尽管小红书电商规模未知,却是为数不多还有红利机会的平台。前段时间,小红书把电商升级为一级入口,「市集」放入App主界面,同时面向商家发布「百万免佣计划」。这些动作都明示了小红书对电商投入程度不断提升。 不少MCN机构心动但没有头绪——小红书上的MCN多以扶持博主内容变现,直播电商变现经验不足;不同平台调性、电商氛围、推流逻辑不同,又决定了有直播�

  • DeepSeek开源3B OCR模型:长文本识别达97%精度

    DeepSeek在GitHub开源新一代OCR模型,采用创新光学二维映射压缩技术,在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌,较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率,显著优于同类模型。该技术路径为OCR系统小型化提供解决方案,其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

  • 专注供应链单据识别 | 运小沓AI单证平台,单据识别提效500%

    供应链数字化进程中,单证处理效率低下是行业痛点。海运/空运托书、报关草单等核心单证格式复杂、人工录入易错,通用识别工具难以适配。运小藄AI单证平台通过自研大模型实现"无需定制、一键识别、精准高效"的智能处理,覆盖全场景单证类型,支持无缝对接业务系统。实际应用显示:托书录入效率提升500%,错误率降至0.1%以下;报关草单制单效率提升300%,有效解决"订舱等不起、报关错不起、定制用不起"三大难题。

  • 摸着闲鱼过河,小红书放闸二手生意

    给市集一级入口、扶持电商上C位,推出“小红卡”加码本地生活业务之后,小红书又盯上了二手电商市场。 近期,小红书正在内测“快捷售卖”新功能,用户可以在笔记下方直接挂上想卖的闲置商品链接,或者在跟别人聊天的时候,直接把商品卡片发过去。

  • 小红书崩了上热搜 客服回应:已在尽快处理

    10月13日,小红书App出现系统故障,页面卡顿、无法刷新,提示“前方道路拥挤,请稍后再试”。用户还遭遇网页版掉线、无法扫码登录、浏览记录消失、被退出群聊等问题。相关话题迅速登上微博热搜,引发广泛讨论。小红书客服回应称已同步反馈问题,技术人员正紧急处理,力求尽快恢复,并对不佳体验深表歉意。

今日大家都在搜的词: