快科技4月20日消息,据媒体报道,阿里通义实验室近期正式发布了语音识别模型Fun-ASR1.5版本。
该模型采用统一的大模型架构,仅需单一模型即可无缝覆盖30种语言、汉语七大方言体系以及20余种地方口音,甚至能够精准转写古诗词吟诵。
测试数据显示,在典型方言场景下,字错误率(CER)相对下降了56.2%。目前已有5种方言的识别准确率突破90%,15种方言的准确率超过80%。

Fun-ASR1.5还具备智能语音内容整理功能:可自动为长句添加标点符号,并将口语化的数字、日期、金额、手机号等统一转换为标准书面格式。
在会议纪要、采访录音、司法笔录整理等场景中,该功能能够显著减少人工校对的工作量。

用户既可以通过阿里云百炼平台调用该模型的API,也可前往魔搭社区免费在线体验Fun-ASR1.5的全部功能。
阿里云百炼:https://bailian.console.aliyun.com/cn-beijing?tab=model#/efm/model_experience_center/voice?modelId=fun-asr
魔搭社区:https://modelscope.cn/studios/iic/FunAudio-ASR
(举报)
