首页 > 业界 > 关键词  > 语音识别大模型最新资讯  > 正文

阿里通义推出语音识别大模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系

2026-04-20 17:34 · 稿源: 快科技

快科技4月20日消息,据媒体报道,阿里通义实验室近期正式发布了语音识别模型Fun-ASR1.5版本。

该模型采用统一的大模型架构,仅需单一模型即可无缝覆盖30种语言、汉语七大方言体系以及20余种地方口音,甚至能够精准转写古诗词吟诵。

测试数据显示,在典型方言场景下,字错误率(CER)相对下降了56.2%。目前已有5种方言的识别准确率突破90%,15种方言的准确率超过80%。

阿里通义推出语音识别模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系

Fun-ASR1.5还具备智能语音内容整理功能:可自动为长句添加标点符号,并将口语化的数字、日期、金额、手机号等统一转换为标准书面格式。

在会议纪要、采访录音、司法笔录整理等场景中,该功能能够显著减少人工校对的工作量。

阿里通义推出语音识别模型Fun-ASR1.5:覆盖30种语言 支持汉语七大方言体系

用户既可以通过阿里云百炼平台调用该模型的API,也可前往魔搭社区免费在线体验Fun-ASR1.5的全部功能。

阿里云百炼:https://bailian.console.aliyun.com/cn-beijing?tab=model#/efm/model_experience_center/voice?modelId=fun-asr

魔搭社区:https://modelscope.cn/studios/iic/FunAudio-ASR

举报

  • 相关推荐
  • 模型即审美:生图模型们正建起自己的“视觉方言”

    ​最近在测试各种AI生图模型的时候,我们发现了一个现象:同样一个提示词,丢给不同的模型,出来的图片风格差异大到像是出自不同摄影流派。 Image-2生成的图就像我昨天随手拍的,但Nano Banana生成的图感觉像某个家居品牌的广告大片。有些模型执着于捕捉现实的每一丝瑕疵,有些则痴迷于把日常场景变成精致的艺术品。这背后反映的不是能力差别,而是每个模型对"什么

  • 改写语音交互行规,豆包大模型更稳了

    豆包大模型,又上新了。 2026年4月9日,原生全双工语音大模型Seeduplex正式发布,相比上一代半双工豆包端到端语音模型,新模型基于“边听边说”的全新框架设计,交互体验的自然感、顺畅度大幅提升,目前已在豆包App全量上线。 这意味着,前沿的全双工语音技术,第一次实现商业规模化落地。 而依托全双工语音技术,豆包的语音交互不再是机械式的一问一答,而是收放�

  • AI日报:腾讯云QClaw发布文件空间;阿里通义千问接入淘宝;微信推AI支付等功能

    本日AI日报涵盖八大热点:腾讯云QClaw发布“文件空间”打通生态;微信4月大升级引入AI支付;阿里通义千问接入淘宝重塑购物体验;Google升级Gemini API文件搜索;阶跃星辰StepAudio2.5语音模型位列全球前三;贾跃亭重返法拉第未来转型物理AI公司;中国AI大模型周调用量2.11倍反超美国;MiniMax关联公司增资至40亿元。

  • 从实验室数据到实际听感:值得信赖的国产解码器品牌

    判断解码器好坏不能仅凭耳朵“猜”,信噪比、总谐波失真、时钟抖动抑制等实验室冰冷数字才是硬指标。如今国产解码器如拓品DX5II(THD+N低至0.00006%、信噪比133dB)和双木三林DL200等,已在客观测试上突飞猛进。选购时需关注客观声学指标、核心解码架构与时钟管理技术。五大主流Hi-Fi品牌(拓品、飞傲、山灵、双木三林、矩声)各有特色,均经得起仪器检验与耳朵细品。从参数到听感,国产解码器已做到“参数能打、听感能赢”,下次选解码器,让数据帮你做理性选择。

  • 微信又有新功能 网友:好用 长截图、发语音等上线

    长期以来,电脑端微信在操作便捷性上一直被用户吐槽,不少功能不得不依赖手机端完成。不过这一局面正在改变,微信电脑版近日推送了4.1.9版本更新,一口气上线了多项贴近日常使用的实用功能。 此次更新中最受关注的当属滚动长截图功能。过去在电脑上想要截取一篇长文章或一段完整的聊天记录,往往需要分多次截屏,再手动拼接,过程繁琐且容易出错。新版本上线后�

  • AI日报:千问PC端上线AI语音输入;字节发布全模态大模型Doubao-Seed-2.0-lite;谷歌更新AI搜索功能

    本期AI日报涵盖多项重要进展:千问PC端上线AI语音输入,提升办公效率;字节跳动发布全模态大模型Doubao-Seed-2.0-lite,实现视频、图像、音频与文本统一理解;腾讯联合多所高校推出开源多模态深度搜索智能体方案OpenSearch-VL;月之暗面申请“KimiClaw”商标,或涉硬件领域;Mininglamp开源Cider和Mano-P,打造本地AI工作站;OpenAI携手硬件巨头发布MRC协议,解决GPU闲置浪费;谷歌升级AI搜索功能,整合Reddit等社交观点;xAI推出Grok Imagine API质量模式,提升图像生成写实度。

  • 微信大改动!未读语音由红变灰被用户疯狂吐槽 腾讯回应

    近期不少iOS用户更新微信后发现,未读语音消息的提示色由醒目的红色变为灰色,该改动引发了大量用户吐槽与热议。 灰色未读语音与已读消息视觉高度相近,用户稍不留意就会忽略未读内容,不少人反馈因此错过工作通知、亲友重要信息,长期形成的红色提醒习惯被打破,使用体验明显下降。 腾讯客服对此回应称:未读语音变灰是iOS端未读模式”功能的灰度测试,属于阶�

  • 千问电脑版上线AI语音输入法功能

    千问电脑版正式上线AI语音输入法,全面开放免费使用。用户只需按下快捷键(Windows右Alt键/Mac右Command键),即可在微博、QQ邮箱、PS等桌面应用中直接调用。该功能支持“边想边说、边说边改”,自动去除口语化表达如“嗯”“啊”,并进行纠错和格式化。此外,它还能结合上下文智能回复,支持创作、问答、翻译等指令,如自动生成邮件回复、制作PPT、整理表格或输出Word文档,大幅提升办公效率。

  • 微信PC版大更新:长截图、发语音、表情连发都来了

    微信电脑版4.1.9版本更新,新增滚动长截图功能,用户只需截图后选择滚动截图并滑动鼠标滚轮,即可完整保存长文章。同时支持直接发送语音,点击话筒图标或按Alt键即可说话,快捷键可自定义设置。表情输入也更便捷,选择后按方向键可快速复制发送,无需重复点选。这些实用功能贴近日常需求,更新后即可使用,让办公聊天更省事。

  • 微信未读语音消息变灰 腾讯客服回应: iOS 端逐步开放

    近日,多位网友在社交平台上发帖称,更新微信版本后,发现未读的语音消息显示由原本的红色变成了灰色,这一变化引发了不少网友的吐槽。有网友表示,因为颜色变化,自己会经常误以为语音消息已经读过了,从而错过了一些重要信息。

今日大家都在搜的词: