首页 > 传媒 > 关键词 > 思必驰最新资讯 > 正文

能听懂“方言”的AI,思必驰“方言识别”如何做到的?

2021-07-15 18:07 · 稿源:站长之家用户投稿

不论是“勒是雾都”的重庆,还是遍地“靓女靓仔”的广东,“吴侬软语”的江浙,方言都是各地极具特色文化名片。一方面,方言附着极大的亲切感,另一方面,方言也承载着各地强烈的情感认同与文化价值。

科技发展中的语言交流,不能遮蔽地方性的文化和知识。

考虑方言识别存在文化保护的更高立意,同时也在将老年、弱势群体并入科技生活。思必驰放大全链路语音系统应用在方言的识别、理解、合成上,在家居、银行大厅等应用场景落地,形成了能听懂“方言”的医疗陪伴音箱、智能客服机器人等多样化的产品,可识别粤语、四川话等多种方言。

语音识别的“软肋”-口音、方言

语音识别好比机器的“听觉系统”,让机器通过识别、理解,将语音信号转变为可理解的文本。汉语语音识别的研究起始于70 年代,经历四十余年发展,得益于技术的演进和海量数据的积累,一般场景下普通话识别都能达到较好的识别效果。但“口音、方言”仍是全球诸多人机交互公司共同面对的挑战。

为了探究方言、口音对语音识别系统的影响,2018 年华盛顿邮报,Globalme 、Pulse Labs (语音研究公司)合作,对市场主流智能音箱进行测试,事实证明智能音箱不能对方言“通吃”。

方言识别究竟难在哪?

多音多义,使用情境各不同。以中文为例,不仅是在文字使用习惯上(例如,“老后悔了”),读音上也存在差异性(“插”读“擦”,“胡”读“福”)。标准普通话由21 个声母和39 个韵母组成,上海方言中却包含34 个声母和54 个韵母,不同方言就是不同数量的声韵母组合。同时,语音识别是一个强场景关联的技术,不同使用情境,方言识别效果存有差异。针对性的声学模型+语言模型训练是一个长期的过程。

需要丰富的语料用以训练。可以理解为机器的“词汇量”,思必驰基于多年语音交互领域的研究,积累了大量基于场景化的数据,铢积寸累地汲取方言语料,不断更新、完善语音数据资源库的建设。

需要持续地研究文化、语素、音素,专业人士、方言专家的参与,会让方言识别效果事半功倍。

低资源环境,如何保证识别准确率?

面对低资源环境,如何提升语音识别准确率?思必驰研发了多种跨语言预训练、联合学习、迁移学习的技术,使用较少的数据,来实现方言识别效果的提升。

跨语言预训练模型

跨语言预训练,简言之,就是利用大量的有监督或无监督文本,例如用普通话来作为它的基底得到通用的预训练模型,在此基础上叠加少量的方言数据进行模型训练。伴随后期积累起来的方言、垂直场景数据。“炼丹炉”就可以不断提高模型性能表现,从而提升识别率。

多语言联合学习,例如考虑到贵州、四川地理位置上的接近性,因而语言近似性较高。在方言数据样本低资源下,思必驰将近似性语言进行联合学习,从而降低模型的识别难度。

自研的小样本迁移学习技术,用较少的数据量,可以快速实现场景体验优化。例如使用少量带标注的文本数据,即可对标点断句进行优化,相对传统模式调优,节省了83%的数据量。

使用联合学习和迁移学习的识别后处理技术

在实际应用中,满足大规模快速自定制的模型,是企业方的切实需求,一是低门槛快速定制,二是能拥有足够的自主权。思必驰方言识别技术,同时具备快速高效的场景化定制能力。通过数据的快速收集和场景模拟,结合自主研发的识别模型自训练系统,短时间内显著提升方言识别模型在应用领域的效果,满足业务需求。

对于有多语言混合需求的集成商,思必驰运用多混合识别模型,在完成识别特定方言的同时,还可识别普通话,最多支持十多种方言的识别。例如,中川混读模型可以同时识别四川话和普通话。

目前,思必驰提供基于云+端混合引擎的连续语音识别,支持四川话、粤语、上海话、闽南语、陕西话、山东话等十几种方言识别

轻松识别方言,让交互更有温度

探索人机交互的自然、流畅发展,语言的交流一定要足够人性化。

重庆农商行客服机器人刷屏朋友圈,TA能听懂四川话,顺畅完成余额查询、转账等操作,面对说惯了四川话的老一辈人们,这个功能太友好。

基于广泛的生活场景,思必驰与合作伙伴一起将人性化交互的主动权交给用户,聆听更多“新声”。

在家里,美的空调/热水器烤箱等产品均支持多种方言(粤语,四川话,山东话,上海话)识别,方言转普通话等模式,各色乡音无缝交流。思必驰智能医疗音箱亦能听懂方言、重口音普通话,充当家庭医生安心相伴。

汽车里,支持四川话的语音识别服务,导航都略带一丝“麻辣味”。某城市地铁站内,自助售票机支持普通话/中英混合/英语/粤川沪等多语种及方言的识别,准确识别“𧒽(lei)岗站、“东涌(chong)站”等冷门、多音字的站名,乘客语音问询、购票更自由。

会议室里,语音识别入乡随俗,用“方言”的特技展现出出色的工作能力。

伴随AI语音技术普惠式发展并逐渐下沉,让不会拼音、不会普通话,只会方言的老年人,可以通过方言识别实现无障碍交流,这是可见的事实。广袤的华夏大地,科技反哺传统,正守护着多彩语言文化的灿烂文明。

当下来讲,加强对“方言字词”、“方言音标”标准化建设,让TA更懂人们的声音。未来随着语音识别自适应能力越强,不受特定人、口音、方言的影响的识别技术将指日可待。

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务。

  • 相关推荐
  • 大家在看
  • 开黑对话更清晰 思必驰打造“无噪”电竞新场景

    现代社会“万物皆可内卷化”已然变成了一个常态。对于多数人来说,组队玩游戏开黑正在变成大家的生活调味剂,犹如潘多拉魔盒拥有无限吸引力。在疫情的推动下,随着国家政策陆续落地,电竞行业正在全面“起飞”。 2020 年 12 月,电竞被批准成为 2022 年杭州亚运会正式项目; 2021 年 4 月,国际奥委会首次举办奥林匹克虚拟系列赛。艾瑞咨询《 2021 年中国电竞行业研究报告》显示, 2020 年国内电竞市场规模超 1450 亿元,国内电竞用

  • 语音、手势、触控、人脸等,思必驰多模态交互开启智能经济时代

    人类的交互通道有眼耳鼻舌口等器官,他们充当着外在世界信号的“接收器”,将范围内的信号接收并传递给“大脑”。在机器世界里,从过去鼠标键盘转变成当下的触控、语音、手势、视觉等,多模态人机交互技术正在彼此融合。目前智能语音具备兼顾老人、儿童以及地方方言的能力,语音与视觉,触屏,LCD反馈显示结合的交互体验,令交互门槛的不断降低。国内专业的对话式AI企业思必驰,结合全链路语音交互技术及自研计算机视觉技术推出多?

  • 把握关键技术优势,思必驰用服务力迎接智能汽车的上行时代

    碳中和发展背景下,新能源汽车推动了中国能源行业重组。借力打破技术壁垒,更深地构建起了中国汽车工业产业自信。按照国家规划的发展愿景, 2025 年新能源汽车新车销量达到销售总量的20%左右,到 2035 年纯电动汽车将成为车辆销售的主流。从消费数据来看, 2021 年的乘用车市场已进入以增购为主的存量时代,追求品质生活的消费升级仍是大势。政策、供需的拉动,新能源汽车产业保持高速增长,也繁荣了二级市场。动力电池龙头企业宁?

  • 腾讯公开“车辆违章识别方法”相关专利

    腾讯科技(深圳)有限公司公开“车辆违章识别方法与装置、介质及电子设备”专利,公开号为CN112991749A。

  • iPhone 13不会有指纹识别 iPhone 14部分机型有望支持屏下指纹识别

    据国外媒体报道,对于苹果将在今年下半年推出的iPhone 13,外媒称不会有指纹识别,但明年将推出的iPhone 14,部分机型有望支持屏下指纹识别。

  • OPPO公开空中书写轨迹识别专利

    【TechWeb】企查查APP显示,近日,OPPO广东移动通信有限公司公开一项名为“空中书写轨迹识别方法、装置、存储介质及电子设备”的专利,申请日期为2021年3月。企查查专利摘要显示,采用本申请实施例,可以提高空中书写轨迹识别的准确率。

  • 欧科云链反欺诈考试:一起来测测你的识别骗局能力值

    6 月29 日,又到了全国反诈宣传日。其实很多人会觉得自己离诈骗很远,因为生活在互联网下我们一直保持很强的警惕心,但随着个人隐私被泄露得越来越频繁,我们有可能会不自知地进入诈骗份子视线,尤其在金融领域。这里有一份欧科云链安全团队出品的《反诈考卷》,看看你的反欺诈能力,究竟有多高,文末附正确答案。选择题(每题5 分)张三看到共享单车上一则广告,只要去办理银行卡、电话卡,然后申办营业执照和对公账户,每办一套?

  • 识别虚假微粒贷APP,千万别点击非法链接

    昨天,有网友反馈在某网站可以下载微粒贷APP。小编打开这个网站发现,这是一个假借微粒贷名义开设的虚假网站,目的是为了骗钱。在此提醒大家,千万不要点击非法链接下载假冒的微粒贷APP,使用微粒贷一定要在官方渠道申请。微粒贷开通据小编了解,微粒贷采用官方邀请制,受邀用户可以在微信支付或者手Q钱包看到微粒贷入口,进行申请或使用。一些违法分子利用微粒贷没有APP和非受邀用户无法主动申请等原因,制作假冒的微粒贷APP或虚?

  • 解码海睿科技虫情灯,点位计数+ AI识别,虫情预测更精准

    长久以来,农业病虫害一直是令农户头痛的问题。传统人工植保不仅需要的人手多、费用高,效率和安全问题也难以得到保障,而科技植保设备在农业领域的应用,使降本增效成为可能。要知道,对于虫害防治最重要的是预防。在未造成灾害性损失之前,采取“治早、治小”预防措施,这一点在农业生产中尤为重要。因此以科技加持,精准数据为支撑,及早发现虫害踪迹,识别其种类及数量,进一步加强虫害监测预警,才能够更好的把损失降到最低。

  • 雷霆暴风新款科技飞机杯有望加入脸部识别指纹解锁

    近日有消息称,即将于今年9月份发布的新款iPhone(iPhone13或iPhone12s)的高配版或支持屏幕指纹技术。面对一项已经被安卓手机嚼烂了的技术,而网友表示现在的iPhone用与不用都有些“下不来台”。虽然这个屏幕指纹功能在手机上已经是司空见惯的功能,并不会给消费者太大惊喜。但是雷霆暴风发话了,将要推出一款搭载脸部识别和指纹解锁的科技飞机杯,这就很震惊了。为此,小编专门联系了雷霆暴风的相关负责人,去了解一下这是什么新

  • OPPO“支持全屏指纹识别的模组”相关专利获授权

    6月15日,OPPO广东移动通信有限公司“一种支持全屏指纹识别的模组、终端设备及指纹识别方法”专利获授权,公开号为CN108615032B。

  • 支付宝上线宠物“防走丢”功能 应用宠物鼻纹识别技术

    今天,支付宝上线了宠物“防走丢”功能,利用蚂蚁集团旗下蚂蚁保险平台研发的宠物鼻纹识别技术,帮助铲屎官为自己的宠物建档。

  • 三维技术增强后的嫌疑人面容可提高目击者的识别准确度

    伯明翰大学心理学院的一个研究小组开发并测试了新的交互式排队软件,该软件使目击者能够旋转并从不同角度观看排队者的脸。当目击者能够旋转图像以匹配他们记忆中的脸部排列时,他们更有可能准确地从阵容中挑选出罪犯。全球各地都在使用排查法来帮助警方识别罪犯。典型的情况是,目击者将嫌疑人的图像与 "填充物" - 看起来相似但没有参与犯罪的人一起进行确认。目击者准确识别有罪和无罪嫌疑人的能力被称为识别的准确性。根据总部设

  • GAO报告称美国政府机构必须跟踪他们使用的面部识别系统

    据外媒CNET报道,一个联邦监督机构在一份报告中说,20个美国政府机构使用面部识别技术,但其中一半以上的机构不知道他们使用的是哪种系统。少数机构拥有自己的数据库,但大多数机构使用非联邦系统,如Clearview AI、Vigilant Solutions或亚马逊的Rekognition。美国政府问责局(GAO)调查了42个机构在2015年1月至2020年3月期间的面部识别使用情况。所有14个报告在刑事调查中使用该技术的机构都使用了非联邦系统,但只有一个机构--美

  • OPPO提交全屏指纹识别专利 解锁体验将有大幅提升

    近日,OPPO 广东移动通信有限公司获得「一种支持全屏指纹识别的模组、终端设备及指纹识别方法」专利授权。专利摘要显示,本申请适用于指纹识别技术领域。通过本申请可以提供一种结构将指纹识别功能设置在显示屏上,从而实现全屏指纹识别功能。

  • 字节跳动登记房源识别软件著作权 对房地产领域初心依旧?

    近日,北京字节跳动网络技术有限公司登记“基于场景甄别的重复房源智能识别系统”软件著作权。

  • 你的私密照片可能正被“合法”观看 人脸识别时一定要穿衣服

    凤凰网科技讯 7月3日消息,今日,数码博主@长安数码君 在社交平台爆料称:人脸识别时采集到的区域不仅仅是屏幕显示头部,而是摄像头覆盖的整个范围都会上传到后台。上传后会有审核人员看到。如果是第三方App,有可能会发生信息泄露的情况。该博主也表示,有从事后台审核的朋友对他说在审核工作时:“经常会看到很多人在洗澡的时候、在和“另一半抱在一起的时候”、在没穿衣服的时候、在进行各种奇奇怪怪动作的时候进行人脸识别。”

  • 继续打击搬运侵权行为 字节跳动登记识别内容抄袭软件著作权

    近日,北京字节跳动网络技术有限公司登记一则软件著作权,软件全称为基于监督学习网络的作者评价与内容抄袭识别系统,登记号2021SR0848475,版本号V1.0。

  • 科大讯飞“语音识别方法及系统”发明专利荣获中国专利金奖

    近日,第二十二届中国专利金奖获奖名单公布,科大讯飞“语音识别方法及系统”发明专利荣获金奖。中国专利奖是由国家知识产权局与世界知识产权组织共同开展评选,是国内知识产权领域的最高奖项,中国专利金奖近三年来每年只有 30 个专利能获得。此次获奖,不仅是对科大讯飞知识产权工作的认可,更是对科大讯飞人工智能核心技术的高度肯定。金奖技术突破智能语音交互“天花板”语音语言是作为最自然便捷的交流方式,是人类社会的瑰宝

  • Chrome强化数字化办公:新增多页扫描和OCR识别搜索功能

    在远程办公成为新常态之后,平板扫描仪和打印机的需求也在激增。在 Chrome OS 89 版本中,内置的扫描仪应用能帮助更轻松地数字化纸质文件。Google正在增强内置的扫描应用程序,增加了两个新功能,帮助你远离混乱的文件柜。在 Chromium Gerrit 中发现了一个即将推出的 Chrome 实验 Flag,允许用户在扫描的文件中搜索某个关键词。目前该实验 Flag 尚未生效,不过根据说明在启用之后能够扫描应用偏好设置的文件类型下拉菜单中找到该选

  • 热门标签