数据堂:智能家居产品应用落地,数据是幕后功臣

2019-01-18 11:02 稿源:用户投稿  0条评论

作为代表未来科技发展趋势的物联网,随着产业链的不断完善,落地应用越来越多,尤其是面向消费者市场的智能家居,已成为物联网时代的风口,全球智能家居市场高达万亿。

智能家居产品最早从智能电视开始,当时的厂商尝试将语音交互功能嵌入到电视或机顶盒里。经过几年的发展,到现在,语音功能已逐渐成为电视的标配。

从 2017 年开始,以智能音箱为代表的家居单品开始爆发式增长,智能音箱更是百箱大战,亚马逊、Google、百度、阿里、腾讯、小米、讯飞、联想等一大批企业都参与其中,智能音箱可以与用户交流、播放音乐甚至网购。随着各类智能家居产品的增多,亚马逊、百度等人工智能巨头纷纷在搭建统一平台,以语音为入口,连接各种智能家居设备。

传统电器厂商也开始在传统电器上赋予人工智能,智能空调、智能油烟机、智能冰箱、智能台灯都在如火如荼的研制。

针对庞大的儿童消费市场,智能手表、故事机、机器人等儿童智能产品也越来越受欢迎。

可以说,智能家居产品应用已经进入跑马圈地、深入千家万户的阶段,它以超前的生活理念逐步影响着我们每一个人。

智能家居产品的技术挑战

智能家居产品最主要的特点是语音交互,解放用户的双手,通过最自然的语音进行交互。可以说,语音识别技术是智能家居产品的直接推动者。

在智能家居产品以前,语音识别技术主要用于手机。那么手机和智能家居产品里的语音识别技术有什么差异吗?

普通话语音识别在手机上已取得了很高的准确率,但在从手机过渡到智能家居产品的过程中,原有语音识别技术的准确率有显著下降。

首先,说话人离智能家居产品的距离比使用手机时更远,会带来远场语音问题,包括噪音、混响等。

其次,智能家居产品的用户有相当一部分比例是儿童,不像手机用户以成人为主。儿童和成人的声音有明显差异,导致儿童的语音识别率偏低。

然后,听歌看片时因为有大量英文歌曲和人名,用户说话会有中英夹杂的情况。比起纯中文来说,中英夹杂的语音识别率更低。

以上都会对智能家居产品带来语音识别上的困难。解决这些困难,背后需要更有针对性的大量语音数据来供计算机学习。

数据助力智能家居产品

数据堂研制的语音数据,可以更好的助力智能家居产品应用落地。

首先,针对远场语音,数据堂研制了 1000 小时的远场家居语音数据,考虑到不同智能家居产品的麦克风特点,数据堂精心设计了一套涵盖线型、环型、 2 麦、 4 麦、 6 麦、 8 麦等常用组合的麦克风阵列,说话人距离覆盖0.5m、1m、3m、5m等不同距离,录音语料上覆盖各种智能家居设备的指令、语音交互句子、常用唤醒词,可以最大程度的贴合各类智能家居产品的实际场景。

6 麦环形阵列示意图

其次,针对儿童用户,数据堂研制了 3000 小时的儿童语音数据,录音语料覆盖儿童读物、语音助手类交互文本、家居控制命令,可以满足故事机、智能音箱等儿童使用的智能家居产品的场景需求。

然后,针对中英夹杂情况,数据堂研制了 1000 小时的中英混读语音数据,录音语料覆盖日常口语、智能设备交互,涉及音乐、娱乐、出行、生活、体育等十多个领域,可满足智能音箱、智能电视等有中英夹杂情形的智能家居产品的场景需求。

以上数据,数据堂和每位采集对象都签署了数据授权协议。

结语

智能家居行业已经进入快速发展期,语音成为智能家居产品的主要入口,智能家居场景对语音识别技术提出了更高的挑战。在各种类型智能家居产品的背后,数据是幕后功臣。

本文由站长之家用户投稿,未经站长之家同意,严禁转载。如广大用户朋友,发现稿件存在不实报道,欢迎读者反馈、纠正、举报问题(反馈入口)。

免责声明:本文为用户投稿的文章,站长之家发布此文仅为传递信息,不代表站长之家赞同其观点,不对对内容真实性负责,仅供用户参考之用,不构成任何投资、使用建议。请读者自行核实真实性,以及可能存在的风险,任何后果均由读者自行承担。

声明:本文转载自第三方媒体,如需转载,请联系版权方授权转载。协助申请

相关文章

相关热点

查看更多