老罗大秀语音识别 但它真的重要吗?

2016-10-19 19:16 稿源:科客网  0条评论

小编点评:如果没有人工智能,语音识别如同鸡肋,食之无味,弃之可惜。

在10月18日晚上的锤子手机发布会上,老罗现场展示了科大讯飞97%正确率的语音输入。时间定格于发布会106分40秒,在老罗一阵碎碎念之后的不到一秒之内,文字转换完成。其转换速度之快,准确率之高以及现场展示的特殊环境,都让人惊艳了一把。

语音识别实用吗?

事实上,语音输入并不是什么新鲜词,但这次借助老罗的“单口相声”,语音输入又跳到众人视线中。令人奇怪的是,讯飞的语音输入在很早以前就有了,这次展示却令我们有种重新认识语音输入的感觉。

几年前,语音输入的准确率也不低,基本都有90%以上。然而,放到实际生活中,语音输入的实用性仍然不是很高。在使用语音输入的时候,其准确率会受到非常多的因素影响,在不同的环境下使用会有差别,在不同使用者的口音下更是差别巨大。

但放到今天,语音识别还是不实用吗?

应该说,由于准确率的提高,语音识别的实用性对普通用户来说有所上升。但从科客的实际体验来说,哪怕是讯飞,其准确率仍然受限于使用者的音量、发音标准程度、环境干扰诸多因素。其中最大的影响因素应该是口音。拿广东地区来说,光是粤语,不同地区的人发音都有所区别。对于人类来说,我们可以较为轻松的识别不同口音,并较为准确领会他人表达的意思。然而对机器而言,它就需要更大的数据库。倘若哪一天,语音输入能够只能判断方言口音,并且能在街头随机抽取不同口音的人进行语音输入准确率的测试,那相信其实用性将会非常的大。但就目前而言,语音输入的进步对不少年纪大的,只会用手写输入的用户来说,其实用性确实不小。

竞争者众多

需要承认,讯飞的多语言识别率确实是世界顶尖,中文是最好的。但是,其他竞争者要做到90%甚至95%以上也不是难事。另外,这些竞争者中不乏像谷歌、百度这样拥有大量数据库的企业,他们在海量用户数据和人工智能技术上的优势,能让他们迅速的发展出优秀的语音智能。除此之外,这类互联网企业还有足够的能力发展诸多产品线,形成生态,以提供更优质而全面的服务。从这个角度来说,讯飞的发展道路有些窄。

语音识别的应用

另一方面,必须注意到,语音输入本身只是一个途径,它最终仍然要和实际操作相结合。比如在无人汽车领域,发展语音输入就很有必要。试想一下,当你坐上一辆无人汽车,满怀新奇和期待,结果屏幕却弹出一块键盘,那时你对这项高科技是否会感到失望?

而智能家居又是未来一大利用语音识别进行交互的重要领域。语音识别与智能家居的结合在几年前就有了。微软在win10发布会上主打的一点就是跨平台,并利用Cortana这个语音识别进行更便捷的操作。也许这是第一步,在整合数码设备之后, 微软甚至能一步步逐渐渗透,从电视到洗衣机,从窗户到整个房屋,全都用人工智能进行操作。而语音识别自然理所当然会成为更智能家居体验的主要交互方式。这是能够改变人们生活的重要领域,以语音识别为基础建构起来的整个生态,就成了目前各大语音识别厂商追逐和竞争的目标。

重点还是人工智能

从语音识别在未来可能涉及的领域可以看到,虽然语音识别能让生活工作变得更加的高效便捷,然而,其核心却是人工智能。虽然微软CEO萨提亚·纳德拉对语音识别不吝赞美,甚至称语音识别突破的意义不亚于将图形界面引入电脑,然而,没有人工智能为核心,语音识别会出现下图这样的答非所问,就算再准确又如何?

        无论是无人汽车,还是智能家居,或者是其他领域,语音识别只能算是第一步。毕竟如果计算机无法理解我们的指令,那么也不会有后续的操作。要想在这些领域有所发展,给用户更好的体验,那就必须着眼于人工智能。如果语音识别没有依托于人工智能,不能和其他产品相互配合,那语音识别的意义也就没有那么大了。由此来看,语音识别真的是重点吗?恐怕不见得。

有好的文章希望站长之家帮助分享推广,猛戳这里我要投稿

相关文章

相关热点

查看更多