首页 > 传媒 > 关键词 > 王小川最新资讯 > 正文

王小川首秀搜狗语音纠错:突破语音识别最后3%

2016-07-18 11:13 · 稿源:站长之家用户投稿
文章目录

2016年7月16日,极客公园“奇点·创新者峰会”在上海召开,包括特斯拉联合创始人JB Straubel、超级高铁Hyperloop One高级副总裁George O’Neal等数十位来自国内外科技企业及学术界的大佬分别针对虚拟现实、人工智能等前沿科技主题进行了演讲和讨论。

上午压轴出场的搜狗公司CEO王小川,发表了人工智能应用主题的精彩演讲《我们应该用AI创造什么》,更成为了唯一一位现场进行AI技术演示的演讲者。利用搜狗公司的语音识别技术,王小川的演讲内容在现场实时生成了滚动字幕显示,目测准确率高达95%以上。同步的字幕引起了现场观众极大的兴趣,纷纷起立拍照。在演讲结束后,现场语音识别成果立刻生成了完整的演讲稿,观众通过扫描二维码即可阅读。

王小川现场邀请了一位观众上台体验了搜狗输入法的新功能“语音修改”。用户对着手机说出一段文字后,再通过自然语言的方式将语音识别错误的地方进行修正,赢得了现场热烈的掌声。王小川介绍道;“目前搜狗手机输入法日均语音输入调用次数超过1.4亿次,是中国最大的语音识别引擎,语音识别准确率已超过97%。但当前的人工智能技术仍然无法让语音识别达到100%的准确率。对此搜狗开发了语音修改功能,通过自然语言交互的形式修改所输入的文字,比‘将弓长张改为立早章’等,不仅解决了语音识别准确率最后3%的差距,同时解放了用户双手,提高了用户输入效率。”

在王小川看来,“带着技术找市场”与“找市场时丢了技术”都是不可取的,“树根是技术,树干是产品,真正开花结果是最后的市场”,当前人工智能企业更重要的任务是抓住市场、深挖技术,创造连接市场和技术的优秀产品,而搜索引擎本身就是这样一种人工智能。搜狗的使命就是让表达与获取信息更简单,真正成为人类生活的助手,而这也是人工智能未来最重要的发展方向。

以下为演讲全文:

大家好,我本人是人工智能的鼓吹者。在大家谈互联网的时候,我们就开始谈产品;大家谈产品的时候,我们就开始谈技术;大家开始谈技术的时候;我们已经开始谈人工智能。那今天大家都在谈人工智能,我要谈一些什么东西呢?

感谢李志飞,其实他的演讲我非常喜欢,我很感谢他把我想讲的东西都已经讲完了,很多理解是一样的。李志飞在最后说,今天没有给大家带来一个演示,搜狗带来了,请看大屏幕!我们预料到了今天网络可能有故障,所以我们把服务器搬到了现场!

那么我们在谈人工智能的时候,我会谈一些反思,因为今天大家可能过多高估了人工智能的未来。在今年上半年,我是鼓吹AlphaGo这样一场跨世纪的比赛,4:1的比分。那么之后就像一场启蒙运动,所有的公司所有的投资把眼光都看向了人工智能,在全球范围内的投资异常地活跃,中国也一样。那在这个时候我更多想谈到,我们得小心什么地方是陷阱,什么地方是真的人工智能的未来?

就在前一个月,我去谷歌跟AlphaGo的工程师做了深度的沟通。有件事情我得告诉大家,AlphaGo并没有停止研发,还继续在往前进步。但是我跟他们聊的时候,谈到到今天为止,跟李世乭下棋的第四局,机器还是赢不了。我是非常惊讶的,已经过了3个月的时间,所以我跟他们说,有什么样的算法可以改进赢得第四局的比赛?谷歌的工程师跟我苦笑,他说你讲的方法我们都试过了。

回到我们深度学习。今天大家知道有一个巨大的危险,因为传统做人工智能的专家就在预言,深度学习有一些缺点,稳定性不够,在一些需要可靠性的场景里面,没有完整的数学的计算和证明。所以这种情况里面即便是99%的正确性,也可能会带来不确定,比如在无人驾驶,这1%的不确定性,就可能带来汽车的失速,而且不知道怎么修正。所以我们今天会知道,深度学习我们认为可以做很多的事情,但是到现在我们人类的技术掌握还是比较浅的。那么我也谈到在语音识别这样的一个话题,今天语音识别已经到了比较高的准确度,已经接近实用,但是其实还是很多的限制。比如说我们需要安静的环境,当有噪音的时候同时有两个人说话机器就搞不定了,我们的办法是,比如说在汽车环境里面,预先录制发动机引擎的声音,或者是噪音加到识别里面去,就把没有见过的环境变成机器能够见过的环境,就能够做识别。

但是我跟工程师聊,那其它的环境,如果有两个人说话怎么办?总有一个人的声音是听不到的?我们的解决方案是用麦克风矩阵,有一种麦克风可以定向识别,如果两个人不同的位置不同的声音,声音的音源可以分离开。人是这样吗?人是靠两只耳朵定声音吗?如果只有一只耳朵,或者两个人在同一个方向说话会怎么样?人是能识别的对吧?机器就做不到了。所以我在这张图里面跟大家演示,我也问了搞神经科学的人,他们说人跟机器有本质的区别,如果两个人说话的时候位置不一样,人可以分离开,如果位置一样,一个人声音大,一个人声音小也能分开。如果两个人的声音一样大,一个是男声,一个女声也可以分开,如果都是男声,但一个人说中文,一个人说英文也能分开。所以人是在一个环境当中,只要能够找到一线机会,把两个声音的不同找到一个特征,就能动态地去分离。但对不起,今天在全球范围内,我们号称在语音识别有重大的各种各样的突破,还是解决不了这样的问题,所以我们知道今天的计算机离人还有巨大的距离。

那么除了这样的一个技术本身的瓶颈以外,我们在创业当中有很多领先的技术公司还会面临什么样的瓶颈?很危险的一种可能性就是有技术,带着这种技术找市场。比如说我们做了人脸识别,就开始想象人脸识别怎么去使用?就去找市场的方向,但是很有可能在这个过程当中没有找到,我们公司就死掉了。也有一种可能性是在找市场的过程当中,我们花了很多力气组建我们的销售团队,我们尝试跟各个领域结合,但是这个时候忘记了技术的源头,因为技术是不断地迭代更新,如果不能跟高效、前沿的技术保持同步,可能我们偶尔找到一点市场,但是我们的技术已经落后。今天在中国的人工智能领域里面,做语音识别、图象处理的公司有好多已经掉到这样的陷阱里面去了。所以这个创业的道路,我跟投资人讲没有那么容易,技术本身不那么靠谱,即便技术靠谱可能没有市场,即便有了市场可能我的技术已经丢掉了。

还有一种我们的做法,已经有广大的市场,搜狗的输入法、搜索已经有千万的用户使用,这样的情况下,我们找技术的时候就会更加踏实。所以我在这里画了一个简单的树,就是市场技术跟产品之间的关系:树根是技术,树干是产品,真正开花结果是最后的市场。所以有一些情况里面,是当我们有根的时候要努力发芽长树干,等它能开花结果,中间的困难是非常多的。而还有很大的困难是,如果我们有了这样一些果实,我们有了市场的时候,或者我们认为我们有市场的时候,把根基丢了。

人工智能跟高校、跟学术界的联络非常多,国内需要的做法,不是从国外学成归来之后我们做技术,或者忘记了这样一个研发的进展就去找市场,而是不断地跟技术的前沿保持同步。比如李志飞一定有他的工程师团队读论文,甚至在这个里面写自己的论文,把前沿跟上。人工智能创业不像有互联网的创业一样,而是不断地把技术更迭起来。

那么这个里面也提到一个命题的作文,我们怎么讨论技术跟幸福之间的关系?我做了一张简图,左边是我们提的一些技术,包括语音识别、人脸识别、人机交互、服务机器人等等。大家觉得这个词跟幸福有关系吗?在座大多数的人本身不是搞技术的,因为大家敬仰技术,崇拜技术,所以我们会过度地在技术里面想象它无限的光环,其实跟幸福没有关系,其实是因为我们的不理解,恐惧和向往带来一种误解。看右边,右边这些听起来我就觉得比较酷了,自动驾驶、能听懂我说话、诊断疾病、一键送咖啡。听着怎么样?是不是有幸福感?左下角的词大家看到了吗?活捉皮卡丘,大家知道我要说什么吗?最近非常火的虚拟现实的游戏,不是在像左边一样讲虚拟现实,而是讲带来了一个把活生生的卡通形象放在我们面前,这是我们看到的幸福。

所以对比左右两个图,无论创业者,还是媒体人,还是投资人,我们应该看到当我们的技术能够让我们有幸福的时候,那它更有可能成为一个技术变成一个产品,变成一个市场成功的应用。跟大家讲讲我们对于搜狗技术跟幸福之间联系的理解。其实有朋友跟我谈搜索的时候说王小川你今天挺高调的,不停谈人工智能,你们要转型做人工智能了么?我说不是,搜索本身就是一种人工智能,而且是有幸福感的人工智能,因为它能让每个人变的更加地强大。

有时候我跟一个90后走在一块,我发现他很厉害,他无所畏惧,因为他知道拥有了搜索之后,他能解决所有的问题。上面一搜索就有答案,所以今天的这些年轻人利用技术,利用搜索变的更加地强大,拥有了更大的幸福感。

那么再多补一句,为什么说搜索就是一种AI呢?先看一个简图,搜索第一部分是让用户先要去做一个关健词的搜索,然后给它提供10条链接,这是搜索今天产品运行的基本方式。但是这个关健词是我们最好的输入模式吗?今天大家已经很习惯了,我回顾1999年到2000年,搜索刚刚出现的时候我观察过,那个时候大家更愿意敲整句话,但发现机器不能识别,所以大家被训练使用这样的关健词。这个就像计算机使用鼠标一样,大家都会很习惯用鼠标,但是今天我们发现乔布斯告诉我们,更好的方式是用手指直接在屏幕上戳,所以关健词的输入相对于自然语言的输入就像鼠标和用手指自然表达一样,是需要继续提升的。因此搜索引擎往下的进展方向就是把让人去想一个关健词,变成让人去表达一个完整的句子,机器找出中间的含义。同样的10条链接也不是我们最想用的方式,而是应该通过用户的问句直接给出答案或者是命令,机器做执行。

因此今天搜索的进化对搜索引擎公司是一个渐进的过程,就像谷歌,他已经提到自己从一个移动互联网公司变成一个人工智能公司,那为什么他没有做到这个东西呢?听着很好听对吧?是因为今天全人类的技术,距离做到让机器去理解人,能变成一个句子给出答案还是有距离的,只是我们在这条道路上一直走。人工智能引入不是颠覆性的市场,而是原有的需求渐进的改进,对谷歌,对我们一样,包括对百度也是这样的逻辑。

所以我们提到搜索公司本身就在做人工智能,如果大家看搜狗觉得不过瘾可以看谷歌,他已经代表了人工智能在今天运用的最高峰。因此在现在的应用里面类似于Siri还有其他的交互功能是我们的梦想,我们判断这样的未来是属于搜索公司的。好,给大家看一个我刚刚提到的美妙的动画。这个片子我相信大家都看过,其实是代表未来人工智能在我心中的方向,搜索公司未来走的方向也是向这里发展的。

我们谈到语音输入,今天是被大家吐槽特别严重的领域,也是我们发展的一个重要环节。大家可能不知道搜狗是中文语音识别用户量最大的应用,我们一天有1.4亿次的语音识别量,准确率超过97%,搜狗输入法的用户,刚刚提到做语音识别是不够的,我们还会在上面做什么呢?给大家看一段视频。我们怎么把97%继续提升?搜狗在当前语音输入的基础上加入了自然语言修改功能,让用户可以用更直观自然的方式修改目前技术无法达到的3%,同时解放了用户的双手,真正给用户的生活带来便利。

OK,我的演讲到此为止,大家可以在大屏幕上看到,我的演讲已经被自动识别成了一篇完整的演讲稿,并给大家一个二维码供下载。谢谢大家。

文章评论

免责声明:“站长之家”的传媒资讯页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与我们联系删除或处理。稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性,更不对您的投资构成建议。我们不鼓励任何形式的投资行为、购买使用行为。

  • 相关推荐
  • 大家在看
  • 搜狗“嫁给”腾讯:最懂王小川的,还是马化腾

    2013 年 9 月 16 日,马化腾、王小川、张朝阳 3 人,现身北京五道口的搜狐媒体大厦,腾讯宣布向搜狗战略入股4. 48 亿美元,并“将搜搜与QQ输入法业务,与搜狗现有业务合并,形成一个全新的搜狗公司”。

  • 从控股40%到全资收购,腾讯买的是搜狗还是王小川?

    许久没有在镁光灯下闪耀的搜狗,突然间被推到了万众瞩目的中心。推动ta的是腾讯。昨晚,搜狗发布公告,大致内容言简意赅地总结一下就是:腾讯希望以 9 美元每股的价格,收购搜狗剩余股份。如交易完成,搜狗将成为腾讯的全资子公司,并从纽交所退市。

  • 腾讯拟全资收购搜狗 王小川:将认真讨论和衡量

    7月28日消息,昨日晚间, 搜狗称收到来自腾讯的有意收购公司的初步非约束性要约,交易形式为全资,交易价格为每股9美元。交易完成后,搜狗将成为腾讯的全资子公司,搜狗也将从纽约证券交易所摘牌。搜狗CEO王小川随后在其微信朋友圈回应称:“感谢腾讯公司对搜狗公司价值以及技术能力、产品创新能力的认可。接下来会对相关事宜进行认真的讨论和衡量,让搜狗能够持续为用户创造更大的价值。”如果交易达成,这将是腾讯第

  • 腾讯有意全资收购搜狗 搜狗CEO王小川:会认真讨论衡量

    【腾讯有意全资收购搜狗】据媒体报道,腾讯向搜狗发出初步非约束性收购要约。据悉,腾讯有意以 9 美元/ADS的价格收购搜狗剩余股份。随后,搜狗CEO王小川在朋友圈发文称,感谢腾讯公司对搜狗公司价值以及技术能力、产品创新能力的认可。接下来会对相关事宜进行认真的讨论和衡量,让搜狗能够持续为用户创造更大的价值。

  • 王小川的理想和傅盛的梦想

    互联网圈著名“钻石王老五”王小川是不是要开始谈恋爱、结婚了?这话题已经成为最近几天各路吃瓜群众的闲扯焦点。

  • 王小川未婚,搜狗却嫁给腾讯:市值一夜猛涨75亿

    昨日( 7 月 28 日)晚间,搜狗发布公告称,腾讯向公司发出初步非约束性收购要约。简单的一句话背后,是腾讯有意向全资收购搜狗,交易价格为 9 美元/ADS。在此之前,腾讯已经是搜狗的单一最大股东。

  • 搜狗原CFO周毅卸任搜狗旗下公司法定代表人 王小川接任

    DoNews 7月7日消息(记者 刘文轩)天眼查数据显示,近日,成都吉易付科技有限公司发生工商变更,搜狗原CFO周毅卸任法定代表人、执行董事,由王小川接任。此外王小川退出监事,由张丹接任。成都吉易付科技有限公司成立于2015年1月,注册资本1亿人民币,公司经营范围包括计算机软硬件技术开发、技术转让;基础软件服务、应用软件服务;信息技术咨询、技术服务;互联网技术开发等。天眼查股东信息显示,北京世纪思速科技有限公司(北?

  • 网曝刘能换人内幕 因直播问题王小利与赵本山闹翻不演刘能

    网曝刘能换人内幕是怎么回事?据媒体报道,近日电视剧《乡村爱情13》宣布剧中「刘能」一角将换人出演,这个消息立即引起了众多网友的讨论。有网友爆料称, 16 日晚,在《乡村爱情》系列中饰演「老严」的唐军在直播中透露了王小利为何不继续出演「刘能」的原因,竟是因为刘能和赵本山闹翻了。

  • 搜狗终局:没有赢家

    昨晚,腾讯全资收购搜狗的消息出来后,后者股价暴涨近50%,市值以 33 亿美金的价格收盘。很多人说,这是一笔多赢的交易。毕竟,腾讯获得了搜狗的搜索体系和相关技术,搜狗榜上了大款,搜狐获得了巨额现金收益,王小川也算完成人生上半场的成人礼。

  • 华为芯!全国产语音模组登陆格力量产AI语音空调“月亮女神”

    上海海思宣布,基于海思SoCWi-Fi IoT芯片的荣邦智能AI语音模组方案正式量产,搭载于格力电器的AI语音空调“月亮女神”。这次基于国产自主物联网操作系统、海思Wi-Fi SOC研发的控制器

  • 四川弘和为油气站安全管理装上“智能大脑”

    弘和AI油气站安全预警应用管理平台在蓉成功发布。 2020 年 7 月 23 日,四川弘和通讯有限公司(以下简称“弘和公司”)在成自泸高速公路永兴油气站召开“弘和AI油气站安全预警应用管理平台”产品发布会,四川省应急管理厅、四川省市场监督管理局,成都市市场监督管理局等部门相关领导应邀出席。“弘和AI油气站安全预警应用管理平台”作为弘和公司拳头产品,拥有如一种基于AI识别油气站区域各类风险行为(作业规范类、输入类、设备?

  • 搜狗回应腾讯收购要约说了什么?腾讯有意全资收购搜狗

    【搜狗回应腾讯收购要约】据媒体报道, 7 月 27 日晚间,搜狗公司宣布其董事会收到腾讯控股初步不具约束力的收购要约。腾讯计划以每股 9 美元收购所有未持有的搜狗普通股股票,这笔交易若完成搜狗将成为腾讯子公司,而搜狗将从纽交所摘牌。

  • 搜狗原CFO周毅退出北京搜狗信息服务有限公司法人

    DoNews7月14日消息(记者 翟继茹)14日,天眼查数据显示,北京搜狗信息服务有限公司发生工商变更,搜狗原CFO周毅退出法定代表人、董事长,由许静芳接任。王小川仍担任该公司董事、经理。天眼查股东数据显示,深圳市腾讯计算机系统有限公司、北京世纪高科投资有限公司、王小川为该公司三大股东,分别持股45.00%、45.00%、10.00%。此前,周毅还卸任了搜狗持股公司成都吉易付科技有限公司的法定代表人、执行董事。天眼查数据显示,周?

  • 腾讯收购搜狗花了多少钱?腾讯有意全资收购搜狗是怎么回事

    ​【腾讯收购搜狗花了多少钱】据媒体报道,腾讯向搜狗发出初步非约束性收购要约。据悉,腾讯有意以 9 美元/ADS的价格收购搜狗剩余股份。随后,搜狗CEO王小川在朋友圈发文称,感谢腾讯公司对搜狗公司价值以及技术能力、产品创新能力的认可。接下来会对相关事宜进行认真的讨论和衡量,让搜狗能够持续为用户创造更大的价值。

  • 腾讯有意全资收购搜狗

    昨日晚间,搜狗宣布收到腾讯的初步非约束性要约,拟以每普通股或每美国存托股份(ADS) 9. 00 美元的价格,现金收购搜狗包括ADS在内尚未被腾讯或其附属公司持有的所有剩余的流通中普通股。

  • 马化腾缺席贵商大会 通过微信语音发表讲话

    在 2020 全国工商联主席高端峰会 2020 贵商大会上,马化腾发来微信语音表示,从贵州到全国,产业数字化进程不断加速,给生产、消费、就业带来了新的实现形式,增强了企业的适应能力和韧性。 7 月初,在上海人工智能大会上,未能出席的马化腾也是给大会发了微信语音。

  • 四川蒲江联合腾讯、高灯科技,共同打造“智慧税务”样板工程

    近日,由四川蒲江联合腾讯企业微信、高灯科技共同打造的“高灯智慧税务项目”正式在蒲江县产业新城招商中心完成签约。蒲江县人民政府副县长王波,腾讯公司企业微信政府行业总监郭登科,高灯科技副总裁、政府事务部总经理薛照红等出席此次签约仪式。根据协议,“高灯智慧税务”项目将依托各方优势资源,共同建设蒲江县智慧税务体系,助力打造可面向全国推广的“蒲江税务样本”。 当前,国家税务总局积极推动大数据、云计算、人工?

  • 马化腾又双叒缺席大会 这次还是发来一段微信语音

    7月28日,据媒体报道,在2020全国工商联主席高端峰会2020贵商大会上,马化腾未能参加会议,而是以视频的形式给大会发来了微信语音。发来的微信语音表示,非常感谢大会让我通过线上的机会再次在

  • 搜狗卖身,腾讯舞剑,意在百度还是字节?

    7 月 27 日,搜狗公司宣布其董事会收到来自腾讯控股有限公司的一封信,其中包含一项初步的非约束性(可撤回)建议,表示腾讯将会收购所有流通在外的普通股,包括代表美国存托股份的普通股,交易价格为 9 美元。

  • 搜狗原CFO周毅退出北京搜狗信息服务有限公司法人及董事长 由许静芳接任

    天眼查数据显示,北京搜狗信息服务有限公司发生工商变更,搜狗原CFO周毅退出法定代表人、董事长,由许静芳接任。王小川仍担任该公司董事、经理。北京搜狗信息服务有限公司成立于2005年12月,注册资本2000万人民币,公司经营范围包括互联网地图服务 甲级;利用信息网络经营音乐娱乐产品、演出剧(节)目、表演、动漫产品、从事网络文化产品的展览、比赛活动、游戏产品等。天眼查股东数据显示,?

  • 参与评论
文明上网理性发言,请遵守新闻评论服务协议
  • 热门标签