首页 > 传媒 > 关键词 > 声智科技最新资讯 > 正文

声智科技CTO冯大航:AI章鱼系统架构在智慧城市的进展与应用

2019-09-23 09:28 · 稿源:站长之家用户投稿

9月21日,中国人工智能大会2019(Chinese Congress on Artificial Intelligence 2019,简称“CCAI 2019”)于青岛胶州方圆体育中心盛大开幕,本届大会以“智变融合”为主题,由中国人工智能学会主办,是我国最早发起举办的人工智能大会,声智科技联合创始人兼CTO冯大航受邀出席并发表演讲,此次大会有超过100位国际人工智能领域顶尖人才,800余位国内外人工智能领域专家教授、头部企业高管及行业代表,2500余位专业观众共同参会。

大会期间,声智科技联合创始人兼CTO冯大航以《智慧城市中声学与AI融合技术的进展与应用》为主题发表了演讲。冯大航表示,中国的智慧城市处在一个快速发展当中,以声智科技为代表的人工智能企业将声学与人工智能融合应用在智慧城市里面的方方面面,例如在智能交通领域进行监测,安防提出的需求是希望给摄像头“装上耳朵”,可以实现对异常声和某些关键词的监测。又比如应用在智能家居里的智能空调、电视等等,以及应用在政务系统中可以极大的方便市民迅速获得需要的服务。这些案例声智科技都已经在参与,并且已经有了一些项目完成落地。

基于这些项目经验,我们将观察到的现象总结为两大趋势:

一是在技术上,声学与人工智能正在不断地融合——通过深度学习进行信号处理和语音识别等,应用在智能安防和智慧交通等诸多领域;二是在新的场景下,新的系统架构正在形成——章鱼架构,且具有更强大的计算和控制能力,基于“章鱼架构”的模式声学与人工智能融合的案例已经应用在智慧城市的方方面面。

交通、安防、政务、教育……城市生活包含着多个场景,也充满着各式各样的设备。以AI为核心的智能化如若要实现在城市的广泛应用,自然需要完成在不同设备间的真正落地。为适应这一新需求,更好的服务客户,声智科技推出了SoundAI Azero 智能操作系统。其具有更加智能的终端控制能力、更强大的计算处理能力、更快速的网络传输能力以及更个性化的定制能力。

我们认为未来会出现更多的“章鱼”系统,并且进化的更加智能,同时越来越多的“章鱼”系统出现后会产生“智慧的规模效应”,产生一个更大提新型系统。

据悉,声智科技成立于2016年5月,是全球领先的远场智能交互系统提供商之一,专注于声学语音技术和语言理解技术,致力于通过不断引领真实环境下的人机交互体验,实现“让机器更智能”的使命,达成“用科技改善生活”的愿景。声智科技核心团队来自中科院声学所,聚集了全球著名高校的毕业生和著名企业的商业精英,以及中关村、福布斯、胡润以及IEEE、ACM、ASA、AES、中国人工智能学会、中国计算机学会、中国声学学会等众多高端人才。

以下为冯大航演讲实录:

大家好,我是声智科技的联合创始人兼CTO冯大航,我们公司主要专注于声学和人工智能的融合,今天我主要希望分享一下我们公司这几年在智慧城市中的进展与思考。

首先看一些数据,根据2013-2017年中国智慧城市数量与投资规模的曲线图可以发现,无论是试点的数量还是投资的规模都是一个逐年上涨的过程,可以说中国的智慧城市是在一个快速发展当中,我们公司主要做声学与人工智能的融合应用。声学在智慧城市里面也有很多重要的应用,例如在智能交通领域进行监测,安防提出的需求是希望给摄像头“装上耳朵”,可以实现对异常声和某些关键词的监测。又比如应用在智能家居里的智能空调、电视等等,以及应用在政务系统中可以极大的方便市民迅速获得需要的服务。这些案例我们都已经在参与,并且已经有了一些项目完成落地。

基于这些项目经验,我将观察到的现象总结为两大趋势:

一是在技术上,声学与人工智能正在不断地融合。二是在新的场景下,新的系统架构正在形成。接下来,我将主要就这两条脉络进行阐述。

我们公司产生之初就致力于声学与AI的融合,2014年以前声学和语音信号处理以及语音处理的交叉不是特别多,都在独立向前发展,特别是深度学习被用于语音识别以来,语音识别率得到了很快的提升。

上图展示了语音识别出现以来的错误率曲线,可以看到,最关键的一点出现在2017年微软推出一套语音识别系统,其语音识别错误率达到了5.1%,首次低于人类的语音识别错误率。人类在数据集上达到什么水平呢?通常,一个正常人在数据集上平均值错误率是5.9%,即使受过专业的训练的人,在这个数据集上错误率也达到了5.2%。可以说,至此,语音识别发展已经达到非常成熟的程度。

其实语音识别在商业应用中受到一些阻力,比如手机上的语音助手应用的不是特别多。但在2014年亚马逊推出智能音箱以来,语音识别得到越来越多的关注,比如说房间的混响、旁边的背景噪声以及人声干扰,在这种情况下,其实信号处理是可以做一些工作的,比如我们可以利用麦克风阵列将目标声音和噪音区分开,从而让语音识别率有一个明显提升。

这里面便涉及到信号处理与语音识别的融合的过程,接下来我会举一个更简单的例子,当然可能更偏于学术一些,去解释一下背后更深层次的原因。

以混响为例,现在我在这里演讲,在座的观众听到我的声音其实是我本人的声音和经过强烈的反射后的声音的叠加,在数学上怎么表示呢?可以表示为一个纯净的信号经过房间重新响应得到混响的信号,可想而知,这样一定不会得到一个好的结果。现在一些学者们也在进行深入的研究,比如说让语音信号经过多种房间的重新响应再训练网络,我认为这也不是特别完美的一个过程。首先,即使在同一个房间里面每个点也是不同的,我们有很多的房间,这是很多种组合,相当于同一条语音,可能变化出非常多的一种方式,在这种情况下,让深度学习的网络去学习东西,效果会有所折扣。

在这个过程当中,信号处理完全可以出一个逆流波器,这不能完全和原声一模一样。换言之,就是存在一些偏差,实际当中也有一些非线性效应,但这种信号确实和原来的信号更接近了一些,之后我们再重新训练网络,就可以达到很好的语音识别的效果。

其实,整个信号处理可以做的是什么样的工作?简单一点来说,我们要做的是信号多样性的问题。

左边的图是我们当前的语音识别的系统框图,一般来说,信号回来之后要做一个回声的工作,把设备自己的声音去掉。接下来我们会做一个去混响的操作,然后找到说话人的位置,做一些波形的工作,把处理后的信号送到云端,再后面是声学模型的结构,这就是一个复杂的网络,最终转化成文字。这个过程当中,从波形形成以后,这个信号实际上也是存在一定的失真,需要对后来的网络进行重新的迭代,让它对非线性的部分有一个学习的过程。大家可以看到,总而言之,整个过程还是信号处理跟语音识别的集联关系,不是深度的融合。但我们在不断探索,比如我们现在希望用深度学习的网络把回声消除的非线性部分进一步去除掉,这个公式比较简单,一个设备自己发出声音之后,首先利用线性的部分消除掉,就得到下面的公式,这是参考信号的非线性表达,S(n)是期望的信号,在这里面非线性回声残留会用参考信号的非线性的关系来表达。我们可以利用神经元网络进行一个模拟,这样处理之后,可以得到更好的结果。

右边的图是谷歌的做法,当信号进来之后,同样进行去混响的操作,用后面的两层网络对波束形成的部分做了一个拟合的过程,然后放入声学模型当中处理。

从这几个图可以看到,最简单的是接下来进一步的融合,这个过程可能信号处理发挥的作用更少一些。但如果两个人声重叠在一起,就很难识别出来应该识别哪一个人声。

一个好的系统,最本质的原因主要在于我们是在自然界这样一个复杂的系统当中,一定是存在线性效应也存在非线性效应。关于信号处理,声学擅长解决的是线性部分,深度学习擅长解决的是非线性部分,最好的方式一定是两者的完美融合。比如说鸣笛检测需要定位到车辆的位置,这一过程信号处理就可以发挥作用,通过深度学习把噪声去掉,智能安防和智慧交通系统也是如此。

以上是技术方面的阐释,接下来我们剖析下系统层面。首先,我们认为现在新的系统正在形成,以简单的比喻说明,可以认为是从水母的计算模式向章鱼的计算模式进行转变。那么章鱼和水母有什么区别呢?章鱼的头脑更加聪明,触手更加灵活,从前可以联网的设备无外乎就是手机、平板或电脑,这些设备计算能力比较强,系统比较统一,用水母的计算模式完全可以满足需求。但现在,可以连通网络的设备越来越多,也存在各种各样的系统。如何屏蔽这些不同设备和系统间的差异,尽可能地实现统一,就必然催生出一套新的系统。在这一方面,亚马逊走在了最前列, 2014年亚马逊推出智能音箱的时候就考虑到这个问题,对整套系统进行彻底的优化,将80%的计算放在云端,把20%不能放在云端的计算放在端上,这样做的好处就是不论是再计算能力还是系统方面,都可以最大化地屏蔽端上的差异。

事实上,我们也按照这一思路做了一套自己的系统,这套系统有什么好处呢?简单来说,第一点就是可以极大地降低端上的成本,第二点是可以非常方便地进行定制,比如说采用了我们系统的智能设备应用在酒店中,客人一进酒店关于“餐厅在什么地方”之类的非通用回答的个性化问题,智能设备完全可以提供正确答案。使用这套系统,客户完全可以在网上定制一个对话系统,再将其部署到云端,让酒店的设备都可以按照这一对话系统的逻辑进行工作。

还有一点,当设备接入越来越多的情况下,其实可以反过来让云端更加智能。比如询问酒店的餐厅在哪里,这个问题其实有很多的问法,回到前面的例子,其实这些例子都可以用上述提到的系统进行覆盖。多样化的提问方式可以使得系统定制变得更加简化,以刚刚提到的鸣笛监测为例,就可以对特定的某一时间段进行监测,又或者以政务系统为例,对于不同省份而言政务系统肯定是不一样的。

既然系统有这么多好处,那其背后有没有驱动力呢?我们认为其背后的驱动因素有四个关键点,首先是新的传感器或者传感器的组合,这样能够构造出新产品,比如智能音箱,这就是在传统音箱的基础上简单地加了麦克风阵列,又比如现在的VR或AR设备、可穿戴设备。由于传感器的组合和新的传感器的诞生构建出来新的品类,而且这种新品类将会不断增加,这一过程也会不断扩大,因为传感器的组合方式太多了。

第二,算法方面,其实现在我们也在讲深度学习。深度学习的算法现在可以说发展得越来越快,包括语音识别,在短短两三年的时间里整个系统提升得非常快,也为用户带来更好的体验。

还有一点,云端计算能力要足够强,其实现在的计算能力也是可以满足需求的,但云端计算能力足够强可以让我们运行更大、更复杂的网络。

最后,还需要网络足够给力,现在我们马上也进入到5G时代,5G的网速越来越快,接入网络更加的便捷,在这样大背景下,相信一定有越来越多的设备能够接入到网络。整套系统如果满足以上四点,一定可以复制到更多领域,也会催生出越来越多的新产品。

那么在上面两个趋势下,未来又会发生什么样的事情呢?我在这里做个简单大胆的预测。

未来几年内,可能会出现越来越多的“章鱼”系统,这个过程我们内部称之为“数据的规模效应”,简单理解就是,在接入“章鱼”系统的设备越来越多的情况下,会产生越来越多的数据,这个数据会反哺算法,让算法变得更加智能,又使得“章鱼”更加聪明。接下来将会有越来越多的“章鱼”出现,我们把目光放得再长远一些比如十年、二十年以后,这些“章鱼”系统会不会进行一个裂变呢?比如说变成一个更大的系统,这块我们认为也是会发生的,我们把这一过程称之为“智慧的规模效应”。

如果可以实现将这些合并成一个大的系统,未来的确可以像电影中所展现的那样。但这个过程可能还需要一定的时间,但“章鱼”系统现在正在出现,而且未来会越来越多。今天我的分享就到这里,谢谢大家!

免责声明:“站长之家”的传媒资讯页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与我们联系删除或处理。稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性,更不对您的投资构成建议。我们不鼓励任何形式的投资行为、购买使用行为。

  • 相关推荐
  • 大家在看
  • 信也科技:“科技,让金融更美好”已落地

    2020年9月8日,信也科技“2019年环境、社会及管治报告”在上海正式发布。报告阐述了“科技,让金融更美好”使命的具体表现。信也科技在搭建公司业务架构的同时,以合法合规的方式为社会提供卓越的技术服务并培养专业的人才,力求以金融科技对个人、社区和世界产生积极影响。从七个板块的力量连接,展示了信也科技对社会责任的使命担当,以及在呵护整个行业生态可持续发展方面所做的努力。报告从公司的治理体系、ESG理念的融合发展?

  • 蚂蚁宣布上市后将重投科技:科技创新才能让金融服务更加普惠

    在今日的外滩大会上,蚂蚁集团CEO胡晓明发布演讲称,蚂蚁未来上市后,最重要的事情就是投入科技,投入技术。将进一步来提升自主创新能力,在区块链、物联网、人工智能、安全风控等领域继续加大投入。只有通过科技创新才能让金融服务更加普惠,才能让金融解决更多不平等服务的问题。

  • 为小年糕用户体验再升级,美摄科技带来视音频黑科技

    近年来,我国老龄化趋势明显。中国老人将以每年 1000 万人的速度增加,到 2020 年,50- 75 岁的群体将超过 4 亿人。老年人口不断增加,互联网老年用户的比重也在不断增加。根据 2018 年腾讯应用宝发布的《老年用户移动互联网报告》,中国目前已经拥有了 8000 万老年网民,占老年人口的20%,也就是说,每五个老年人中就有一个使用手机上网。目前最火爆的短视频、直播等新媒体也正在成为中老年群体最喜欢的内容形式。其中许多中老年?

  • 深圳云鸿科技好不好,有了解过吗?

    据云鸿电商悉知,回顾过去 20 年我国电商发展之路,可以发现,我国的电商产业已经非常强大,今天仍然是电商的世界,实体产业没有竞争资本。对于想要成功的每一个人来说,现在起步一点都不晚,下面云鸿与你分析如何让你在开网店的道路上顺风顺水的小方法。一:打造店铺高人气的方法首先我们要做到发帖,回帖,因为这个是非常可以提高你店铺人气的。如果你做了签名档你发了原创贴,所有来回贴的人都能看到你的签到名档是在最前面的,

  • 深圳云鸿科技正规吗,服务专业吗?

    直播电商这一迅猛发展的新经济业态或将在今年进入万亿规模时代。 10 月 12 日,毕马威联合阿里研究院发布《迈向万亿市场的直播电商》报告,预测今年直播电商整体规模将达 10500 亿元,直播电商在整个电商市场的渗透率将提升逾四个百分点至8.6%。阿里研究院院长高红冰表示,万物可播、人人可播的直播电商已经到来,以淘宝直播等为代表的直播电商连续 8 个季度爆发式增长。直播电商拉动新供给,畅通产业链内循环。大学生王一歌通过直

  • 柔宇科技刘自鸿出席深圳特区40周年大会,以创新赢得科技变革主动权

    10 月 14 日上午,深圳经济特区建立 40 周年庆祝大会在深圳召开,大会总结了改革开放以来,深圳经济特区 40 年的发展经验,并为深圳经济特区在新时代的发展指明了方向。坚持创新是第一动力,在全球科技革命和产业变革中赢得主动权,这是深圳经济特区 40 年来的一条宝贵经验。面向未来,落实新发展理念、推动高质量发展是深圳发展根本出路。深圳依然要坚定不移实施创新驱动发展战略,培育新动能,提升新势能,建设具有全球影响力的?

  • 杭州金融科技体验排名全球第一 浙大蚂蚁共建金融科技研究中心

    浙江大学宣布与蚂蚁集团共建金融科技研究中心,双方将在数据安全与隐私保护、智能科技、金融科技产业研究等领域开展产学研项目合作,争取在金融科技的技术创新、产业演化、商业模式、全球治理等领域取得标志性研究成果。

  • 唱吧黑科技:“声控”福利!帮你搜索另一个自己

    人生在世,知音难觅。每个人的声音就像指纹,是专属自己独一无二的密码,但在这个世界上总有几个人与你的声音契合,无论是音色还是音准都如此相像。唱吧作为声音的巨大数据库,精准的黑科技匹配你的专属知音!懂你的声音,并为你找到与你声音完美匹配的“灵魂伴侣”。唱吧是如何拥有这项“超能力”的呢?依赖于唱吧在声音科技领域多年的技术与经验的积累。唱吧对用户的声音细致分析,提炼出能代表你专属音色的密码,并构建出一个用

  • 蚂蚁集团就是一家科技公司

    ​自从蚂蚁集团申请上市的消息公布以来,我就有一个很明确的观点:资本市场应该将其视为一家科技公司,而且是同时具备To B和To C解决方案的科技公司,而不是一家金融机构。所以,各大投行、券商也应该派互联网分析师或软件/信息技术分析师去研究覆盖它,而不是派非银行金融分析师。

  • 亚信科技CEO高念书详解5G新赛道 电信软件隐形冠军亚信科技如何重构?

    向来低调的电信软件龙头亚信科技,今年以来频频受到资本市场和产业界的关注。9 月初,亚信科技正式被纳入恒生综合指数、恒生港股通指数以及恒生互联网科技业等指数,同时被纳入港股通。更早一些,中国移动认购亚信科技1. 82 亿股新股,股份占比约20%,并于 9 月 2 日完成新股发行和股权交割,中国移动成为亚信科技第二大股东。企业被纳入港股通,普遍意味着资本流动性提升,以及公司价值重估。事实上, 2018 年亚信科技在香港上市

  • 林芝腾讯科技有限公司出质广州虎牙信息科技有限公司股权

    9 月 21 日,广州虎牙信息科技有限公司新增一条股权出质信息,出质人为林芝腾讯科技有限公司,质权人为广州虎牙科技有限公司。资料显示,广州虎牙信息科技有限公司由林芝腾讯科技有限公司100%持股,质权人广州虎牙科技有限公司则由Huya Limited100%持股。

  • 消费者沟通太难?可能是你没掌握usmile的“嘿科技”

    摘要:广告投放越多,品牌们就越疑惑,为什么消费者越来越难买单?在去中心化媒介时代,看似品牌与消费者沟通渠道增加了,但其实双方沟通难度也在增加——消费者在信息消费上更加碎片化,对五花八门的营销信息免疫力也在不断强化。加上许多营销信息往往是品牌单方面自说自话,既无法引导消费者购买,更不能塑造长期影响消费决策的品牌印象。如何才能在新营销时代与消费者建立有效对话?成为了不少品牌的一大难。就在这几天,专业口腔

  • 如何提高散热效率?兰洋科技:把它浸入导热液!

    更高效的散热解决方案现在是全球顶尖实验室研究的方向,而这家中国的初创企业已经拿出了成熟的商用方案。当设备的性能强大到了一定的程度的时候,散热往往是阻止性能进一步提升的原因。以常见的主机电脑为例,常见的散热方式有风冷散热和水冷散热。无论是哪一种散热方式,基本都只能重点照顾某一区域的散热,而机箱整体的温度却没办法散出去。如何构建一套散热效率更高的方案呢?部分企业将目光瞄准了浸入式液态散热的方式——把需?

  • 联塑管聚焦科技创新,助力提质增速

    城市的繁荣发展,离不开高质量的基础建设,作为城市能源输送者的管道更是建设的重要环节之一。联塑管道作为行业中的佼佼者,在国家工程、城市基建以及民用建筑中都做出了巨大的贡献。那么联塑管是如何在实现高效生产的同时,保证产品始终如一的高质量呢?让我们走进联塑管,探寻它品质出众的奥秘。联塑管道生产高效品质出众联塑管道的高品质,源自于对细节的完美追求。联塑管道深知,模具的设计细节直接决定生产成败,无论是从模具

  • 月饼也能科技范儿:植物肉月饼上市

    中秋节将至,月饼销售如火如荼。在今年的月饼中,一位新的玩家引起关注,那就是植物肉月饼。据悉,植物肉是以大豆、豌豆等作物中提取的植物蛋白为原料,添加植物性风味物质,使其口感、风味上

  • 2020中国新科技100强评选结果出炉 万兴科技上榜

    9月16日,中国科学院《互联网周刊》、中国社会科学院信息化研究中心、eNet 研究院和德本咨询共同举办“2020中国新科技100强评选暨秋季金i奖颁奖”结果出炉,A股数字创意软件上市企业万兴科技凭借过硬的技术实力和前瞻的创新产业布局强势上榜,并荣获“2020中国新科技论坛领军企业”称号,体现了其在新科技领域的硬实力与影响力。在全球智能变革加速、产业技术实力快速提升的基础上,新科技在各行各业的应用逐步加深,推动企业朝着数字化?

  • 全国政协委员调研团走进信也科技 共探科技驱动助力经济发展之路

    9 月 3 日至 4 日,全国政协委员调研团来到了国内金融科技公司信也科技(NYSE:FINV),开展了以“科技驱动,助力经济”为主题的调研之行。本次调研由人民政协报社主办,在调研过程中,委员们表达了对于金融科技行业发展方向的看法,并同与会的嘉宾及企业代表进行了深入交流与探讨。金融生态进化 数据应用与安全为科技赋能金融基础近年来,金融行业发展迅速,随着现代生产生活方式的不断转变,市场对于金融产品与服务在时效性、便利

  • 首都科普联合行动科技企业开放日之特色活动 编程猫科技编程创作日——“中华小厨神”

    当中华厨师遇上编程,会产生怎么样的火花呢?今天,小编来到了编程猫科技的编程创作日的现场。这个活动可不简单,叫“中华小厨神”。为了让参观者感受图形化编程的奥妙和乐趣,特开展本次编程猫科普日线下活动。此次活动让参观者通过体验一款制作月饼的线上互动游戏后,编程完成此款游戏软件作品。活动开始啦!!!下午两点钟,活动准时开始,讲解小姐姐先带我们了解点猫是一家什么样的企业,参观了公司内部。不过讲解小姐姐也知道我们对这些不

  • 10月20日,和鲸科技有大事要宣布

    但在宣布前,请容许我们卖个关子。先一起将时间拨回2015,回忆下 K-Lab 的成长故事。 请回答,2015 作为和鲸科技的核心产品,K-Lab 从一开始就瞄准了业界空白。当时数据竞赛逐渐涌现,但却缺少统一的分析工具与开发工具。而竞赛中,数据科学家又需要通过各类工具来计算大量数据,导致数据科学家的工作效率和创新效率难以提升,竞赛管理的成本也难以降低。 为了填补数据竞赛市场的空白,满足数据科学家的需求。和鲸团队潜心研发,?

  • 深度布局新基建,并行科技助力云上科研

    2020 年 9 月 28 日至 30 日,以“新超算、新基建、新经济”为主题的第十六届全国高性能计算学术年会(CCF HPC CHINA 2020)在河南郑州举行。本次大会通过打造HPC CHINA云平台,全新升级云体验, 40 余场在线论坛和赛事展览活动,为全球10000+专业观众与HPC爱好者带来超算领域前沿学术成果展示、创新应用技术发布体验,来自中、美、日等多国顶尖科研机构、头部企业和高校的近 300 位HPC领域专家学者受邀出席线下论坛活动。中国超算/?

  • 参与评论
文明上网理性发言,请遵守新闻评论服务协议
  • 热门标签