首页 > 外闻 > 关键词 > Siri最新资讯 > 正文

用声音控制一切:Siri背后公司Nuance的终极梦想

2012-06-01 16:24 · 稿源:雷锋网

直到现在,还有许多人认为对着计算机说话、让其按照你的指令去完成任务是一件很科幻的事情,但有这么一家公司相信通过声音可以控制一切——越来越多的人与他们的智能手机交谈,用语音发邮件,短信,导航,查找信息。现在,语音控制系统已经在智能手机、电视,汽车上发挥它的魅力。

“语音和自然语义理解突然成为一门前沿科技,而我们正站在这个过渡点上。我认为语音识别将真正颠覆目前的计算机交互接口”。位于马萨诸塞州柏林顿的Nuance 通讯公司的CTO Vlad Sejnoha 如是说。关于Nuance我们并不陌生,Siri使用的就是Nuance的技术,在此之前曾传言苹果将收购这家语音识别公司,该公司开发了Dragon等产品,统治了语音识别市场。

移动设备变得越来越强大,这也是语音接口更加有用,更加普遍的重要原因之一。语音识别技术的发展也可以用”一日千里“来形容,随着机器学习,统计数据采集技术等机器理解人类语音所需技术的稳健发展,精细的语音技术已经应用于客户服务中心,可以让用户进行菜单导航,或者帮助识别是否可以挂断粗鲁的客户。

Jim Glass ,一位从80年代就已经从事语音接口的研究的MIT高级研究员认为,现今的智能手机的语音识别功能已经与他在90年代做出的机器一样强大。智能手机同时从云端获取高带宽数据,可以让服务器来做包括语音识别和语义理解等高负荷工作。“更多数据与更强大的计算机结合意味着更精密的统计模型。”

移动语音接口最突出的例子莫过于个人语音助理Siri,最新一代的iPhone已经配备了这一功能,调戏Siri也成为了风靡一时的游戏。此外,在Android,Windows Phone等其他手机平台上已经出现了一些配备语音功能的应用。然而这些接口还存在很大限制,必须要靠近机器接口才能与手机交谈。

Nuance 创建于1992年,已经获得大量的语音技术业务,近些年,Nuance将他们的语音识别技术熟练的应用于新兴的语音接口市场。现在在世界35个地区拥有6000名员工,2012年第二季度的收入已经达到3.903亿美元,相比2011年同一时期增长了22.4%。

语音识别会如何改变移动互联网?Nuance的CTO Vlad Sejnoha称,语音识别非常适合移动计算,用户的手和眼睛已经被其他事物占据,而且单个语音命令就可以完成平常需要许多点击按键才能完成的工作。目前语音识别软件在智能手机上已经获得成功,而Nuance 希望能更进一步,将他们的语言接口应用到更多地方,尤其是电视、汽车。

在电视上使用语音操作的好处是让用户可以从手动操作中解放出来,全身心的投入到娱乐中。在Nuance的研究实验室,Sejnoha 在电视机上演示了称作Dragon TV的软件。只需说一句“Dragon TV,找梅丽尔。斯特里普主演的电影”——语音接口立刻通过频道节目单找到了合适的电影。这一技术的一个版本已经出现在三星出售的电视上。另一条消息是,最近很多传言Apple 要开发自己的电视产品,并推测会用Siri做控制。在Walter Isaacson的乔布斯传中,这位已故的CEO宣传已经解决了Apple TV的设计问题。

同时,Nuance的技术也用在福特公司的同步娱乐系统上用于汽车导航,天气信息,和音乐。目前已经有4百万两配备语音识别的汽车进入市场。上周,Nuance 发布了称作Dragon Drive的软件,允许汽车制造商自己为汽车添加一些语音控制特性。

为更好地推广语音识别技术,Nuance开发了一系列地软件开发套件允许任何开发商将语音识别技术纳入他们的应用中。Montrue 科技是一家位于俄勒冈州Ashland的公司,他们使用Nuance的移动医疗SDK开发iPad 应用,允许医生们口述记录诊断内容。

“它精确地不可思议,”Montrue地CEO和联合创始人、急诊医生Brain Phelps说道。

语音识别的未来应该不仅仅如此。可能未来有一天,人们甚至会与他们的穿戴式计算机对话——例如说Google 开发的智能眼镜Project Glass。或许这一天并不遥远,Nuance就表示,他们将积极计划如何将语音技术运用在穿戴式计算设备上。

Via TechnologyReview

(Carter_sysu 供雷锋网专稿,转载请注明!)

  • 相关推荐
  • 大家在看
  • 三星将发布更多Fan Edition旗舰设备

    三星于昨日发布了大家期待已久的 Galaxy S20 FE 机型,起步价仅为 699 美元(约 4770 RMB)。发布会期间,这家韩国电子巨头还宣布未来将推出更多的 Fan Edition 旗舰设备。此前,三星已经通过“Lite”尾缀,将同系列的产品价格拉得更低。但现在看来,该公司将放弃这一“廉价”的命名,转而采用更有人缘的“Fan Edition”。

  • Imagination下代新品引入光线追踪:未来桌面级体验

    Imagination今天发布了新一代IMG B系列移动GPU,同时预告将在明年发布下一代IMG C系列,最大亮点就是加入对光线追踪的支持,这在移动设备上还是第一次!NVIDIA RTX 20系列显卡开创了消费级光追

    GPU
  • 阿里云 Teambition 网盘移动端迷你版国庆日上线

    阿里巴巴旗下办公套件Teambition 官方宣布,Teambition 网盘移动端迷你版即将在国庆日上线,马上可以开放更多内测了。根据海报介绍,Teambition网盘国庆上线后可以查看和下载文件,再过一个月支持上传、下载、分享功能更完善,可以自定义底部导航。

  • 小米闻声新增字幕模式:语音实时转文字 识别率达98%

    9月27日是第63届“国际聋人节”。MIUI官方宣布,小米闻声新增字幕模式。现在就可以前往小米社区App申请参与内测。在小米闻声的小窗模式下,将小窗贴近屏幕两侧可进入字幕模式,依然

  • 字节跳动申请注册多项 “ByteCoffee”商标

    企查查 App 显示,北京字节跳动科技有限公司申请注册多项 “ByteCoffee”商标,目前状态为注册申请中。“ByteCoffee”商标国际分类分属 “30 - 方便食品”及 “43 - 餐饮住宿”。

  • iPhone 13部分细节曝光:将采用120Hz ProMotion显示屏

    显示器行业分析师Ross Young在社交媒体爆料了一系列“iPhone 13”的信息。根据爆料,"iPhone 13"将继承即将到来的iPhone 12产品线,同时还会发布第三代iPhone SE。iPhone 13系列包括一款6.7英寸的 "Pro Max"机型、一款6.1英寸的 "Pro"机型、一款6.1英寸的非Pro机型和一款5.4英寸的 “mini"机型。Ross Young称,iPhone 13 Pro机型上 "最重要的发展"将是采用120Hz功能的ProMotion显示?

  • 全球首款64核工作站联想ThinkStation P620震撼发布

    联想首发亮相全球首款64核工作站联想ThinkStation P620。ThinkStation P620作为联想和AMD携手打造的史诗级工作站产品,在发布之前已备受各界关注。作为全球首款也是唯一一款采用AMD Threadripper PRO处理器的专业工作站,联想ThinkStation P620将前所未有的强悍性能和扩展性融于一体,为影视特效、建筑BIM、工业设计、精密影像处理等高运算量、高技术含量的专业创新工作提供前所未有的极致体验,树立全新行业标杆

  • iPhone12 Pro Apple 1 Edition曝光 梦回70年代只有9台

    日前,珠宝商Caviar又推出了一款iPhone 12 Pro(Max)定制方案,但与往不同的是,这次的定制设计以Apple 1 PC为主题,对于当时的纹理、logo、细节特征等都进行了很好地还原。

  • Tim Cook发布了“活动日”的音乐播放列表 歌名给相机点赞

    在苹果"iPhone12"发布会之前,CEO蒂姆·库克透露了这次活动日的AppleMusic播放列表。TimCook在Twitter上说:"嘿,Siri,播放我的活动日播放列表。"并附上了整个播放列表的AppleMusic链接。这份列表似乎是昨天更新的,共有27首歌曲,时长1小时42分钟。

  • 联想即将发布全球首款64核工作站ThinkStation P620 性能突破边界

    9月23日上午10点,联想将举办“智·造原力 联想ThinkStation工作站全家族发布会”。包括徐工集团,Foundry,超图软件,清华大学等重磅伙伴都将来到发布会现场,共同见证史诗级工作站联想ThinkStation P620的震撼亮相,并深入对话探讨中国企业如何通过高效的数字化手段在海量运算时代把握致胜先机。本次发布会还将在联想官网、B站、天极网、土木在线、e-works、聚变网等平台同步直播。本次发布会将重磅推出史诗级工作站新品ThinkSta

  • Bing可以用语音搜索了 微软增加语音搜索语音答复功能

    据外媒MSPoweruser消息,微软日前宣布,Bing桌面版已经提供Bing语音搜索体验。用户可以使用此功能来搜索或提问,并从Bing快速获得音频回复。

  • 耳目一新,虚拟动点以OptiTrack运动捕捉技术亮相InfoComm盛会

    10月14日—16日,以“网融万物,智向未来”为主题的2020中国国际信息通信展览会在北京国家会议中心盛大开展。展览会特别设立移动物联网成果示范专题展示区展示移动物联网前沿成果。中国联通物联网作为重要参会企业精彩亮相此次大会,以“5G物联 智慧同行”为主题,设立物联星际中的5G+AIoT核心能力星球、智慧城市星球、工业互联网星球等7大物联星球,邀请观展嘉宾搭乘“联通5G”飞船,解锁三十余项物联黑科技以及四十余款雁飞系列行业终?

  • 中国电信10000号率先实现智能语音服务全覆盖 识别准确率超90%

    2020 年 6 月,中国电信 10000 号实现全智能语音门户在全国 31 省开放,成为国内首个将智能语音服务全面、深入覆盖到全国的运营商,月均智能语音导航服务量超过 6500 万通。目前,中国电信 10000 号实现 31 省全智能语音门户全覆盖,智能语音服务占比超过50%,语音、语义识别准确率均超90%。

  • 箐智智能·用语音遥控生活

    经由近半年时间的倾力开发与反复测试,这款由箐智(深圳)智能科技有限公司专家团队独家研制的“小智管家”,即将于 2020 年 10 月中旬正式投放市场,与广大客户见面。箐智(深圳)智能科技有限公司作为一家管理团队与技术人员十分年轻化的企业,始终不忘提高创新能力,承担社会责任,致力于在大数据时代下,让智能设备在低成本的条件下,尽可能多地走进千家万户,让普罗大众都能享受到科技创新所带来的便利生活。基于这一企业文化所推

  • 巴基斯坦宣布禁用TikTok,称未过滤不道德内容

    Tiktok目前虽然在美国地区依然可以继续运营,但此前已经遭到了印度的禁令,如今对Tiktok下达禁用的国家增加了巴基斯坦。就在10月9日巴基斯坦电信管理局(PTA)发布公告称,将禁用TikTok应用,原因是收到社会各界“关于TikTok不道德及不雅内容的大量投诉”。

  • 人脸识别门禁的运用原理及优势

    人脸识别门禁适合应用在什么场景里?了解了人脸识别门禁的运用原理和优势,我们就能知道人脸识别门禁现在几乎可以应用在各行各业需要门禁的场景里,为人员出入人证核验进行智能查验,智能开关门,有效减轻保安门卫的工作量,提高进入人员的安全防范和管控质量。为了更好地落实大检修期间施工人员进出厂规范管理要求,解决进厂人员激增与疫情防控,人工把关效率低的矛盾,最近中原石化在紧急部署组织实施门禁系统升级。截止目前已实

  • 原神关于Anti-Cheat反外挂程序问题的修复声明公告

    原神最近被曝有后门程序,日本玩家反应过激,原神官方发布了关于Anti-Cheat反外挂程序的说明公告,表示这是反外挂程序的问题,下面就一起来看看吧。

  • 字节跳动发布TikTok不实传言说明,说明全文一览

    北京时间 9 月 21 日早间,字节跳动官方发布“关于TikTok若干不实传言的说明”,字节跳动表示创始人及中国管理团队拥有控股权,控制字节跳动。

  • 招聘信息表明苹果将向波兰、捷克、希腊、越南、印尼等市场拓展Siri服务

    MacRumors 报道称,苹果公司正在招募一批熟练的 Siri 注释分析师,并且暗示了将支持更多区域市场的语种。以爱尔兰 Cork 办公室为例,该公司正在招聘精通乌克兰语、匈牙利语、斯洛伐克语、捷克语、克罗地亚语、希腊语、佛兰德语、罗马尼亚语的人手。此外 ThinkApple 指出还有波兰语,且新加坡办公室正在招聘精通印尼语和越南语的人手。

  • 抖音测试语音通话功能 后期将全面开放

    近日,抖音正在向部分用户测试了“语音通话”功能,用户可以在抖音App内的好友聊天界面的右上方看见“语音通话”标识。据悉,抖音的语音通话与微信的语音通话,没有太大的区别。目前,抖音语音通话功能正测试中,后期会对所有用户全面开放。

  • 参与评论
文明上网理性发言,请遵守新闻评论服务协议
  • 热门标签

热文

  • 3 天
  • 7天