首页 > 关键词 > 语音识别最新资讯
语音识别

语音识别

语音识别技术(Speech recognition)是指将人类语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。

相关“语音识别” 的资讯4276篇

  • 微软宣布以 197 亿美元收购语音识别技术公司 Nuance

    微软宣布将以每股56美元的价格收购语音识别巨头Nuance,交易价值达197亿美元。软首席执行官 Satya Nadella 表示:「Nuance 能提供医疗保健技术的 AI 层级,而且也是企业级 AI 实际应用之先锋。人工智能是技术的重中之重,而医疗保健是其最紧迫的应用。我们将与合作伙伴生态系统一起,将先进的 AI 解决方案交付到世界各地的专业人员手中,以推动更好的决策制定并建立更有意义的联系,同时我们将加快 Microsoft Cloud 在 Healthcare ?

  • 微软以197亿美元收购Siri语音识别合作伙伴Nuance

    微软以197亿美元的全现金收购了语音识别系统公司Nuance,从而控制了帮助苹果处理Siri查询的公司。在周末有初步报告称谈判正在进行之后,微软周一透露,它实际上已经与Nuance达成了协议。这笔交易的价格为每股56美元,较Nuance上周五的收盘价溢价23%。据推测,这宗交易给Nuance的估值约为160亿美元,但根据微软的数据,考虑到Nuance的净债务,实际全现金交易的估值将为197亿美元。现有的Nuance首席执行官马克?本杰明(MarkBenjamin?

  • 知情人士:微软洽谈160亿美元收购语音识别服务提供商Nuance

    据国外媒体报道,在260亿美元收购领英、75亿美元收购ZeniMax之后,微软仍在进行大手笔的收购,多家外媒报道称他们正在洽谈收购语音识别服务提供商Nuance,收购价格接近160亿美元。

  • 微软拟160亿美元收购语音识别公司Nuance

    微软正在就收购人工智能和语音识别公司Nuance Communications展开深入谈判。这笔交易可能最快在当地时间周日签署,周一宣布。这一计划显示出微软近期通过交易扩大业务的努力。微软曾在去年考虑收购短视频应用TikTok美国业务,并在上月完成了以75亿美元收购游戏开发商Zenimax。

  • Siri‌语音不再默认为女性声音,当贝D1 OS系统优化,语音识别更准确

    4月1日消息,根据国外媒体报道,今天苹果发布iOS 14.5 beta 6测试版系统,苹果对Siri做了一些改变。苹果表示,从iOS 14.5开始,Siri将不再默认为女性语音。目前,在测试版系统中,只有英语增加了新声音,中文并未增加。苹果在声明中表示:“我们很高兴为英语用户推出两种新的Siri声音,并让Siri用户在设备初始化时可选择他们想要的声音。这是苹果长期以来对多元化和包容性承诺的延续,产品和服务旨在更好地反映我们所处世界的多样性。”语音识

  • 腾讯云小微&腾讯云智能钛联合团队获国际口音英语语音识别赛冠军

    近日,语音研究领域顶级会议Interspeech2020召开,在本次大会的口音英语语音识别挑战赛上,腾讯云小微&腾讯云智能钛联合团队在口音英语语音识别赛道中以大幅领先的成绩获得冠军。Interspeech是由国际语音通信协会ISCA组织的语音研究领域的顶级会议之一。本次大会上提出,在全球范围内,标准英文ASR系统已经具备较高的识别正确率,但口音英语识别仍然是具有挑战性的课题,也是技术应用中亟待克服的最大挑战。为此,大会特别设置了口

  • 福特销量提升有妙招 语音识别 应用集成融合 多功能丰富你的生活

    在消费者日益追求创新产品的当下市场中,福特汽车运用高科技和差异化,在行业里独树一帜,彰显出自身独特而强大的生命力,让行业和消费者都对福特本土化发展再一次充满了信心!福特正在用智能网联改变着人们的生活方式,用科技的力量助力着福特销量的不断提升。早在福特中国2. 0 发布会上,SYNC+成为兑现“更福特、更中国”的承诺之一,也是助力提高福特销量的因素之一。无论是语音识别,还是应用集成和融合,福特SYNC+系统相对于?

  • 支持语音识别游戏指令!腾讯黑鲨游戏手机3全新JOYUI系统迎来全面升级

    近期手机圈的大事就要属 3 月 3 日即将发布的腾讯黑鲨游戏手机 3 了,除了在性能上的硬件升级外,通过黑鲨在细节上的“升而不同”口号,我们也能看出,新品不仅在散热、性能、操控及屏显等方面,在做明显升级的同时,还非常注重玩家体验,在细节处增设不少独家优化,例如升降按键+屏幕压感的多维操控提升,以及横握散热及背部磁吸的游戏手感提升,这也令许多玩家更加欣喜、期待。近日,黑鲨官方再次爆出新机将在软件上同样有大幅度

  • 语音识别新范式:完全的“端到端”模型,优势在哪里?

    “自然科学的发展除了按常规科学一点一滴地积累之外,还必然要出现‘科学革命’。”托马斯·库恩在其发表于 1962 年的经典著作《科学革命的结构》中提出的“范式转换”一词,如今已成为大家耳熟能详的技术用语。大的“范式转换”存在于基础科学领域,小的“范式转化”也存在于几乎每个细分的技术领域。语音识别新范式以自然语言处理的子领域“语音识别”为例,从 2012 年引入深度学习技术开始,语音识别的研究热点经历了三个阶段:

  • 今日头条“灵犬”反低俗能力升级 新增语音识别功能

    今日头条灵犬反低俗助手(以下简称“灵犬”)进行了升级。新版“灵犬”增加语音识别功能,支持用户以语音输入方式对内容进行反低俗检测,具备反色情低俗、反暴力谩骂、反标题党等能力。

  • 今日头条升级“灵犬”反低俗能力,加入语音识别功能

    12月24日消息,今日头条灵犬反低俗助手进行了升级,新版“灵犬”增加语音识别功能,支持用户以语音输入方式对内容进行反低俗检测,具备反色情低俗、反暴力谩骂、反标题党等能力。据官方介绍,“灵犬”本次所上线的语音识别功能主要涵盖语音类型识别和语音内容识别两大核心能力,在用户输入语音后,“灵犬”将通过分析音频类型,判断该音频是否包含实质内容。

  • 谷歌搜索将利用语音识别技术帮助用户学习复杂单词发音

    为了让用户能更简单的学习单词的正确发音,谷歌日前引入了一个新的搜索功能,让用户练习一些复杂的单词。

  • 林斌宣布好消息!语音识别大牛、Kaldi之父加盟小米

    今日,小米总裁林斌也在微博上宣布了这一消息:语音识别开源工具Kaldi的创始人,语音和AI领域大佬Daniel Povey决定加盟小米啦。他会在小米组团队开发下一代Kaldi,有兴趣的同学尽快跟@崔宝秋-小米 联系。

  • 捷通华声灵云智声一体机重磅发布:语音识别+机器翻译,无需联网,开机即用

    近日捷通华声重磅推出灵云智声一体机,面向日常办公、演讲汇报、课程培训等语音场景,无需连接任何网络,开机即用,为用户提供语音速录的完美解决方案。同时,轻便、灵活的一体机也可应用于移动办公场景。灵云智声以语音识别技术为核心,结合机器翻译、语义理解等多种人工智能技术,交汇融合出语音输入法,字幕展示,中/英/维多语种识别,中英、汉维互译等多种特色功能,服务多种应用场景。Function 1语音输入法语音录入笔记适用于

  • 声网推一站式智能语音识别方案 用AI高效助力内容审核

    近日,全球实时音视频开创者声网Agora宣布推出一站式智能语音识别解决方案,将通过AI智能降噪、声纹检测、语音识别等技术,进行在线实时语音识别,帮助平台更智能、高效的识别语音中存在的涉黄、涉政、广告等违法违规信息。净化平台内容质量,降低监管风险,提升用户体验。音频行业监管难 高效内容审核成平台刚需一段时间以来,网络音频行业乱象频出。今年 6 月,国家网信办针对网络音频乱象问题启动专项整治行动, 26 款音频平台?

  • 从不温不火到炙手可热:语音识别技术简史

    语音识别自半个世纪前诞生以来,一直处于不温不火的状态,直到 2009 年深度学习技术的长足发展才使得语音识别的精度大大提高,虽然还无法进行无限制领域、无限制人群的应用,但也在大多数场景中提供了一种便利高效的沟通方式。本篇文章将从技术和产业两个角度来回顾一下语音识别发展的历程和现状,并分析一些未来趋势,希望能帮助更多年轻技术人员了解语音行业,并能产生兴趣投身于这个行业。

  • 快鼠智能语音鼠标创新语音识别技术解放双手

    随着科技的发展,AI智能时代已经到来,智能语音也已经深入生活的方方面面。如今,快鼠智能语音鼠标采用科大讯飞语音识别技术,它的出现标志着双手即将得到解放,办公娱乐都将实现智能化。快鼠这款第二代升级版鼠标颜色是充满黑科技范儿的蓝黑色,拿到鼠标仔细研究了一下,首先可以看出的是做工比较精致,孤形外观设计,线条流畅,握感饱满,小巧玲珑,出差携带十分方便。从外观上即可看到鼠标滚轮键后面是新加入的语音翻译键和回车

  • 王海峰:百度输入法实现中英混输 语音识别准确率提高2成

    百度AI开发者大会还在进行中。继李彦宏宣布百度大脑已向开发者开放 200 多项AI能力之后,百度CTO王海峰带来了全新升级的百度大脑5.0。作为软硬件一体的AI大生产平台,百度大脑5. 0 包括基础层、感知层、认知层、平台层和AI安全五大部分,实现了AI计算、计算架构与应用场景的创新融合。

  • Facebook语音识别糟糕闹笑话:视频字幕无法直视

    人工智能如今成为科技行业最热门的技术,不过社交网络巨头脸书(Facebook)在这一领域技术积淀不佳,产品闹出了笑话。据国外媒体报道,周三下午,军工巨头诺斯罗普格鲁曼公司(Northrop Grumman)制造的一枚安特鲁斯号火箭发射升空,将一艘载有3. 4 吨货物的天鹅号飞船送往国际空间站。从维吉尼亚州沃洛普岛发射的火箭完美无缺,飞船于周五抵达空间站。

  • 谷歌人工智能技术 可将语音识别错误率降低29%

    【CNMO新闻】近期,语音识别技术发展迅猛,像EdgeSpeechNet等最先进的模型能够达到97%的准确率,但即使是最好的系统偶尔也会被生僻字难倒。为了解决这个问题,谷歌和加利福尼亚大学的科学家提出了一种方法,可以利用

  • 百度输入法AI探索版亮相 SMLTA加持语音识别精度超行业水平15%

    【TechWeb】1月16日,百度输入法AI探索版今日正式亮相,这是一款默认输入方式为全语音输入,并可以调动表情、肢体等进行全感官输入的全新输入产品。

  • 云从科技宣布刷新语音识别世界纪录

    据亿欧报道,今日,云从科技宣布在语音识别技术上取得突破,在全球最大的开源语音识别数据集Librispeech上刷新了世界纪录,错词率降到了2.97%,将Librispeech的WER指标提升了25%,超过阿里、百度、约翰霍普金斯大学等企业及高校。​

  • 谷歌幻灯片工具增语音识别新功能

    据新浪科技报道,谷歌本周宣布,将在Google Slides演示工具中加入新的自动字幕功能。此前,谷歌已经在多款产品中提供语音识别功能。例如,谷歌文档允许用户使用语音编辑文本,而谷歌的移动输入法Gboard也支持语音输入。Android TV用户可以使用自然语言语音搜索内容。​

  • 阿里巴巴开源语音识别模型 DFSMN

    阿里巴巴达摩院机器智能技术实验室语音识别团队于即日推出了新一代语音识别模型——DFSMN,与此同时团队已将这一模型开源。

  • 高通宣称其语音识别系统准确率高达95%

    据外媒报道,在美国波士顿举行的Re-Work深度学习峰会上,高通的人工智能研究人员克里斯-洛特(Chris Lott)展示了其团队在语音识别计划方面的新进展。这种语音识别系统在智能手机或其他便携式设备上运行,包含两个神经网络:循环神经网络(RNN)和卷积神经网络(CNN)。循环神经网络利用其内存来处理输入信息,而卷积神经网络则模仿人类大脑中神经元之间的联系方式。洛特称,这种语音识别系统识别单词和短语的准确率达到了95%。

  • 「HAY!17」语音识别PK赛 英语流利说完胜科大讯飞

    12 月 16 日,由著名科技媒体PingWest品玩主办的「HAY!17·無限奇境」嘉年华在北京炸裂开场。在语音识别 PK 赛的环节,英语流利说以100%的准确识别率一举战胜以高语音识别率闻名的科大讯飞,引发全场关注。英语流利说联合创始人兼首席科学家林晖博士随后登场,为大家揭秘了英语流利说背后的“黑科技”。 语音识别PK赛现场:英语流利说 PK 科大讯飞在PK赛环节中,测评师依次读出了三段英文,由英语流利说和科大讯飞同时进行识别。结

  • 语音识别领域跑出黑马,云知声发展前景浅析

    近年来,语音识别技术取得了长足发展。基于大数据积累、深度神经网络模型的发展及算法的迭代优化,语音识别技术准确率不断提升,甚至达到了能够媲美人类的地步。 中国语音产业联盟《2015中国智能语音产业发展白皮书》数据显示,2017年全球智能语音产业规模将首次超过百亿美元,达到105亿美元。在语音识别领域这个赛道上,充斥着大大小小的竞争者,国外有微软、谷歌、IBM,国内有百度、科大讯飞、思必驰、云知声、出门问问等等。 智

  • 远鉴科技“语音识别”技术获美亚柏科青睐!

    近日,美亚柏科与远鉴科技达成合作,远鉴科技将为美亚柏科提供“语音识别”技术支持,结合双方各自的领域优势,一起深入探索人工智能与大数据结合的科技伊甸园。在如今信息流逐渐进入“ 白炽化发展 ”的时代,人工智能与大数据形成了非常明显的互补互足关系,从安全保障到实名认证,二者巨大的潜在市场以及应用空间都是未来科技进步不可或缺的一支巨流。语音识别:人工智能领域的雄鹰语音识别,就是让机器通过识别和理解过程把语音

  • 讯飞输入法发布A.I.语音输入 语音识别率首破98%

    凭借在智能语音方面的杰出表现,讯飞输入法牢牢把握语音输入第一品牌。随着人工智能时代的到来,A.I.技术飞入寻常百姓家,以讯飞为代表的输入法产品得到飞跃发展。日前,讯飞输入法全面内置A.I.语音输入,通过神经网络和机器学习的应用,使中文语音识别率先突破98%,语音交互的未来已来。既然时下,A.I.成为产品应用的亮点,讯飞输入法自然应势而为。讯飞输入法A.I.语音输入搭载自然语言理解(NLU)优化模型,从“听话”进化到“听懂

  • 搜狗语音识别技术助力新浪法院建设智慧庭审服务

    “审判长、人民陪审员,根据《中国人民共和国刑事诉讼法》第 184 条、第 193 条、 203 条规定……”近日,不少在网上看庭审直播的公众发现,与以往只有视频画面和声音不同,还增加了实时动态的字幕,成为庭审视频直播的新亮点。 原来,为全国法院提供庭审过程互联网视频直播及案件开庭录像云服务的新浪法院频道,引入了搜狗公司提供的人工智能语音识别技术,在庭审直播中实现了各角色发言自动转写为文字,视频和语音识别文字的融