首页 > 见闻 > 关键词  > 人工智能最新资讯  > 正文

谷歌正研究一个AI软件 帮助语言障碍人士自由交谈

2019-07-19 09:57 · 稿源:站长之家

站长之家(ChinaZ.com) 7月19日 消息:据外媒报道,谷歌人工智能部门一直在开发专门针对语言障碍人士的新软件。

Big G在一篇最新的文章中提出一种新的语音转换成文本软件“Parrotron”,专门为有语言障碍人士设计。Parrotron在一个深度神经网络运行,该神经网络被训练用来将非典型的语音模式转换成流畅的合成语音。有趣的是,这项技术不依赖唇形变化等视觉效果。

未来提高准确率,谷歌给神经网络提供了“近30, 000 小时由数百万个匿名话语对组成的语料库。这项技术从本质上把“聋哑人的单词错误率从89%降低到25%”,但是谷歌希望能进一步改善结果。

目前,完整的研究已经发布在ArXiv上,感兴趣的网友还可以在GitHub库中找到更多的Parrotron的例子。

相关文章:

举报

  • 相关推荐
  • IBM研究:CMO将AI视为增长动力,但运营障碍阻碍了他们的步伐

    IBM最新研究显示,81%的CMO认可AI的战略重要性,但执行面临挑战:54%高管低估了AI落地的运营复杂性,仅22%企业制定了明确的AI决策指导方针。数据表明,组织内部协作不足是关键障碍——仅24%企业拥有跨职能协作平台,44%实现了需求规划系统集成。研究还发现,实现营销、销售和运营全面协同有望带来20%收入增长,但当前仅28%企业能有效管理跨部门客户体验。值得注意的是,64

  • 抖音上线AI饭搭子“探饭” 知情人士:目前仅支持小程序

    字节跳动旗下用户增长团队近日推出了一款名为探饭的AI美食助手,该产品搭载字节自研的豆包大模型,由全资子公司北京有竹居网络技术有限公司开发运营。 探饭主要为用户提供美食相关的智能向导服务,在实际体验过程过程中,还发现通过探饭也能够购买团购套餐或点外卖,以及AI点菜。 探饭的功能较为丰富,不仅可以实现探店推荐、菜品推荐、美食攻略、点菜,还可以

  • 这家中国软件巨头,靠AI能否“蝶变”?

    在企业级AI这场军备竞赛中,或许比企业更着急的是用友、金蝶这些中国传统软件巨头。 今年3月,金蝶发布2024年财报时,金蝶集团董事会主席兼CEO徐少春表示:“金蝶的云转型已经成功,下一个目标就是AI转型。” 2个月后,金蝶围绕企业管理AI已形成体系化技术产品。 金蝶升级企业级AI平台苍穹Agent平台2.0,并基于此底座搭建N个场景化智能体,同时还提供了100+个AI应用场景�

  • 苹果自研AI模型难产:改用第三方大语言模型

    苹果可能会跟OpenAI或Anthropic合作,双方正在谈判讨论一项潜在交易,苹果希望调用OpenAI或Anthropic的第三方大语言模型来为Siri提供技术支持。 据悉,OpenAI或Anthropic正在训练适配苹果私有云计算服务器的模型,苹果也在进行测试,目前苹果发现Anthropic的AI模型最适合Siri,且与Anthropic初步讨论了一些财务条款,消息称Anthropic要求苹果每年支付数十亿美元的费用,且该费用会随时间�

  • 苹果研究发现:AI 模型在遇到复杂难题时会“崩溃放弃”

    AI 的“推理能力”或许远没有我们想象中的那么强……

  • Copy2AI三款AI软件上线,功能强大,免费无限制

    Copy2AI推出三款AI工具:智能剪贴板、智能创作助手和智能聊天助手。智能剪贴板能自动分类记录剪贴内容,支持语义搜索;智能创作助手提供灵感激发、风格转换等功能,助力内容创作;智能聊天助手可定制对话风格和角色。三款工具均完全免费、无功能限制,支持本地部署保障隐私安全,适用于职场人士、内容创作者、学生等多场景,旨在让AI技术真正触手可及,提升工作和

  • 真AI翻译耳机来了,金运灵动环A9耳机重塑跨语言交流新体验

    金运灵动环A9耳夹式耳机通过AI大模型技术颠覆传统翻译设备,实现百种语言实时互译,0.7秒极速响应,准确率达98%。产品突破四大翻译困境:解决传统工具延迟高(1.5秒)、专业术语误译(准确率仅80%)、操作繁琐(72%用户放弃深度沟通)、功能单一等问题。其创新骨传导技术实现"耳听即译"的无缝体验,支持会议录音转写、AI写作辅助等扩展功能,以百元价位提供千元级专业翻译设备的性能。对比传统翻译器,该产品将翻译延迟降低20%,误译率控制在0.3%,且重量仅5克,解放用户双手。典型案例显示,用户与外国客户沟通时,设备能精准处理专业术语和俚语(如将"炸鸡啤酒"关联韩剧文化梗)。产品重新定义智能翻译标准,让跨语言交流从"手动操作"进化为"自然对话",证明科技普惠的本质是让高端功能触手可及。(140字)

  • 表情包自由!腾讯搜狗输入法联合腾讯混元 推出AI表情合成

    不用再为微信、QQ回消息而烦恼,目前毫秒级AI生成表情包已经实现。 近日,搜狗输入法版推出AI合成表情”和候选表情”两大功能,用AI技术提升用户社交沟通体验。 其中,AI合成表情”基于腾讯混元大模型技术,用户输入文字描述或表情描述,便可毫秒级生成个性化表情包。 候选表情”则是用户在输入常用文字时,候选区自动推荐高匹配度表情包,一键即可发送,告别手�

  • 在AI、反垄断等多重压力下,谷歌推“员工自愿离职计划”,大范围裁员

    谷歌在试图削减成本的同时,刻意避免大规模裁员,以防进一步打击员工士气或引来更多来自立法者和监管机构的审视……

  • 外卖,酒旅……京东正围绕供应链下一盘大棋

    2025年京东618再创新高,一系列全新的商业逻辑也正逐渐清晰地呈现在行业视野之中。 数据显示,京东618下单用户数同比增长超100%,京东零售线上业务、线下业态及京东外卖总订单量超过22亿单。大促期间,京东APP的DAU也创下历史新高。 不仅如此,京东外卖首战618,日订单量已经超过2500万单。同时,位于北京、深圳、武汉、太原等地的5家京东MALL陆续开业,合肥超体也升级为