一文看尽Google I/O大会:史上最快手机全语音操控,不开口也能打电话,安卓Q登场

2019-05-08 08:44 稿源:量子位公众号  0条评论

谷歌,google

图片来源图虫:已授站长之家使用

声明:本文来自于微信公众号 量子位(ID:QbitAI),作者:边策 乾明 李根,授权站长之家转载发布。

不忘初心,AI前行。技术愈精,情怀越高。

刚刚,Google I/O2019 大会开幕。

2 小时主题演讲,全球AI第一大厂秀出最新黑科技进展,并且情怀依然满分,Google用行动诠释科技向善。

今年大会演讲主题:Keep making magic.

究竟Google的最新黑科技魔法有哪些?量子位带你一文打尽。

开场:不忘初心

大会开始,Google CEO桑达·皮猜在一片欢呼中微笑登场。

劈柴哥说今年Google I/O,视觉能力与众不同,比如观看方式加入了AR体验,通过手机,利用一个App就能身临其境、解答一切。

而且别看事情小,背后驱动是Google的初心和使命:整合全球信息,使人人都能访问并从中受益。

Our mission is to organize the world’s information and make it universally accessible and useful.

image.png

劈柴哥强调,正是这样的使命,让代代Google人推出更好的产品,帮用户更高效,让用户更快乐,要做更有用的Google.

一切自然离不开AI。

AI视觉成新入口

Google CEO先从去年推出的谷歌信息流说起,虽然这还遭到李彦宏感慨——谷歌学师百度,但劈柴哥解释,希望能在准确搜索之后,进一步让用户更完整了解世界。

背后都是机器学习、AR和AI等前沿黑科技。

比如你Google一下搜索黑洞,Google AI就能给你推荐相关新闻,包括给出一条完整的信息流时间线,展示黑洞是如何被发现的。

这其中,Google还解锁了越来越多视觉能力,让用户想要的信息更直观准确呈现。

比如利用AR视觉能力,搜索不仅准确提供结果,还能360°全面了解。

你想买一双鞋:

或者小朋友想了解大白鲨:

那有没有可能是看到一张图片,也想知道更多相关信息?

谷歌说Google Lens——智能拍照\图搜应用,为此而生。而且不是拍照识别那么简单。

现在Google Lens还能做更多。

拍菜单,自动显示大众点评高赞菜,拍小票,自动计算金额和小费。

Google Lens只是入口,还结合了诸多其他Google App的能力。

比如地图、翻译、大众点评……一个入口背后,集齐谷歌全家桶能力。

那如果大字不识一个,能不能享受到AI福祉?

Google拿出第一个情怀大满足案例。

Google Go就可以了。

现场举例,在印度,文盲大姐姐通过Google Go,即便大字不识一个,还只能说印地语,也能手机拍照,然后让手机自动朗读出来,用智能手机了解想要了解的一切——无论线上还是线下。

目前,Google Go已经包含印地语、中文在内的 10 多种语言。

谷歌团队将Google Go整个大小控制在100kb以下, 35 美元价位( 200 元)的手机,有摄像头就能使用。

真正做到用得起、用得好,一款Google Go在手,世界说走就走。

毫无疑问,现场掌声和欢呼声一片。

AI语音助手更全能

视觉之外,就是AI在语音语言方面的能力。

劈柴哥先从Duplex说起。

去年,Google推出了震惊四方的打电话AI系统Duplex,并在一年内实现了全美 40 多个州商用。

今年Google会把这项功能扩展到网络上,叫做Duplex on the web,帮你租车、预订电影票和餐厅座位。

比如你想租车,用Duplex打开租车公司的网站,这个AI就能代替你填写所有必要信息。在提交订单之前,人类只需要核对一下信息点击即可。

Duplex还可以理解日历行程信息、Gmail邮件内容,自动在填写订单时补全信息。

怎么说呢,虽已过当红阶段,但Duplex变得更强更务实。

而Duplex之源——Google AI助理Google Assistant也有大进展。

Google宣布升级AI语音助手,并把语音交互能力完全放入手机。

优秀到什么程度?

整个过程完全不用上手,也不需要反复用唤醒词,语音交互就能实现对手机的全过程操控。

更厉害的是语音识别速度保持在 1 秒以内,比用手更快。

现场小姐姐的演示,搞得人心激动。

Google解释,之所以如此流畅,是因为他们谷歌数据中心的语音识别模型“塞进了口袋”,原本100GB模型被压缩到0.5GB,使得集成到手机中成为可能。

而且,更小的模型还降低了网络延迟,交互速度提升 10 倍。

值得一提的是,Google的语音助手,还能跨App操作、完成任务,比Siri不知高到哪去了。

现场举例,如果你正在和朋友聊天,突然想发送一张过去旅游的照片,你只需要告诉它你照片是在哪拍的、里面有什么内容,AI助手就能把照片直接发送过去。

只可惜,Google的AI语音助手,Google的这个福音技术,只能在Google“亲儿子”——Pixel手机上使用。

当然,依然是AI语音语言能力,还有技术牛X,情怀满分的新能力。

Google AI可以给任何视频加字幕

之前,YouTube视频即使上传者没有给字幕,也能通过自动识别添加实时字幕。

现在Google把这个能力带到了任何视频中——需要强调的是手机终端,没联网也OK.

无论是相册中自己拍的视频、网页中的视频、聊天视频,统统能加上字幕,以后再也不怕地铁上看剧听不清对话了。

但如果只把技术用到这一步,Google就不会是那个人类希望了。

Google这次展示了Live Relay的技术,用语音识别和TTS,帮助聋哑人士接电话。

比如打进来的声音,转化成文字,然后让聋哑人可以像回复短信一样接电话,输入的文字会实时转写、自动变成语音发出去。

更贴心的是,Live Relay还利用了Google智能预测和回复功能。对打字内容做出预测。

不要担心打字速度跟不上语音,一切实时甚至“提前”进行,转写质量也很高,打字速度能跟上语音通话的速度。

现场都被Google的情怀填满了。

这项技术也被叫作:不开口就能打电话。

聋哑人群体能更好享受智能手机和AI的便利了。

声明:本文转载自第三方媒体,如需转载,请联系版权方授权转载。协助申请

相关文章

相关热点

查看更多