首页 > 业界 > 关键词  > 谷歌最新资讯  > 正文

谷歌 Lookout 软件 AI 新功能帮助盲人更好地了解数字图片信息

2023-05-22 15:03 · 稿源:站长之家

站长之家(ChinaZ.com) 5月22日消息:谷歌官方日前分享了其 Lookout 软件的最新更新细节,该软件于 2019 年首次推出,利用人工智能处理图像的 Alt 文本信息,并允许用户与系统进行问答式会话。这一功能基于 Google DeepMind 开发的先进视觉语言模型。

谷歌,google

Lookout 软件目前正处于测试版,并经过与英国皇家盲人协会(RNIB)的密切合作开发,邀请有限的人测试这一功能,并计划很快向更多人提供这一功能。

Alt 文本是内容创作者可以添加到视觉上的描述,以便盲人或低视力的人可以得到数字图像中的描述——无论是网站上的照片还是与朋友分享的社交媒体图像。问题是很多图片的标题和 Alt 文本质量不高,或者往往根本就没有,这使得很多人无法获取视觉信息。

事实上,卡内基梅隆大学 2019 年的一项研究发现,在 109 万条推文中,只有 0.01% 包含内容创作者添加的 Alt 文本,这意味着超过 99% 的这些图片不容易被失明的人获取。现在,人工智能正在帮助使图像更容易获得。

Lookout 于 2019 年推出,是与盲人和低视力群体共同设计的,它利用人工智能帮助人们完成日常工作,如整理邮件和收拾杂物。现在 Lookout 中一项名为「图像问答」的新功能正在为盲人和低视力社区的特定人群推出。现在,无论图片是否没有说明或 Alt 文本,Lookout 都可以处理图片并提供描述——然后人们可以用语音或打字来提问,对图片中的内容有更详细的了解。

「这次合作显示了我们的多模态模型如何直接惠及人们的生活,」谷歌 DeepMind 首席业务官 Colin Murdoch 说。「它为更多的应用开辟了新的途径,特别是当涉及到使用人工智能使我们周围的世界更容易接近时」。

举报

  • 相关推荐
  • 十方融海小智AI:以科技温度诠释“人工智能+”时代的人文关怀

    近日,小女孩“小十三”与十方融海研发的小智AI机器人深情告别的视频走红网络。这段1分17秒的对话不仅让无数网友泪目,更展现了AI技术的情感温度。十方融海团队迅速响应,跨越600公里为女孩送上定制版机器人作为生日礼物,并推出儿童心理陪伴计划。该事件体现了“人工智能+教育”的深刻内涵,彰显科技企业的人文关怀与社会担当,成为“技术向善”的生动实践。

  • 微算法科技(NASDAQ:MLGO)开发延迟和隐私感知卷积神经网络分布式推理,助力可靠人工智能系统技术

    微算科技开发了延迟和隐私感知卷积神经网络分布式推理技术,通过创新队列机制和深度强化学习优化CNN推理过程,结合分布式计算与隐私保护机制,在降低边缘设备计算延迟的同时强化数据隐私。该技术将推理任务智能分配到不同节点,减少数据传输范围,实现高效推理与隐私安全的平衡,为智能医疗、交通等领域提供可靠解决方案。

  • 市值一日暴增近3000亿港元,阿里迈向超级人工智能之路

    9月24日,阿里巴巴股价创下四年新高,单日涨超9%,市值达到约3.32万亿港元,一日增加近3000亿港元。 引爆股价的,是阿里集团每年一度的云栖大会。在会上,阿里释放多条重磅消息,尤其是在阿里集团CEO、阿里云智能集团董事长兼CEO吴泳铭的演讲结束后,阿里的股价表现就出现了明显的拉升。

  • iQOO 15 Ultra已在路上:配置最激进的iQOO旗舰

    iQOO产品副总裁罗锋在接受媒体专访时透露,iQOO 15系列还有一款高配版本,目前正在打磨中,面向特定群体,是游戏生产力工具”。 此前博主数码闲聊站爆料,iQOO 15 Ultra采用2K LIPO直屏,搭载高通第五代骁龙8至尊版平台,配备潜望长焦,支持无线快充,该机还测试了肩键以及主动散热风扇,支持IP68级防尘防水。 对比iQOO 15,iQOO 15的堆料

  • Checkout.com正式推出Flow Remember Me: 一键支付,全球通用

    Checkout.com推出嵌入式支付产品Flow的"记住我"功能,消费者仅需存储一次银行卡信息即可在全球商户网络实现跨平台快捷支付。测试数据显示,该功能最高可缩短70%付款时间并提升7%支付成功率。同时公司升级AI分析套件、支付优化工具及收单网络,并与Visa、Mastercard和Google达成AI智能体合作,助力商户在数字支付领域保持领先地位。

  • Akko MOD 68 Gasket结构磁轴键盘重磅首发

    Akko九周年推出MOD68磁轴机械键盘,主打模块化DIY定制与电竞性能。采用Gasket结构消除共振,搭载自研0.005mm高精度磁轴,支持三模连接与160K采样率。配备10000mAh长续航电池,提供壳体、键帽、轴体等模块自由组合。首发福利含199元起售价与限量赠品,融合极简“西装暴徒”设计,兼顾办公与电竞场景需求。

  • “人工智能+”时代,企业做对什么才能抢占先机?

    国务院8月26日发布《关于深入实施“人工智能+”行动的意见》,提出加快AI技术与实体经济深度融合,推动产业智能化升级。到2035年,我国将全面步入智能经济和社会新阶段。金蝶集团作为企业数字化服务商,以“AI优先”为战略,将AI技术深度融入SaaS产品与服务,推出金蝶云·星空EMA平台及多款智能产品,覆盖财务、供应链、差旅等场景,助力企业构建“AI+业务”新能力,实现高效管理与创新发展。

  • 499元起!iQOO WATCH GT 2发布:2.07英寸大屏、支持eSIM

    iQOO WATCH GT 2于10月20日发布,起售价499元。配备2.07英寸超亮全景观屏,屏占比82.4%,峰值亮度2400尼特,视野显著提升。蓝牙模式下续航长达33天,较前代提升57%;eSIM模式支持18天续航。支持电竞模式2.0,可实时监测游戏心率,并显示心率浮动窗。具备100+运动模式识别、全天候健康监测及NFC卡包、无网通信等实用功能。提供三款配色,表身仅重33克。

  • DeepSeek开源3B OCR模型:长文本识别达97%精度

    DeepSeek在GitHub开源新一代OCR模型,采用创新光学二维映射压缩技术,在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌,较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率,显著优于同类模型。该技术路径为OCR系统小型化提供解决方案,其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

  • 墨刀AI Agent:更懂产品经理的超级智能体上线

    2025年AI将进入"智能体时代",从被动工具升级为能理解意图、辅助决策的伙伴。墨刀AI+Agent专为产品经理打造,具备三层核心能力:懂逻辑(理解需求生成原型)、懂场景(熟悉全流程工作)、懂协作(跨角色沟通优化)。它能贯穿调研、原型、文档、评审等环节,解放重复劳动,让产品经理专注高价值决策,实现从效率提升到决策升级的人机协作新模式。

今日大家都在搜的词: