首页 > 业界 > 关键词  > 机器学习技术最新资讯  > 正文

谷歌借机器学习技术增强了现实生活中的文本图像翻译体验

2022-09-29 14:30 · 稿源: cnbeta

Google 正在通过机器学习(ML)驱动的附加功能,对其翻译服务带来新一轮升级。这使得用户能够更轻松地翻译现实世界中出现的文本,比如店面招牌、菜单、文档、名片等项目。更棒的是,新功能不会简单粗暴地将译文覆盖到原始文本的上方,而是利用 AI 生成的背景来重建像素,以便带来更自然的使用体验。

1.jpg

谷歌搜索副总裁兼总经理 Cathy Edwards 指出:

很多情况下, 单词的上下文组合 —— 比如背景图像 —— 真正为用户看到的内容赋予了更大的意义。

此时你肯定不希望图像中可能出现的重要背景,被翻译后的文本给遮盖住。

为了让进展更加顺利,谷歌还使用了被称作“生成对抗网络”(又称 GAN 模型)的机器学习技术

在该技术加持下的“魔术橡皮擦”功能,可从 Pixel 智能机拍摄的照片中智能擦除不需要的对象。

2.jpg

但现在,Google 也将它运用到了翻译功能上。通过将译文融合到复杂的背景图像中,可为用户带来更加自然且无缝的使用体验。

在软件呈现的画面中,你能够像原文那样查看译文,而不是在当前图像上再添加一层遮挡。说到这,一些人可能已经联想到了该公司有意打造的新款 AR 眼镜。

Google 称,每月都有超 10 亿人次使用该公司的翻译服务,涉及超过 100 种语言的文本和图像。

今年开始,Google 还开始在公共场所,与少数员工和值得信赖的测试者们,一起评估他们的 AR 原型设备。

遗憾的是,该公司首次进军消费级智能眼镜领域的 Google Glass 产品,最终只是昙花一现。

最后,Google 没有分享其翻译功能的长期规划,仅表示相关功能会在今年晚些时候推出。

举报

  • 相关推荐
  • 用AI图像融合工具创造无缝图像融合,带来震撼视觉体验

    AI图像融合工具正式上线,为您带来最先进的AI图像融合技术。借助这款工具,用户可以轻松地将多张图片融合成一张创意十足的视觉作品,展现无与伦比的艺术效果。

  • 数字资产时代的智能预测:微云全息比特币价格走势机器学习算法

    微云全息(NASDAQ: HOLO)开发了一种基于机器学习的高精度比特币价格预测算法,整合了逻辑回归、支持向量机、人工神经网络、朴素贝叶斯和随机森林等多种方法。该算法在连续和离散数据集上均表现优异,为投资者和金融机构提供可靠的决策支持。随着比特币市场规模的扩大,准确预测价格波动成为重要需求。该技术通过模型融合、特征集成和参数优化等方法,提高了预测的准确性和稳定性,为数字资产市场的健康发展提供了创新解决方案。

  • 微算法科技(NASDAQ:MLGO)引领创新:自动化机器学习驱动的比特币价格预测模型

    微算科技(NASDAQ:MLGO)利用自动化机器学习(AutoML)技术开发比特币价格预测模型,显著提升了预测准确性和效率。该模型通过实时数据采集系统获取交易所、新闻网站等多源数据,采用特征工程提取市场情绪指标等关键特征,并自动优化算法参数。相比传统方法,该方案预测误差更低,能快速响应市场变化,为投资者提供可靠交易信号。未来计划整合自然语言处理技术分析社交媒体数据,并探索深度学习模型以进一步提升预测精度。

  • 机器拥有“大脑”——讯飞双屏翻译机 2.0在嘈杂场景也能“耳聪译明”

    文章探讨了全球化背景下跨语言沟通面临的"鸡尾酒会问题"——在嘈杂环境中精准捕捉目标语音的难题。讯飞双屏翻译机2.0通过硬件创新(五麦克风星型阵列)和算法突破(注意力机制模拟人类听觉系统),实现了复杂场景下的语音降噪和定向拾取。该技术突破使翻译设备从"被动接收"进化为"智能倾听",能够主动理解声学环境并做出决策,真正解决了用户在展会、工厂等嘈杂场景中的核心痛点。这不仅标志着翻译技术的进步,更预示着人机协同感知时代的到来——让每个声音都被精准听见,每次沟通都充满效率与温度。

  • 微云全息:基于区块链多任务学习的车联网优化技术框架,将为私家车通勤体验带来革新

    随着城市化进程加速和私家车数量激增,通勤体验成为一大挑战。微美全息公司推出基于区块链多任务学习的车联网优化技术框架,通过区块链保障数据安全与隐私,利用多任务学习算法分析车辆轨迹、交通流量等数据,精准预测用户出行需求并提供最优路线规划。该技术能有效缓解交通拥堵,提升通勤效率,同时为城市交通管理提供智能决策支持,推动交通系统向智能化、高效化方向发展。

  • 龟仔:静默中的智能精灵——解读会博通扫描机器人的文化内涵

    文章探讨了"龟仔"扫描机器人品牌如何在快节奏的科技时代反其道而行,以"慢"为智慧、"静"为力量的文化哲学。通过分析龟在中国传统文化中象征的长寿、智慧和坚韧特质,揭示该品牌如何将产品特性与文化内涵完美结合。文章指出"龟仔"低能耗、静默待机、精准响应的特点,体现了"静若处子,动若脱兔"的智能哲学,并探讨了这种反差萌命名策略和"看似静止,实则精灵"广告语的文化传播价值。最后提出在科技产品同质化严重的当下,"慢科技"理念或许代表着未来智能设备的发展方向。

  • 仅用三张图像即可生成 3D 场景,苹果新 AI 模型“很惊人”

    只需三张输入图像,Matrix3D 就能生成物体、甚至整个环境的详细 3D 重建,这显然可以为 Apple Vision Pro 等沉浸式头显带来非常有趣的应用……

  • 深蓝CEO回应员工买车可离职两个月:为员工考虑 不是想借机裁员

    快科技5月18日消息,近日,有网友在社交平台发布了一条深蓝汽车CEO邓承浩在深蓝汽车三周年活动上的讲话视频。视频中,邓承浩称买深蓝G318无忧穿越版,给大家离职的机会,出去野一下,野完之后深蓝再把大家召回来不行吗?”他表示,公司很多员工都有出去玩一段时间的想法,包括他自己。此视频引发热议,有网友认为这是在卖车的同时借机裁员,离职时,企业的入职时�

  • 真AI翻译耳机来了,金运灵动环A9耳机重塑跨语言交流新体验

    金运灵动环A9耳夹式耳机通过AI大模型技术颠覆传统翻译设备,实现百种语言实时互译,0.7秒极速响应,准确率达98%。产品突破四大翻译困境:解决传统工具延迟高(1.5秒)、专业术语误译(准确率仅80%)、操作繁琐(72%用户放弃深度沟通)、功能单一等问题。其创新骨传导技术实现"耳听即译"的无缝体验,支持会议录音转写、AI写作辅助等扩展功能,以百元价位提供千元级专业翻译设备的性能。对比传统翻译器,该产品将翻译延迟降低20%,误译率控制在0.3%,且重量仅5克,解放用户双手。典型案例显示,用户与外国客户沟通时,设备能精准处理专业术语和俚语(如将"炸鸡啤酒"关联韩剧文化梗)。产品重新定义智能翻译标准,让跨语言交流从"手动操作"进化为"自然对话",证明科技普惠的本质是让高端功能触手可及。(140字)

  • 轻花优品:品质生活新选择,打造安心购物体验

    现代消费者追求便捷与品质并重的购物体验。轻花优品通过创新服务模式和多元化商品布局,在激烈市场竞争中脱颖而出。平台建立严格品控体系,覆盖数码家电、美妆个护、家居生活等多品类商品,所有商品均需通过严苛筛选流程。与国内外知名品牌达成战略合作,从供应链源头保障商品质量。数字化技术打造高效便捷的全流程服务,用户通过手机APP即可完成搜索、比价、下单等操作。平台兼容多种支付方式,建立全方位售后服务体系,7×24小时专业客服团队及时响应各类需求。采用银行级加密技术保障用户数据安全。未来将持续以消费者需求为导向,优化服务体验,致力于打造卓越的品质生活方式。