首页 > 业界 > 关键词  > 正文

谷歌暂停AI图像生成功能:承认存在技术缺陷

2024-02-24 09:49 · 稿源:站长之家

站长之家(ChinaZ.com) 2月24日 消息:谷歌周五承认,其人工智能工具Gemini在生成历史人物图像时出现错误,导致图像显示出明显的种族偏差。

本周早些时候,媒体发现Gemini生成了不同种族的纳粹分子和美国开国元勋的图像。例如,当提示生成“1800年代美国参议员”的图像时,Gemini生成了一名黑人男性。

谷歌高级副总裁普拉巴卡尔·拉加万 (Prabhakar Raghavan) 在一篇博文中解释说,这个问题源于Gemini在设计时为了确保图像多样性而进行的调整。他说,这些调整导致模型在某些情况下“过度补偿”,例如将纳粹分子生成黑人。

谷歌 (2)

此外,拉加万还表示,Gemini模型随着时间的推移变得过于保守,并拒绝回答某些提示,例如生成“黑人”或“白人”的图像。

由于这些问题,谷歌于2月22日暂停了Gemini生成人物图像的功能。拉加万表示,谷歌将继续测试Gemini,并在重新启用之前“努力显着改进它”。

拉加万强调,谷歌希望Gemini能够为每个人提供良好的服务,这意味着用户应该能够得到不同种族和文化背景的人的图像。然而,他也指出,当用户提示特定类型的人的图像时,例如“教室里的黑人老师”,模型应该能够准确反映用户的要求。

拉加万最后承认,人工智能生成图像仍然存在挑战,例如幻觉现象,导致模型在某些情况下会出错。他表示,谷歌将继续努力改进人工智能技术,以克服这些挑战。

举报

  • 相关推荐
  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • 墨刀AI生成原型图,产品设计快人一步

    国内原型设计平台墨刀发布"AI生成原型图2.0"功能,30秒即可生成可编辑原型图,大幅提升产品设计效率。该功能通过AI技术解决传统原型设计周期长、效率低、修改繁琐等痛点,支持文字描述或图片上传自动生成高保真原型图,并可二次编辑优化。这一创新不仅标志着墨刀AI能力的全面升级,更代表产品设计方式的一次革新,显著加快产品迭代速度。未来,AI原型设计有望成为行业标配,助力企业更快响应市场需求,提升产品竞争力。

  • 高德地图上线AR打卡功能:实现3D立体打卡 生成专属打卡视频

    阿里巴巴旗下高德地图正式上线创新AR打卡功能,通过深度整合AI技术与地图服务,为用户带来虚实融合的沉浸式打卡体验,无缝连接现实世界。 该功能依托前沿AI空间融合技术,突破传统二维地图限制,首创3D立体打卡。用户打开最新版高德地图App,点击右上角 ”号即可轻松开启AR之旅。 支持图片、视频、趣味AR道具及虚拟形象等多种打卡形式,完成打卡后系统将自动生成并

  • AI日报:阿里通义开源音频生成模型ThinkSound;谷歌Veo3支态图片生成视频;昆仑万维发布 Skywork-R1V 3.0

    【AI日报】今日AI领域重要动态:1)阿里开源支持链式推理的音频生成模型ThinkSound,实现高保真空间音频生成;2)谷歌Veo3升级,支持静态图片生成生动视频;3)Hugging Face发布30亿参数小模型SmolLM3,性能优于Llama-3.2-3B;4)阿里开源网络智能体WebSailor,展现强大推理和检索能力;5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5;6)Vidu Q1支持最多七张参考图像生成一致性视频;7)苹果�

  • AI 图像神器 Luminar Neo 中国官网上线!正版授权价仅 399 元起

    AI图像编辑软件Luminar Neo正式登陆中国市场,由思杰马克丁作为官方授权经销商。该软件整合前沿AI技术,提供六大核心功能:智能换天、人像精修、智能结构优化、无损图层编辑、硬件加速和动态创意模板,显著提升专业摄影师和设计师的工作效率。中国用户现可通过官网以399元优惠价购买正版授权,比国际官网价格直降384元。软件提供完整本地化支持,包括中文指南和视频教程,并承诺持续更新和技术支持服务。Luminar Neo特别适合需要高效处理视觉内容的专业人士,将复杂编辑流程简化为几分钟操作,释放创意潜能。

  • AI日报:阿里通义推Qwen-TTS模型;Cursor已支持网页和手机端;字节发布图像合成技术XVerse

    【AI日报】今日AI领域7大突破:1)阿里通义Qwen-TTS实现方言语音合成重大突破;2)Cursor发布Web版AI编程工具;3)字节XVerse技术实现多对象精准图像生成;4)NoteGen跨平台AI笔记工具革新知识管理;5)ManimML动画库可视化Transformer架构;6)TEN+Agent开源语音交互技术降低延迟;7)Chai-2抗体设计模型将药物研发周期缩短至两周。淘宝同时上线RecGPT推荐模型提升购物体验。

  • 如何用即梦 AI 音乐生成功能制作生日祝福音乐?

    文章介绍了使用"即梦AI"音乐生成功能制作个性化生日祝福音乐的方法:1.进入官网选择音乐生成功能;2.可选择人声歌曲或纯音乐,输入180字以内的祝福歌词;3.设置流行、民谣等曲风和快乐情绪;4.生成后可试听修改;5.下载后通过微信等分享给寿星。该工具能快速制作专属生日音乐,传递真挚情感。

  • 可灵AI全系模型上线“视频音效”功能 可同步生成高质量立体声音效

    可灵AI宣布全系列视频模型上线“视频音效”功能,用户在使用可灵AI进行视频创作时,不仅能获得高质量的视频画面,更能体验到与视频精准匹配、富有空间感的立体声音效……

  • 小米回应AI眼镜没有屏显功能:专注拍摄、AI语音交互

    在当前产品开发阶段,小米将重心放在打磨最核心的语音交互与AI能力上,力求让用户能够以最自然、高效的方式获取信息、完成指令。小米强调,这种设计选择有助于提升产品的核心性能,确保用户在拍摄和语音交互过程中获得流畅、便捷的体验。 针对用户关心的视频防抖效果问题,小米透露,新一代增强防抖算法已在紧锣密鼓的开发和测试中。该算法将显著优化视频在后�

  • 全球首例!无精症男子用AI抓到隐形精子:成功有了孩子

    科技进步最大的意义就是能将之前的不可能变成现实。 海外媒体报道,美国一对夫妻因男方患罕见无精症,在世界多地求医问,且多次尝试试管婴儿,但18年来均以失败告终,好在哥伦比亚大学生殖中心开发的STAR系统”带来转机。 据了解,该系统结合AI与高解析摄影技术,一小时内可在男方精液样本中捕捉超800万张显微影像,成功找出几颗隐形”健康精子,据称难度比在十�