首页 > AI头条  > 正文

OpenAI 推出全新图像生成模型 GPT Image 1.5,性能显著提升!

2025-12-17 08:48 · 来源: AIbase基地

OpenAI 于正式发布了其最新的图像生成模型 GPT Image1.5,标志着 ChatGPT 在视觉创作能力上的重大突破。这一新模型不仅能够生成高保真的图像,还在理解用户指令方面表现优异,具备极强的提示词遵循能力。

image.png

新版本的 GPT Image1.5能够从零开始创作图像,或者在用户上传的照片基础上进行编辑,同时保留原图的核心要素,准确执行用户的各种指令。尤其是在细节方面,新模型展现了极致的掌控力,能够完美保持光线、构图及人物外观等关键特征,避免了以往 AI 生成图像时出现的 “面目全非” 问题。

此外,GPT Image1.5在特定场景下表现显著提升。例如,它可以生成更加真实的服装试穿效果,提供改进的风格滤镜,并进行具有原创性的概念性转换。文本渲染方面也得到了显著改善,能够精准地将文字融入图像中,解决了以往 AI 绘图中常见的 “文本乱码” 问题。

为了进一步提升用户体验,OpenAI 对 ChatGPT 的编辑工具进行了全面升级。用户现在可以方便地添加、移除、组合或移位图像元素,使 ChatGPT 更像一个随身携带的 “迷你修图工作室”。新推出的 “Images” 标签页在网页端和移动应用中均已开放,用户可通过内置的滤镜和提示词快速上手,提升创作效率。

image.png

OpenAI 还透露,这一项目由 Gabriel Goh 和 Adele Li 主导,技术团队的力量同样不容小觑。此外,OpenAI 建立了专门的安全与合规团队,确保 AI 生成内容的伦理与法律合规。整合科研、工程与产品的多维团队结构显示了 OpenAI 在将前沿技术转化为消费级产品方面的强大能力。

划重点:  

🌟 新发布的 GPT Image1.5模型大幅提升了图像生成和编辑能力。  

🖼️ 用户可以通过 ChatGPT 轻松创建和编辑图像,提供了专业级的图像处理工具。  

🔒 OpenAI 建立了专门的安全团队,确保生成内容的伦理与合规。

  • 相关推荐
  • 阿里Z-Image登顶开源图像生成模型榜单:1秒生图 千图仅需5美元

    今日,阿里Z-Image登顶开源图像生成模型榜单。 全球权威AI基准测试平台ArtificialAnalysis公布最新的图像模型榜单,阿里6B参数Z-Image Turbo超越32B的FLUX.2,成为最强开源图像生成模型。 目前,该模型已在阿里云百炼上线,生成1千张图片仅需5美元。 Z-Image Turbo的ELO分数达到1152,也刷新了榜单纪录。 业内人士认为,这是业界性能最好、生成速度最快、价格最便宜的图像生成模型之�

  • AI日报:电信开源MoE大模型TeleChat3;微信推出AI小程序成长计划;谷歌测试Nano Banana2Flash 图像模型

    本期AI日报聚焦行业动态与产品更新。微信推出AI小程序成长计划,提供免费资源助力开发者。中国电信开源千亿参数MoE大模型TeleChat-3,实现国产算力训练。谷歌测试新图像模型Nano Banana2Flash,主打高性价比。马斯克宣布Grok新版上线,全球用户突破3000万。ChatGPT全面接入主流App,可一键订酒店、点外卖等。此外,高德打车上线“AI服务卫士”提升安全,AI助手“ima”新增PPT生成功能,Plaud推出AI录音笔,智元与MiniMax合作定制个性化机器人语音。

  • Google撬回了苹果,给了OpenAI又一次惨败

    北京时间1月13日凌晨,苹果与谷歌联合发布声明,宣布达成一项多年期深度合作协议:下一代苹果基础模型(Apple Foundation Models)将基于 Google Gemini 模型和云技术构建,并为今年即将上线的个性化 Siri 提供核心技术支持。

  • PS天塌了!阿里开源全新图像模型Qwen-Image-Layered 可实现PS级图层

    阿里开源全新图像生成模型Qwen-Image-Layered,首次在模型内实现PS级的图层理解与图像生成。 千问新模型采用自研创新架构,可将图片拆解”成多个图层,就像个专业设计师用Photoshop分层作图修图,可实现几乎零漂移”的AI图像精准编辑,彻底解决AI生图的一致性难题,加速大模型在专业设计领域的现实落地。 Qwen-Image-Layered打破了主流视觉大模型的扁平式思维”,模型通过分层�

  • AI日报:Meta宣布收购Manus;腾讯混元发布1.5版开源翻译模型;OpenAI更新手机版ChatGPT

    本期AI日报聚焦行业动态与产品更新。Meta以数十亿美元收购AI初创公司Manus,强化通用AI代理技术。腾讯混元发布1.5版开源翻译模型,端侧部署性能提升。上海16部门联合发文推动“AI+消费”,将发放算力券、模型券等支持工具。微软Copilot全线升级GPT-5.2,免费开启“专家级”工作流。Zara利用AI技术数字化编辑模特照片以削减成本,引发行业讨论。Plaud Note Pro AI录音笔凭借超薄离线和隐私保护设计,成为专业用户首选。OpenAI更新手机版ChatGPT,用户可调节AI思考深度。Claude Code可视化工作流编辑器发布,通过拖拽节点即可构建AI自动化流程。

  • AI日报:阅文、中文在线推AI全栈工具;陌陌甜甜圈上线;OpenAI收购医疗初创公司Torch

    本期AI日报聚焦行业热点:OpenAI以约1亿美元收购医疗初创公司Torch,深化智能健康布局;Google Nano Banana Pro模型两月生成百亿图片,展现强大创意控制力;陌陌上线“甜甜圈”AI恋爱应用,瞄准Z世代情感陪伴需求;AI短剧工具井喷,阅文、中文在线等平台推动行业变革;Anthropic推出医疗合规AI助手Claude,赋能医患双方;谷歌Android XR眼镜应用曝光,支持3K视频与Gemini端侧对话;Adobe Firefly集成GPT-Image 1.5,开启不限量生成模式;Anthropic推出Cowork工具,降低AI代理使用门槛,让非技术用户也能高效处理复杂任务。

  • 国产全球最强医疗大模型Baichuan-M3发布:已超越GPT-5.2与人类医生

    AI大模型今年会向更专业的方向发起猛攻,除了AI编程之外,AI医疗也成为一大重点,OpenAI刚收购了一个医疗初创公司,Cluade也推出了AI医疗助手。 今天还有一家国产大模型新品也将目光瞄准了医疗,那就是Baichuan-M3,这是知名大佬王小川投资成立的百川智能发布的AI医疗大模型,号称全球最强。 据百川智能介绍,Baichuan-M3 专为医疗场景深度优化,融合海量医学文献、临床指南�

  • 「Soulmanyships搭子艺术展」席卷上海,线下展览与趋势报告勾勒幸福新图景

    上海长宁区“幸福路”上,粉色建筑长宁区婚姻登记处新址与对面街区“M+幸福里”的巨型粉色艺术墙相映成趣。社交平台Soul App联合“M+幸福里”推出的“Soulmanyships 搭子艺术展”,将Z世代多元的“搭子”关系搬进城市公共空间,让“幸福在具体关系中生长”的理念深入人心。展览通过“关系进化论”等互动区域,让抽象的社交关系变得可感可触,展现了年轻人对轻量化、功能明确的“社交插件”式关系的偏好。这既是一场视觉盛宴,也是一次关于当代青年社交关系的公共实验,呼应了《2026年社交趋势报告》中“寻找人生合伙人”的核心主题,体现了年轻人从追求宏大叙事向拥抱具体生活、构建多元支持系统的深刻转变。

  • 最像 Anthropic 的中国 AI 公司,是MiniMax

    “中国的OpenAI” 是谁?一众媒体和分析机构给出的答案是:智谱。 这家中国的大模型 AI 创业公司正在港交所冲刺 IPO。在招股说明书中,它明确宣称:“2025年6月,智谱被美国OpenAI 列为全球主要竞争对手。” 毕竟,OpenAI 开启了生成式人工智能的大规模普及。只要做大模型,或多或少都会沾上 OpenAI 的影子。一个非常划算的方式是:照猫画虎、形而上学地模仿 OpenAI,这是获得“中�

  • 晚一天敲钟,MiniMax 更用力

    AI大模型第一股的悬念,终于揭晓。仅仅一天之隔,MiniMax晚于智谱IPO。 1月9日,MiniMax在港交所敲钟,开盘价235.4港元,较发行价上涨42.6%,市值超过800亿港元; 智谱昨天开盘价为120港元/股,市值为528.28亿港元;当前股价150多港元,市值接近700亿港元。 AI双雄的局面还在持续,他们都需要更用力证明自己。 不过对于同一赛道的同类型选手,资本市场同时容纳的数量有限,且

今日大家都在搜的词: