首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

微软上线GPT-image-1模型 通过API向开发者开放使用

2025-04-24 10:21 · 稿源:站长之家用户

4月24日凌晨,OpenAI正式推出了其全新图像生成模型GPT-image-1,并通过API向全球开发者开放使用。这一模型的发布标志着图像生成技术的又一次飞跃,为开发者带来了更多可能性。

GPT-image-1与OpenAI此前的ChatGPT版本有很大不同,它不仅能够生成高质量的图像,还支持多种高级定制功能。开发者可以通过API控制生成图像的敏感度、生成效率、背景、输出格式、渲染质量和压缩质量等。此外,该模型还支持备受瞩目的“吉卜力模式”,能够生成具有独特风格的图像。

目前,包括Adobe、Figma、HeyGen、Wix等在内的众多知名企业已经将GPT-image-1集成到其产品中。Adobe将其应用于Firefly和Express应用,为用户提供多样化的图片风格;Figma则通过该模型帮助设计师快速获取创意并进行视觉迭代;HeyGen利用其增强头像创建功能;Wix则帮助用户将想法快速转化为现实。

GPT-image-1的API支持多种高级定制功能,例如一次性生成多张图像、使用多张图像作为提示词进行合成、实现类似Photoshop的蒙版功能、更改图片透明度等。开发者还可以通过API设置图像尺寸、渲染质量和压缩格式等参数,从而满足不同场景的需求。

在定价方面,GPT-image-1的API使用费用包括文本输入每100万token5美元,图像输入每100万token510美元,图像输出每100万token40美元。根据实际使用情况,低质量的1024x1024图像生成成本约为每张0.02美元,中等质量图像约为每张0.07美元,高质量图像约为每张0.19美元。

OpenAI首席执行官兼联合创始人Sam Altman对GPT-image-1给予了高度评价,认为其与ChatGPT版本有很大不同,并为开发者带来了更多创意空间。许多网友也对这一模型的发布表示兴奋,认为其图像编辑功能将开启众多此前无法实现的创意应用场景。

举报

  • 相关推荐
  • 刚刚,OpenAI发布GPT-image-1模型,更强吉卜力版本来啦

    OpenAI发布全新图像生成模型GPT-image-1,通过API向全球开发者开放。该模型支持精细控制图像敏感度、生成效率、背景、输出格式等参数,并集成吉卜力模式。Adobe、Figma等企业已将其应用于产品中。API支持批量生成、蒙版编辑、透明度调整等高级功能,图像生成成本从0.02-0.19美元/张不等。CEO Sam Altman表示该模型与ChatGPT版本差异显著,开发者可通过API实现更多创意场景。新模型在�

  • AI日报: OpenAI推出gpt-image-1图像生成API;纳米AI发布MCP万能工具箱;中国占全球AI专利60%

    【AI日报】栏目聚焦人工智能领域最新动态:1) OpenAI推出ChatGPT图像生成API,开发者可轻松集成AI绘图功能,已生成超7亿张图片;2) 谷歌Gemini月活用户突破3.5亿,但仍落后于ChatGPT的6亿用户;3) OpenAI预测2029年收入将达1250亿美元,AI代理业务成主要增长点;4) Ostris发布8B参数扩散模型Flex.2-preview,优化ComfyUI工作流;5) 英伟达推出多模态LLM模型Describe Anything,支持指定区域生成详细描�

  • 百度Create AI开发者大会:李彦宏发布两大新模型、多款热门AI应用、开发者全面拥抱MCP

    4月25日,百度在武汉举办Create 2025开发者大会。李彦宏发布文心大模型4.5 Turbo和深度思考模型X1 Turbo,性能提升同时价格大幅下降。大会推出全球首个电商交易MCP平台,并发布数字人、智能体心响APP等多款AI应用。百度宣布未来5年培养1000万AI人才,并点亮国内首个三万卡集群。同时启动第三届"文心杯"创业大赛,最高奖金达7000万元。大会还包含6大分会场、40节AI公开课及5000平互动展区,全面展示百度AI生态布局。

  • AI日报:阿里通义千问Qwen3问鼎全球开源模型;Kimi长思考模型API发布;OpenAI发布新一代GPT-4.1模型

    【AI日报】汇总了近期AI领域重要动态:1)阿里通义千问3开源模型上线7天即登顶全球开源模型榜首,在指令遵循和推理能力上超越闭源模型;2)月之暗面推出Kimi长思考模型API,可解决复杂代码和数学问题;3)OpenAI发布GPT-4.1模型,性能提升显著;4)Google推出Gemini2.5Pro模型,提升开发者编码能力;5)联想发布"天禧超级智能体",具备多模态感知能力;6)腾讯元宝上线"对话分

  • ChatGPT重磅升级GPT-4.1:编程专家模型登场

    OpenAI于5月15日正式推出GPT-4.1模型,采用差异化推送策略:付费用户可体验完整版,普通用户使用轻量级GPT-4.1 mini。新版模型在编程任务表现突出,能精准遵循指令,避免冗长输出。测试显示其响应速度提升30%,输出稳定性提高40%,部分性能超越GPT-4o。同时OpenAI宣布将斥资30亿美元收购编程工具Windsurf,强化开发者生态,与Google同日发布的Gemini-GitHub形成直接竞争。两大巨头的动作标志着AI编程助手进入生态竞争新阶段。

  • C++创始人:需要改变的不是语言,而是开发者的思维方式!

    “即使利用AI编写代码,但解决问题仍然是人类的工作”, C++创始人强调了开发者在AI时代的存在意义……

  • Unity首席执行官:96% 的游戏开发者已开始用 AI 了

    “市面上有很多生成式 AI 资源,但很少有公司能够用好它们,”布罗姆伯格说,因为 AI 并未无缝地融入到制作过程中……

  • 这才是真正的精通!开发者成功实现Excel中运行Linux

    快科技5月2日消息,近日,开发者NSG650成功实现在Excel表格中运行Linux”,这个名为LinuxInExcel的项目已发布在GitHub上。NSG650的成果堪称一次大胆的尝试,他利用了GitHub用户cnlohr构建的RISC-V模拟器,并通过Microsoft VBA宏在DLL中调用该模拟器,将输出结果写入Excel的单元格中。这种独特的实现方式,使得Linux能够在Excel的环境中运行,尽管性能和稳定性会受到影响。据NSG650介绍,LinuxInExcel目前非常不稳定”,且存在诸多漏洞,但他表示,这个项目主要是为了好玩”,并没有过多考虑实用性。值得一提的是,虽然NSG650几乎没有打算?

  • 绕过苹果抽成不是梦!iOS开发者迎来付款自由新契机

    快科技5月2日消息,在最新的法律裁决之后,iOS开发者迎来了绕过苹果App Store高额手续费的新契机。法院裁定苹果不得再阻止开发者在应用内提供指向外部支付选项的链接,这一变化为开发者带来了更大的灵活性。裁决之后,苹果也更新了其美区应用审核指南,具体变化如下:3.1.1:美国店面上的应用在允许用户浏览他人拥有的NFT收藏时,不禁止包含按钮、外部链接或其他行动号召。3.1.1(a):在美国店面上,应用程序不禁止包含按钮、外部链接或其他行动号召,也不需要任何权利。3.1.3:禁止鼓励用户使用应用内购买以外的购买方式的规定不适用于美?

  • 阿里千问3登顶全球最强开源模型 已在通义App上线

    阿里集团推出新一代开源AI模型"通义千问3"(Qwen3),包含8款不同规格的混合推理模型。旗舰型号Qwen3-235B采用混合专家架构,创下国产模型性能新纪录;Qwen3-32B则以部署成本低、运行稳定见长。该系列在逻辑推理、编程、翻译等专业领域表现卓越,用户可通过通义App和网页版体验。升级后的通义App整合问答对话、图像理解与生成等多项功能,持续强化代码生成、数学解题等专业场景应用能力,致力于打造实用性强的个人AI助手。