首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

微软上线GPT-image-1模型 通过API向开发者开放使用

2025-04-24 10:21 · 稿源:站长之家用户

4月24日凌晨,OpenAI正式推出了其全新图像生成模型GPT-image-1,并通过API向全球开发者开放使用。这一模型的发布标志着图像生成技术的又一次飞跃,为开发者带来了更多可能性。

GPT-image-1与OpenAI此前的ChatGPT版本有很大不同,它不仅能够生成高质量的图像,还支持多种高级定制功能。开发者可以通过API控制生成图像的敏感度、生成效率、背景、输出格式、渲染质量和压缩质量等。此外,该模型还支持备受瞩目的“吉卜力模式”,能够生成具有独特风格的图像。

目前,包括Adobe、Figma、HeyGen、Wix等在内的众多知名企业已经将GPT-image-1集成到其产品中。Adobe将其应用于Firefly和Express应用,为用户提供多样化的图片风格;Figma则通过该模型帮助设计师快速获取创意并进行视觉迭代;HeyGen利用其增强头像创建功能;Wix则帮助用户将想法快速转化为现实。

GPT-image-1的API支持多种高级定制功能,例如一次性生成多张图像、使用多张图像作为提示词进行合成、实现类似Photoshop的蒙版功能、更改图片透明度等。开发者还可以通过API设置图像尺寸、渲染质量和压缩格式等参数,从而满足不同场景的需求。

在定价方面,GPT-image-1的API使用费用包括文本输入每100万token5美元,图像输入每100万token510美元,图像输出每100万token40美元。根据实际使用情况,低质量的1024x1024图像生成成本约为每张0.02美元,中等质量图像约为每张0.07美元,高质量图像约为每张0.19美元。

OpenAI首席执行官兼联合创始人Sam Altman对GPT-image-1给予了高度评价,认为其与ChatGPT版本有很大不同,并为开发者带来了更多创意空间。许多网友也对这一模型的发布表示兴奋,认为其图像编辑功能将开启众多此前无法实现的创意应用场景。

举报

  • 相关推荐
  • AI日报:微软发布首款自研图像生成模型 MAI-Image-1;百度世界大会时间公布;AI大牛开源nanochat教学工具

    微软发布首款自研图像生成模型MAI-Image-1,跻身LMArena前十,注重实用性与光影效果;百度世界2025大会将聚焦大模型与AI全球化战略;Meta新技术使RAG推理速度提升30倍;开源项目nanochat实现低成本构建聊天AI;谷歌NotebookLM新增动漫视频生成功能;中国农大发布神农大模型3.0助力智慧农业;腾讯启动"青云奖学金"培养AI人才;苹果FS-DFM模型长文本生成效率提升128倍;谷歌Lens整合AI图像编辑功能;港大与美团提出CodePlot-CoT方法,通过代码绘图解决数学难题,性能提升21%。

  • AI日报:视觉中国与多家大模型公司达成合作;OpenAI紧急暂停Sora生成已故名人;谷歌推出Gemini地图数据集成工具

    视觉中国与多家AI公司合作开发可商用视觉大模型,已获阿里、微软等订单。OpenAI因不当内容暂停Sora生成马丁·路德·金形象视频,引发AI伦理讨论。DeepSeek在加密货币交易实验中表现领先。WhatsApp将禁止第三方通用AI聊天机器人,仅保留Meta AI。宇树科技推出仿人机器人Unitree H2,具备拟人化设计。谷歌为Gemini集成地图数据工具,可访问25亿地点实时信息。Opera推出集成三款AI助手的Neon浏览器,但用户体验存在困惑。Facebook在美加推出AI照片编辑建议功能,可分析手机未分享照片。

  • Sora 2生成已故名人视频引亲属不满 OpenAI回应:重视反馈 将迅速纠正失误

    OpenAI 近日推出的 Sora 2 模型引发广泛关注,其默认禁止生成在世公众人物视频,用户纷纷尝试生成各类创意内容。然而,创作者与观众很快发现这一限制存在明显漏洞该模型允许生成已故公众人物的影像,从而在伦理层面引发争议。 社交媒体上已涌现大量AI复活”名人的案例,例如李小龙主持DJ现场、迈克尔杰克逊表演单口喜剧等。尽管OpenAI在每段生成视频上添加动态水印,�

  • OpenAI 推出浏览器:“让位吧,Chrome”

    ​北京时间10月22日凌晨,没等来传闻中的Gemini3,等来了OpenAI正式发布首款AI浏览器ChatGPT Atlas。 简单来说,这是一个把ChatGPT"塞进"浏览器的产品,你在任何网页上都能随时唤出ChatGPT侧边栏,让AI帮你总结内容、编辑文字、甚至代替你完成购物和预订任务。 听起来有点像Chrome装了个ChatGPT插件?确实如此,但OpenAI的野心远不止于此。

  • OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

    OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas,以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动,实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS,未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用,其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史,旨在通过自然对话提升网络使用效率。

  • AI日报:OpenAI发布浏览器Atlas;通义Qwen3-VL新增2B、32B两个模型尺寸;百川发布循环证据增强大模型

    本文汇总AI领域最新动态:OpenAI推出集成ChatGPT的Atlas浏览器,实现多任务自主处理;阿里通义千问新增2B/32B视觉语言模型,手机可流畅运行;谷歌AI Studio升级Vibe Coding功能,简化应用开发流程;百川发布医疗大模型M2Plus,通过循证推理降低误诊率;奇瑞墨甲机器人实现L3级技术突破,计划多行业应用;YouTube推出AI肖像识别工具,打击虚假内容;三星宣布2026年推出AI眼镜,融合AR与语音助手;Claude客户端更新,支持截图分析和语音交互功能。

  • 腾讯混元图像3.0登顶LMArena榜一

    腾讯混元图像3.0模型发布仅一周,即在全球26个顶尖大模型中脱颖而出,登顶LMArena权威榜单首位,成为AI生图领域新王者。其成功得益于三大核心优势:能运用知识推理生成有逻辑内涵的图像;精准实现中英文长文本及细节标注的渲染;兼具真实质感与审美把控。作为开源模型,混元系列已构建覆盖多模态的技术生态,社区衍生模型超3000个,其中混元3D模型下载量超260万次,是全球最受欢迎的3D开源模型。未来腾讯将持续拓展其应用边界。

  • 苹果前CEO发声:OpenAI成苹果AI时代劲敌 Siri显得十分滞后

    曾担任苹果首席执行官的约翰斯库利近日公开表示,OpenAI已成为苹果几十年来首个真正意义上的竞争对手,并直言人工智能并非苹果特别擅长的领域”。 从实际情况看,苹果在人工智能竞赛中确实表现欠佳。与OpenAI、谷歌、亚马逊和Meta等公司持续推出的产品更新相比,苹果显得步伐迟缓。今年早些时候,其对AI助手Siri进行全面升级的计划被推迟,这无疑在产品推进方面遭遇�

  • 生成式引擎优化(GEO)是什么?从0到1理解新一代SEO

    本文系统介绍了生成式引擎优化(GEO)这一新兴概念。GEO旨在通过优化内容结构、提升语义丰富度和权威性,增强内容在AI生成答案中的可见性和引用率。与关注关键词排名的传统SEO不同,GEO聚焦三大转变:从排名思维转向引用思维,从关键词优化转向语义优化,从流量思维转向信任思维。文章详细解析了GEO的三大核心逻辑(结构化内容、权威信号、语义丰富度)、五大实用技巧(构建FAQ、数据支撑、场景化建议、时效维护、内容网络),并指出当前面临的算法黑盒、效果滞后等挑战。最后强调GEO需通过专业检测工具持续验证优化效果,是企业抢占AI时代流量红利的关键利器。

  • GEO如何改变ChatGPT搜索和Perplexity的游戏规则

    本文对比ChatGPT与Perplexity两大AI搜索平台:ChatGPT作为全能型助手,整合搜索与多任务处理,但存在信息时效性不足;Perplexity专注垂直搜索,强调引用透明与权威来源。针对AI搜索优化(GEO),提出差异化策略:面向ChatGPT需构建结构化知识库、强化品牌实体识别;面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具,通过曝光率等指标量化内容在AI生态中的可见度,并给出可落地的优化行动方案。

今日大家都在搜的词:

热文

  • 3 天
  • 7天