AI日报： OpenAI推出gpt-image-1图像生成API;纳米AI发布MCP工具箱;中国占全球AI专利60%

2025-04-24 15:34 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、OpenAI推ChatGPT新图像生成功能API:开发者可轻松集成 AI 绘图功能

OpenAI最近推出了gpt-image-1图像生成API，开发者可以将这一先进技术轻松集成到各种应用中。这一功能自上线以来，吸引了大量用户，生成了超过7亿张图像。gpt-image-1不仅支持多种图像风格，还内置安全护栏，确保生成内容符合公司政策。此外，其合理的收费结构使得开发者能够以低成本生成高质量图像，标志着AI图像生成领域的重要进步。

【AiBase提要:】
🌟 OpenAI推出gpt-image-1图像生成API，开发者可轻松集成到应用中。
🖼️ 用户在新功能上线第一周便生成超过7亿张图像，吸引了数百万新用户。
💰 gpt-image-1的图像生成成本合理，低至每张图像2美分。

2、谷歌 Gemini 月活跃用户突破3.5亿，仍与 ChatGPT 存在差距

谷歌的人工智能聊天机器人Gemini在过去一年中实现了显著的用户增长，月活跃用户数达到了3.5亿，日活跃用户数也从900万增至3500万。然而，与市场领先者ChatGPT的6亿月活跃用户相比，Gemini仍有差距。谷歌通过与三星的合作和产品整合，推动了Gemini的快速增长，显示出用户对AI聊天工具的需求正在上升。未来，谷歌如何进一步提升Gemini的用户体验和功能，将是其能否缩小与竞争对手差距的关键。

【AiBase提要:】
🌟 Gemini的月活跃用户数已达3.5亿，日活跃用户增至3500万。
🤖 ChatGPT的月活跃用户为6亿，仍领先Gemini。
📈 谷歌通过与三星的合作及产品整合，推动Gemini快速增长。

3、OpenAI预测2029年收入激增至1250亿美元

OpenAI近期发布的收入预测显示，到2029年，其总收入预计将达到1250亿美元，其中AI代理业务和渠道收入将成为主要驱动力。2023年，OpenAI的收入达到37亿美元，周活跃用户超过5亿，显示出显著增长。公司预计未来四年将实现现金流转正，毛利润占比将提升至近70%。这一系列预测吸引了投资者的关注，预计将推动OpenAI的快速发展。

【AiBase提要:】
🌟 预计到2029年，OpenAI收入将达1250亿美元，AI代理业务成为主要增长点。
📈2023年收入达37亿美元，周活跃用户超过5亿，显示出显著增长。
💰 预计未来四年将实现现金流转正，毛利润占比将提升至近70%。

4、Ostris发布Flex.2-preview，8B参数扩散模型革新ComfyUI工作流

Ostris团队推出了Flex.2-preview，这是一款基于8亿参数的文本到图像扩散模型，旨在优化ComfyUI工作流。该模型在图像生成的控制能力上表现卓越，支持多种功能如图像修补和深度控制，已在Hugging Face开源，迅速吸引了AI艺术创作社区的关注。Flex.2-preview的轻量化设计与高效推理能力，使其成为创意设计和商业应用中的理想工具，展现了未来AI艺术创作的无限可能。

【AiBase提要:】
🎨 通用控制支持:内置线条、姿态和深度控制，精确引导生成结果，适合多种创作需求。
🖼️ 图像修补能力:支持高级图像修补，用户可通过掩码进行内容替换或修复，提升创作灵活性。
⚙️ ComfyUI集成:模型专为ComfyUI优化，提供节点化工作流支持，简化复杂任务配置。
详情链接:https://huggingface.co/ostris/Flex.2-preview

5、英伟达推多模态LLM Describe Anything:指定特定区域生成详细的描述

NVIDIA AI团队推出的Describe Anything3B（DAM-3B）模型在多模态学习领域引起了广泛关注。该模型能够根据用户指定的图像或视频区域生成详细描述，超越了传统图像标注的局限性。通过开源代码和数据集，DAM-3B为开发者提供了丰富资源，促进了多模态AI的研究与应用，尤其在教育、医疗和内容创作等领域展现出广阔的前景。

【AiBase提要:】
🖌️ DAM-3B具备区域化描述能力，能够根据用户指定区域生成详细描述，提升描述的精准性和丰富性。
🔓 NVIDIA开源了DAM-3B的代码、模型权重和数据集，推动了多模态AI研究的透明性和社区协作。
🌐 模型在内容创作、智能交互和无障碍技术等多个领域展现出广泛的应用前景，推动社会包容性进步。
详情链接:https://github.com/NVlabs/describe-anything

6、纳米AI发布MCP万能工具箱，简化AI工具集成与调用

纳米AI推出的MCP万能工具箱旨在简化Model Context Protocol的配置复杂性，提供一站式解决方案。该工具箱预配置了100多个MCP服务和18个常用API密钥，支持多种功能如图像、音频和视频生成。它的发布引发了AI开发者社区的广泛关注，社区反馈积极，认为其高效性与易用性显著提升了开发者的工作效率。

【AiBase提要:】
🔧 预配置100多个MCP服务，开发者无需手动配置即可直接调用，降低接入门槛。
🔑 内置18个常用API密钥，用户可省去自行获取密钥的繁琐步骤，简化初始配置。
🌐 支持多模态生成，通过自然语言指令生成图像、音频和视频，提升创作效率。
详情链接:https://bot.n.cn/download?src=AIBotCode

7、腾讯云代码助手CodeBuddy推出Craft软件开发智能体

腾讯云于4月24日发布了全新升级的代码助手CodeBuddy，推出Craft软件开发智能体。此工具将AI编程从简单的代码补全提升至项目交付，显著提高了开发效率。开发者只需用自然语言输入需求，Craft便能自动生成完整的项目代码，并支持主流IDE。Craft还支持MCP协议，实现代码的无缝接入测试、构建和部署，兼容腾讯生态系统，助力团队高效协作。

【AiBase提要:】
🚀 Craft智能体能将开发者的自然语言需求转化为完整的项目代码，极大简化开发流程。
🔗 支持MCP协议，使得AI生成的代码能够无缝接入测试和部署环节，提高了开发的连贯性。
🧩 CodeBuddy已在腾讯内部广泛应用，85%的开发者使用该工具，显著提升了整体开发效率。
详情链接:https://cnb.cool

8、昆仑万维开源Skywork-R1V2.0版本

昆仑万维于4月24日发布了其多模态推理模型Skywork-R1V2.0，显著提升了视觉与文本推理能力，尤其在高考理科难题和通用任务场景中表现优异。该模型在多个权威基准测试中刷新了开源SOTA纪录，展现出与商业闭源模型相媲美的能力。R1V2.0的开源不仅体现了昆仑万维在多模态领域的技术实力，也为全球开发者和研究者提供了强大的工具，推动了多模态生态的建设。

【AiBase提要:】
🔍 R1V2.0在中文理科题目推理方面表现突出，成为免费AI解题助手，刷新多个开源SOTA纪录。
⚙️ 采用多模态奖励模型Skywork-VL Reward和混合偏好优化机制，提升模型在多任务、多领域下的适应能力。
🌍 昆仑万维致力于推动开源和创新，R1V2.0的开源为AGI的发展提供了新的基座模型，未来将继续推出领先的大模型与数据集。
详情链接:https://github.com/SkyworkAI/Skywork-R1V

9、智谱宣布旗下多款大模型产品降价其中GLM-4-Plus降价90%

智谱BigModel开放平台于4月24日宣布其多款大模型产品价格大幅调整，进入了“亿时代”，使企业能够以低成本接触到先进的AI技术。此次调整包括GLM-4-FlashX、GLM-Z1系列和GLM-4-Plus等多个产品，特别是GLM-4-Plus的降价幅度高达90%。这一举措旨在降低使用门槛，满足金融、互联网、教育等多个行业的需求，推动市场对大模型技术的广泛应用。

【AiBase提要:】
🚀 GLM-4-FlashX模型每亿tokens价格仅为10元，推理速度与GPT-4相当，表现优异。
💡 GLM-Z1-AirX推理速度是DeepSeek-R1的8倍，性价比高，GLM-Z1-Air价格仅为DeepSeek-R1的1/30。
📉 GLM-4-Plus价格降至5元/百万tokens，行业领先，满足多行业场景需求。

10、JSON Visuals for ChatGPT发布，解锁无限图像风格创作

JSON Visuals for ChatGPT的发布为图像生成带来了全新的创意维度，用户可以利用超过50种美学代码和随机化器，轻松生成个性化的视觉内容。该工具不仅提升了生成的灵活性，还支持高分辨率输出，适用于数字艺术、品牌营销、游戏设计等多个领域。社区反馈积极，期待未来的功能优化和扩展。

【AiBase提要:】
✨50+美学代码，支持多样化风格生成，满足创作需求。
🔄 属性随机化器，自动调整风格属性，探索创意无限可能。
🚀 高兼容性，快速生成高分辨率图像，提升用户体验。
详情链接:https://json.visuals.zip/

11、国家知识产权局:中国成为全球AI专利最大拥有国，占比达60%

在国务院新闻办公室的发布会上，国家知识产权局局长申长雨宣布，中国在人工智能领域展现出强劲的发展势头，已成为全球AI专利的最大拥有国，专利数量占全球总量的60%。这一成就不仅反映了科技创新的突破，也彰显了中国在新兴产业中的领导地位。国家知识产权局积极推动相关知识产权制度的创新，以支持人工智能技术的发展，并致力于完善知识产权保护规则，提升保护和运用水平。

【AiBase提要:】
🌟 中国在全球人工智能专利中占据60%份额，成为最大拥有国。
⚙️ 国家知识产权局推出多项政策，支持人工智能技术的快速发展与应用。
📈2024年知识产权授权数据喜人，社会满意度提升至82.36分。

12、199元!小米新款智能音箱发布:AI大模型加持，智能对话再升级

小米新款智能音箱以199元的亲民价格正式发布，虽然在硬件配置上相比Pro版有所精简，但其AI大模型的引入使得智能交互体验得到了显著提升。新音箱支持连续对话与指令语控，用户能够更高效地操控智能家居。同时，新增的远程备车功能也为用户提供了更为便捷的出行体验。整体来看，这款音箱在性价比和智能化方面都表现出色，适合追求便捷生活的用户。

【AiBase提要:】
🎨 外观设计延续Pro版简约风格，采用清爽浅灰色外壳，尺寸更小巧。
🔧 功能上有所取舍，取消红外遥控和Type-C音频连接，但声学配置依然出色。
🤖 AI大模型加持，支持连续对话和远程备车功能，智能交互体验显著提升。

（举报）

相关推荐

关键词：

OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas，以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动，实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS，未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用，其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史，旨在通过自然对话提升网络使用效率。

ChatGPT Atlas 人工智能浏览器
GEO如何改变ChatGPT搜索和Perplexity的游戏规则

本文对比ChatGPT与Perplexity两大AI搜索平台：ChatGPT作为全能型助手，整合搜索与多任务处理，但存在信息时效性不足；Perplexity专注垂直搜索，强调引用透明与权威来源。针对AI搜索优化（GEO），提出差异化策略：面向ChatGPT需构建结构化知识库、强化品牌实体识别；面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具，通过曝光率等指标量化内容在AI生态中的可见度，并给出可落地的优化行动方案。
如何提升品牌在AI回答中的提及率？GEO优化3招，让ChatGPT主动提及你的品牌

本文探讨AI搜索时代品牌面临的"隐身危机"，指出AI搜索用户年增538.7%，但品牌在AI回答中提及率不足20%。提出三大核心策略：1）构建权威背书矩阵，通过知乎等高权重平台获取自然提及；2）优化AI友好内容，采用对话式标题和结构化数据；3）建立数据监测闭环，通过A/B测试持续迭代。强调需善用监测工具实时追踪品牌在豆包、文心一言等AI模型的曝光表现，避免内容"注水"。最终实现从"被动等待"到主动抢占AI"第一屏"的转变。

文章搜索核心标签 SEO优化
如何让你的内容被 ChatGPT 优先引用？——GEO 优化实战指南

传统SEO追求"谷歌首页排名"，生成式AI时代则需追求"被AI引用"。AI模型不提供明确排名算法，更像黑箱，使内容创作者困惑。GEO优化的核心是让内容具备"可引用性"：权威清晰、结构化信息、语义覆盖多维度、模型检索映射。需通过AIBase等GEO排名查询工具验证"AI曝光率"，分析引用语境、竞争差距，调整内容结构以提升AI引用倾向。SEO优化机器如何找到你，GEO则优化AI如何引用你。

SEO优化 AI引用内容权威性
AI日报：微软发布首款自研图像生成模型 MAI-Image-1；百度世界大会时间公布；AI大牛开源nanochat教学工具

微软发布首款自研图像生成模型MAI-Image-1，跻身LMArena前十，注重实用性与光影效果；百度世界2025大会将聚焦大模型与AI全球化战略；Meta新技术使RAG推理速度提升30倍；开源项目nanochat实现低成本构建聊天AI；谷歌NotebookLM新增动漫视频生成功能；中国农大发布神农大模型3.0助力智慧农业；腾讯启动"青云奖学金"培养AI人才；苹果FS-DFM模型长文本生成效率提升128倍；谷歌Lens整合AI图像编辑功能；港大与美团提出CodePlot-CoT方法，通过代码绘图解决数学难题，性能提升21%。

AI 图像生成微软
荐OpenAI 推出浏览器：“让位吧，Chrome”

北京时间10月22日凌晨，没等来传闻中的Gemini3，等来了OpenAI正式发布首款AI浏览器ChatGPT Atlas。简单来说，这是一个把ChatGPT"塞进"浏览器的产品，你在任何网页上都能随时唤出ChatGPT侧边栏，让AI帮你总结内容、编辑文字、甚至代替你完成购物和预订任务。听起来有点像Chrome装了个ChatGPT插件?确实如此，但OpenAI的野心远不止于此。

OpenAI
OpenAI也来了，巨头为何决战AI浏览器？

AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas，这是OpenAI推出的首款人工智能驱动的网页浏览器。这也被外界认为OpenAI要向谷歌宣战，挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天，谷歌母公司Alphabet股价应声下挫，盘中最大跌幅接近5%，足见市场对这一新品的敏感度。近一年来，AI浏览器的战略价值成为行业共识，从业者更是将其与智能代理（Agent）、搜索引�

AI浏览器 ChatGPT Atlas
荐AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停Sora生成已故名人；谷歌推出Gemini地图数据集成工具

视觉中国与多家AI公司合作开发可商用视觉大模型，已获阿里、微软等订单。OpenAI因不当内容暂停Sora生成马丁·路德·金形象视频，引发AI伦理讨论。DeepSeek在加密货币交易实验中表现领先。WhatsApp将禁止第三方通用AI聊天机器人，仅保留Meta AI。宇树科技推出仿人机器人Unitree H2，具备拟人化设计。谷歌为Gemini集成地图数据工具，可访问25亿地点实时信息。Opera推出集成三款AI助手的Neon浏览器，但用户体验存在困惑。Facebook在美加推出AI照片编辑建议功能，可分析手机未分享照片。

AI 视觉大模型版权合规
ChatGPT正秘密测试私信功能：支持用户之间直接交流

OpenAI正在为其明星产品ChatGPT测试名为私信”（Direct Messages）的社交功能。这一变化意味着ChatGPT正从原本用户与AI单向交互的语言模型工具，逐步转向具备人与人通过AI连接”能力的社交平台。 OpenAI此次测试的私信”功能允许用户创

ChatGPT OpenAI 社交功能
苹果前CEO发声：OpenAI成苹果AI时代劲敌 Siri显得十分滞后

曾担任苹果首席执行官的约翰斯库利近日公开表示，OpenAI已成为苹果几十年来首个真正意义上的竞争对手，并直言人工智能并非苹果特别擅长的领域”。从实际情况看，苹果在人工智能竞赛中确实表现欠佳。与OpenAI、谷歌、亚马逊和Meta等公司持续推出的产品更新相比，苹果显得步伐迟缓。今年早些时候，其对AI助手Siri进行全面升级的计划被推迟，这无疑在产品推进方面遭遇�

苹果人工智能 OpenAI

今日大家都在搜的词：

热文

3 天
7天

AI日报： OpenAI推出gpt-image-1图像生成API;纳米AI发布MCP工具箱;中国占全球AI专利60%

OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

GEO如何改变ChatGPT搜索和Perplexity的游戏规则

如何提升品牌在AI回答中的提及率？GEO优化3招，让ChatGPT主动提及你的品牌

如何让你的内容被 ChatGPT 优先引用？——GEO 优化实战指南

AI日报：微软发布首款自研图像生成模型 MAI-Image-1；百度世界大会时间公布；AI大牛开源nanochat教学工具

荐OpenAI 推出浏览器：“让位吧，Chrome”

OpenAI也来了，巨头为何决战AI浏览器？

荐AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停Sora生成已故名人；谷歌推出Gemini地图数据集成工具

ChatGPT正秘密测试私信功能：支持用户之间直接交流

苹果前CEO发声：OpenAI成苹果AI时代劲敌 Siri显得十分滞后

今日大家都在搜的词：

热文

五大升级！红米REDMI K90标准版采用6.59英寸黄金中尺寸

微信三大更新放出上热搜涉及群聊消息处理、消息撤回等

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个

兰博基尼联名！REDMI K90 Pro Max冠军版官宣

红米REDMI K90标准版亮相：质感、工艺脱胎换骨

华为鸿蒙HarmonyOS 6公测版开启推送

REDMI K90标准版外观公布：屏幕视觉四等边

华为余承东：鸿蒙5终端设备数量突破2300万

苹果首款2nm手机芯片上热搜 A20由iPhone 18系列首发

卢伟冰：REDMI K90标准版12+512首销月直降300 售价2899元

五大升级！红米REDMI K90标准版采用6.59英寸黄金中尺寸

AI日报：阿里夸克“C计划”曝光；Veo3.1将增加视频“精确编辑”

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

iOS 26液态玻璃效果能关了苹果iOS 26.1 Beta 4新增液态玻璃开

余承东官宣华为路由X3 Pro 采用“日照金山”设计

AI日报：视觉中国与多家大模型公司达成合作；OpenAI紧急暂停So

微信三大更新放出上热搜涉及群聊消息处理、消息撤回等

天猫双11今晚8点开卖品类券每人可领万元

AI日报：OpenAI发布浏览器Atlas；通义Qwen3-VL新增2B、32B两个

兰博基尼联名！REDMI K90 Pro Max冠军版官宣

站长商机