AI日报：OpenAI新图像生成模型可一句话P图；可灵AI营收超1亿；谷歌上线推理大模型Gemini 2.5

2025-03-26 15:34 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、OpenAI推出全新图像生成模型，挑战Google一句话P图

OpenAI最近推出了其最新的GPT-4o模型，集成了先进的图像生成器，展现出显著的图像渲染能力和多样的输入输出支持。CEO萨姆·奥特曼在社交媒体上分享了他对模型生成图像的震惊和期待，鼓励用户发挥创造力。新模型的自回归特性使其在处理复杂指令时表现出色，尽管仍有一些不足之处，但OpenAI承诺将持续优化。

【AiBase提要:】
🎨 新模型支持高质量图像生成，能够精确渲染文本内容，提供多种输入输出方式。
🤖 GPT-4o采用自回归模型，能处理10至20个复杂指令，展现出更强的图像生成能力。
🔒 所有生成图像带有C2PA元数据标识，确保内容来源可追溯，增强安全性。

2、可灵AI营收超1亿收入主要来自于C端订阅服务

快手推出的可灵AI自去年6月上线以来，营业收入已超过1亿元，成为国内视频生成AI应用中的佼佼者。凭借强大的功能和早期市场布局，可灵AI在竞争激烈的市场中占据了一席之地。快手计划通过技术创新和资本投入，进一步推动可灵AI的发展，并力争成为全球营收规模第一的视频生成AI应用。

【AiBase提要:】
🚀 可灵AI自推出以来营业收入超1亿，成为国内视频生成AI的商业化标杆。
🔄 快手通过AI技术升级现有业务，推动研发与收益的良性循环，已进行20多次版本迭代。
🌍 可灵AI在国际市场上竞争力强，用户群体迅速增长，成为全球内容创作者的热门选择。

3、谷歌发布全新推理 AI 模型 Gemini2.5和Gemini2.5Pro实验版

谷歌近期推出了其最新的人工智能推理模型Gemini2.5及其Pro版本，标志着AI技术的重大进步。Gemini2.5具备了“思考”的能力，能够在多个基准测试中超越竞争对手，特别是在代码编辑和软件开发能力方面表现突出。未来，谷歌还计划推出更强大的200万个token上下文窗口，以进一步提升模型的性能。

【AiBase提要:】
🌟 Gemini2.5和Pro版本具备推理能力，标志着AI技术新进展。
🚀 在多个基准测试中，Gemini2.5Pro表现优于多家竞争对手。
📈 将推出200万个token的上下文窗口，进一步提升AI模型处理能力。
详情链接:https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/#advanced-coding

4、腾讯混元T1正式版和DeepSeek V3-0324上线

腾讯最近发布了混元 T1正式版和DeepSeek V3最新版，标志着其在深度学习和人工智能领域的进一步发展。混元 T1正式版相较于之前的版本在速度和性能上进行了全面升级，能够实现秒级响应，优化了用户体验，适用于各种推理任务。同时，DeepSeek V3也经过优化，提供更精准的分析和思考能力。

【AiBase提要:】
🌟 混元 T1正式版与 DeepSeek V3最新版同步上线，用户可体验最新深度思考技术。
⚡ 新版本相比 T1Preview全面升级，提升了速度和性能，能够实现秒级响应。
☁️ 腾讯云支持混元 T1，致力于为用户提供高效的智能服务和技术支持。

5、零成本拍爆款!AI电商视频生成神器Product Anyshoot来了

Product Anyshoot是一款创新的AI视频生成工具，专为电商行业设计，旨在提升商品展示的效率和真实感。商家只需上传商品图片，系统便能智能地将商品融入预制视频中，极大地简化了制作流程。这款工具的商品还原度极高，生成的视频质量达到商业标准，帮助中小型商家在市场竞争中脱颖而出。

【AiBase提要:】
🖼️ 只需上传商品图片，Product Anyshoot即可智能生成高质量展示视频，极大简化制作流程。
⚙️ 该工具内置超过5000个预制模板，支持用户自定义，满足个性化展示需求。
📈 生成视频的流畅性和真实感达到商业标准，帮助中小型商家提升竞争力。
详情链接:https://top.aibase.com/tool/product-anyshoot

6、美图WHEE全新上线「证件照」功能

WHEE推出的全新“证件照”功能，旨在为用户提供便捷的证件照制作体验。用户只需通过手机应用，便可在短短五分钟内生成高质量的证件照，解决了传统照相馆的诸多不便。该功能支持多种尺寸适配，确保用户在各种场合都能使用合适的证件照，且具备无痛换头换装的强大能力，能够轻松切换背景和服装风格，满足用户的个性化需求。

微信截图_20250325173547.png

【AiBase提要:】
📏 证件照功能支持多种尺寸适配，用户无需担心尺寸问题，适合各种场合。
✨ 具备无痛换头换装功能，用户可轻松切换背景和服装，展现不同风格。
🌟 百变形象照功能让用户快速完成形象转换，满足个性化需求。

7、腾讯云宣布上线DeepSeek最新版V3模型API接口

腾讯云于3月25日晚宣布推出DeepSeek-V3-0324版本模型的API接口，允许企业和开发者直接调用该模型，提供稳定优质的服务。新版本在推理任务、编程能力和中文写作等方面有显著提升，特别是在数学和代码评测中超越了GPT-4.5。

【AiBase提要:】
🛠️ 新版DeepSeek-V3模型通过强化学习技术提升了推理任务的表现，特别是在数学和代码评测中超越了GPT-4.5。
💻 编程能力显著增强，生成的HTML代码可用性和视觉效果更佳，开发者认为其能力可与Claude3.5/3.7Sonnet相媲美。
✍️ 中文写作方面，优化了中长篇文本的创作质量，并在联网搜索场景下输出更详实准确的结果。
详情链接:https://cloud.tencent.com/document/product/1772/115963

8、清华大学开源 Video-T1:无需重新训练 AI视频秒变高清大片

清华大学的研究团队开源了Video-T1技术，利用测试时缩放（TTS）策略显著提升视频生成质量和文本一致性。该方法通过在推理阶段增加计算资源，避免了昂贵的模型重训，展现了视频生成的新可能性。实验表明，TTS能够持续提升模型性能，尤其在图像质量和场景描述的贴合度上取得显著进展。

【AiBase提要:】
🎯 TTS策略通过增加推理计算资源，显著提升视频生成质量和一致性。
🔍 Video-T1采用随机线性搜索和帧树搜索策略，优化了候选视频的生成和评估过程。
📈 实验结果显示，TTS在多个视频生成模型上稳定提升性能，尤其在图像质量和场景描述的贴合度上。
详情链接:https://top.aibase.com/tool/video-t1

9、苹果将利用苹果地图“Look Around” 照片训练AI模型

苹果公司近日宣布将于2025年3月起利用其“Look Around”功能收集的图像来训练人工智能模型。这些模型将应用于图像识别和创作等技术。苹果承诺在收集数据时保护用户隐私，所有图像均经过模糊处理。用户若希望自家房屋图像被模糊处理，可提出请求。

【AiBase提要:】
🌍 苹果将于2025年3月起利用“Look Around”图像训练人工智能模型。
📷 收集图像的过程中，苹果承诺保护用户隐私，模糊处理人脸和车牌。
🖼️ 苹果的多项功能已由人工智能图像生成模型驱动，包括照片应用的清理工具等。

10、宝马官宣与阿里达成AI合作通义大模型将上车

宝马集团与阿里巴巴集团在中国市场达成战略合作，聚焦人工智能大语言模型与智能语音交互技术。阿里巴巴的通义大模型将应用于宝马新世代车型，提升智能交互体验。宝马的360度全链AI战略将优化生产流程，为智能汽车制造提供保障，计划在2026年量产新车型，赋能AI智能个人助理，带来自然流畅的用户互动体验。

【AiBase提要:】
🤝 宝马与阿里巴巴达成战略合作，共同开发符合中国用户需求的AI解决方案。
🚀 阿里巴巴的通义大模型将为宝马新车型提供智能化升级的技术支持。
🛠️ 宝马计划在2026年量产新世代车型，首次引入AI大语言模型，提升用户交互体验。

（举报）

相关推荐

关键词：

OpenAI发布GPT-5.1：情商大涨本周开始推送

OpenAI正式推出GPT-5.1模型，以“智商与情商深度融合”为核心亮点。新模型优化推理能力，强化情绪价值与个性化交互，包含Instant与Thinking两大核心版本：Instant首次引入自适应推理功能，针对复杂任务延长思考时间，简单问题保持极速响应；Thinking版本智能分配思考时长，提升回答透彻度与通俗性。新增Auto功能自动匹配最佳模型，支持六种官方预设风格及精准微调。安全评估首次纳入心理健康与情感依赖维度，防范拟人化风险。付费用户可保留旧版三个月过渡期。

GPT-5.1模型智商与情商自适应推理
荐AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT群聊功能；百度发布多模态 AI助手超能小度

本期AI日报聚焦多项技术突破：World Labs推出Marble 3D模型，实现多模态生成可交互虚拟世界；OpenAI在韩新试点ChatGPT群聊功能，支持多人协作互动；苹果更新隐私政策，要求第三方AI调用需明示授权；百度发布多模态助手“超能小度”，支持空间感知与设备免费升级；LinkedIn推出AI人脉搜索，通过自然语言精准匹配专业人士；Cursor完成23亿美元融资，估值达293亿；Character AI与耶鲁合作实现音画同步技术Ovi；Google NotebookLM上线深度研究工具，支持多格式文件分析与知识库构建。

AI 3D虚拟世界多模态输入
AI全面落地双11，淘宝走出一条和OpenAI不同的路

今年的双11已经进入最后阶段，消费者和商家都有一个明显的感受是，AI的浓度真的很高，并且AI的全面落地应用，真的在改变传统用户购物、商家经营的链路。消费者能感受到两个比较明显的变化:一个是AI导购开始走进真实的购物场景。淘宝为双11投入了六款AI导购类产品，其公布的数据显示，AI万能搜已经帮助消费者解决了5000万个消费需求。另一个则是平台推荐的商品越

AI导购双11购物淘宝AI
荐OpenAI和微软的关系没那么糟，跟英伟达也没那么好

OpenAI的动作比所有人想象的都要快。上周二，OpenAI完成重组。其中一个重要变化是:彻底取消了与微软的排他性协议，结束了Azure长达六年的云服务独占模式。此前，OpenAI所有模型的训练、推理与部署都必须优先选择Azure，微软还享有优先购买权。宣布与Azure“分手”后不到一周，OpenAI便火速宣布了与AWS的战略合作——双方达成一项价值380亿美元的云计算协议，OpenAI将全面接入

OpenAI 云计算战略合作
荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

本期AI日报聚焦多项技术突破：月之暗面开源AI代理框架Kosong，支持异步编排与插件化设计；Replit推出AI集成功能，可一键调用300+模型；商汤发布空间智能模型SenseNova-SI，性能超越GPT-5；百度推出多模态模型ERNIE-4.5-VL，新增图像思考能力；谷歌地图全面AI化，集成Gemini实现智能交互；ChatTutor上线可视化教学系统，覆盖多学科实时推演；新版Google Finance引入AI深度搜索与财报追踪；OpenAI低调上线Polaris Alpha模型，支持256K上下文并更新知识库至2024年10月。

AI代理开源框架异步编排
荐OpenAI也来了，巨头为何决战AI浏览器？

AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas，这是OpenAI推出的首款人工智能驱动的网页浏览器。这也被外界认为OpenAI要向谷歌宣战，挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天，谷歌母公司Alphabet股价应声下挫，盘中最大跌幅接近5%，足见市场对这一新品的敏感度。近一年来，AI浏览器的战略价值成为行业共识，从业者更是将其与智能代理（Agent）、搜索引�

AI浏览器 ChatGPT Atlas
荐AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发布；中文图像编辑新王UniWorld-V2发布

今日AI领域动态：上海首例AI提示词著作权案宣判，法院认定提示词不具独创性；月之暗面发布Kimi K2思考模型，实现自主多轮工具调用；UniWorld-V2图像编辑模型支持中文框选即改，性能超越GPT-Image；谷歌推出AI文件检测工具Magika 1.0，支持超200种格式；Sora安卓版首日下载量达47万次；我国发布全球首个AI海洋大模型“瞰海”，可精准预测10天内海洋变化；宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控；谷歌Gemini API推出文件搜索工具，简化私有RAG系统集成。

AI 著作权提示词
百度搜索AI API全面开放绝大多数结果由AI生成

11月13日，百度创始人李彦宏在2025百度世界大会上宣布，百度搜索已实现绝大多数结果由AI生成，首条结果富媒体覆盖率高达70%。他强调，百度正通过AI技术深度重构搜索结果页，从传统文字链接模式转向以图片、视频等富媒体内容为核心的AI应用。李彦宏指出，百度是全球搜索引擎中对AI化改造最激进的，正引领行业进入全新时代。他还表示，企业需善用AI方能立于不败之地，个人也需掌握AI技能以掌控未来。目前，百度已通过AI+API开放搜索能力，与三星、荣耀、vivo等主流厂商建立合作，共同探索AI搜索的无限可能。

百度世界大会 AI生成富媒体
小米超级小爱AI大模型推出随心修图功能

小米宣布超级小爱AI大模型推出随心修图功能，用户只需一句话即可轻松修出具有大片质感的照片。该功能有两种使用方式：在相册大图页面直接唤醒AI或通过应用上传照片并输入指令。使用需满足版本要求：超级小爱需v7.8.50及以上，相册编辑功能需v2.1及以上，相册本身需v4.3.0.30及以上。目前仅限Xiaomi HyperAI机型支持在相册大图页使用。超级小爱于2024年12月面向正式版用户开放升级，支持全局多模态交互和自然语音搜索，提升使用体验。

小米超级小爱 AI大模型
荐AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将推Nano Banana2

本期AI日报聚焦多领域突破：OpenAI视频应用Sora登陆安卓平台并引入付费角色功能；网易云音乐推出AI调音大师实现智能音效适配；字节跳动高薪布局人形机器人赛道；谷歌Gemini平台将升级图像生成技术；llama.cpp实现多模态革命；特斯拉秘密实验室通过行为数据训练机器人；上海首例AI著作权案宣判保护原创；微软推出自研图像生成器MAI-Image-1，在创意效率与质量间取得平衡。

OpenAI Sora Android

今日大家都在搜的词：

热文

3 天
7天

AI日报：OpenAI新图像生成模型可一句话P图；可灵AI营收超1亿；谷歌上线推理大模型Gemini 2.5

OpenAI发布GPT-5.1：情商大涨本周开始推送

荐AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT群聊功能；百度发布多模态 AI助手超能小度

AI全面落地双11，淘宝走出一条和OpenAI不同的路

荐OpenAI和微软的关系没那么糟，跟英伟达也没那么好

荐AI日报：月之暗面开源AI新框架Kosong；百度发布新模型ERNIE-4.5-VL；GPT-5.1“隐身”登场

荐OpenAI也来了，巨头为何决战AI浏览器？

荐AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发布；中文图像编辑新王UniWorld-V2发布

百度搜索AI API全面开放绝大多数结果由AI生成

小米超级小爱AI大模型推出随心修图功能

荐AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将推Nano Banana2

今日大家都在搜的词：

热文

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

小米超级小爱AI大模型推出随心修图功能

荣耀500系列官宣将于11月24日发布

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

雷军回应小米双11战绩：谢谢大家支持

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

卢伟冰：小米手机双11连续三年国产销量第一

95岁巴菲特每周还上5天班此前计划年底退休

京东发布双11战报：订单总量增长近60% 下单用户同比增长40%

荣耀500系列官宣：超级标准版+超级Pro版

AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能

站长商机