首页 > 原创 > 关键词  > AI日报最新资讯  > 正文

AI日报:OpenAI新图像生成模型可一句话P图;可灵AI营收超1亿;谷歌上线推理大模型Gemini 2.5

2025-03-26 15:34 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、OpenAI推出全新图像生成模型,挑战Google一句话P图

OpenAI最近推出了其最新GPT-4o模型,集成了先进的图像生成器,展现出显著的图像渲染能力和多样的输入输出支持。CEO萨姆·奥特曼在社交媒体上分享了他对模型生成图像的震惊和期待,鼓励用户发挥创造力。新模型的自回归特性使其在处理复杂指令时表现出色,尽管仍有一些不足之处,但OpenAI承诺将持续优化。

【AiBase提要:】

🎨 新模型支持高质量图像生成,能够精确渲染文本内容,提供多种输入输出方式。

🤖 GPT-4o采用自回归模型,能处理10至20个复杂指令,展现出更强的图像生成能力。

🔒 所有生成图像带有C2PA元数据标识,确保内容来源可追溯,增强安全性。

2、可灵AI营收超1亿 收入主要来自于C端订阅服务

快手推出的可灵AI自去年6月上线以来,营业收入已超过1亿元,成为国内视频生成AI应用中的佼佼者。凭借强大的功能和早期市场布局,可灵AI在竞争激烈的市场中占据了一席之地。快手计划通过技术创新和资本投入,进一步推动可灵AI的发展,并力争成为全球营收规模第一的视频生成AI应用。

【AiBase提要:】

🚀 可灵AI自推出以来营业收入超1亿,成为国内视频生成AI的商业化标杆。

🔄 快手通过AI技术升级现有业务,推动研发与收益的良性循环,已进行20多次版本迭代。

🌍 可灵AI在国际市场上竞争力强,用户群体迅速增长,成为全球内容创作者的热门选择。

3、谷歌发布全新推理 AI 模型 Gemini2.5和Gemini2.5Pro实验版

谷歌近期推出了其最新的人工智能推理模型Gemini2.5及其Pro版本,标志着AI技术的重大进步。Gemini2.5具备了“思考”的能力,能够在多个基准测试中超越竞争对手,特别是在代码编辑和软件开发能力方面表现突出。未来,谷歌还计划推出更强大的200万个token上下文窗口,以进一步提升模型的性能。

QQ_1742953507187.png

【AiBase提要:】

🌟 Gemini2.5和Pro版本具备推理能力,标志着AI技术新进展。

🚀 在多个基准测试中,Gemini2.5Pro表现优于多家竞争对手。

📈 将推出200万个token的上下文窗口,进一步提升AI模型处理能力。

详情链接:https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025/#advanced-coding

4、腾讯混元T1正式版和DeepSeek V3-0324上线

腾讯最近发布了混元 T1正式版和DeepSeek V3最新版,标志着其在深度学习和人工智能领域的进一步发展。混元 T1正式版相较于之前的版本在速度和性能上进行了全面升级,能够实现秒级响应,优化了用户体验,适用于各种推理任务。同时,DeepSeek V3也经过优化,提供更精准的分析和思考能力。

image.png

【AiBase提要:】

🌟 混元 T1正式版与 DeepSeek V3最新版同步上线,用户可体验最新深度思考技术。

⚡ 新版本相比 T1Preview全面升级,提升了速度和性能,能够实现秒级响应。

☁️ 腾讯云支持混元 T1,致力于为用户提供高效的智能服务和技术支持。

5、零成本拍爆款!AI电商视频生成神器Product Anyshoot来了

Product Anyshoot是一款创新的AI视频生成工具,专为电商行业设计,旨在提升商品展示的效率和真实感。商家只需上传商品图片,系统便能智能地将商品融入预制视频中,极大地简化了制作流程。这款工具的商品还原度极高,生成的视频质量达到商业标准,帮助中小型商家在市场竞争中脱颖而出。

image.png

【AiBase提要:】

🖼️ 只需上传商品图片,Product Anyshoot即可智能生成高质量展示视频,极大简化制作流程。

⚙️ 该工具内置超过5000个预制模板,支持用户自定义,满足个性化展示需求。

📈 生成视频的流畅性和真实感达到商业标准,帮助中小型商家提升竞争力。

详情链接:https://top.aibase.com/tool/product-anyshoot

6、美图WHEE全新上线「证件照」功能

WHEE推出的全新“证件照”功能,旨在为用户提供便捷的证件照制作体验。用户只需通过手机应用,便可在短短五分钟内生成高质量的证件照,解决了传统照相馆的诸多不便。该功能支持多种尺寸适配,确保用户在各种场合都能使用合适的证件照,且具备无痛换头换装的强大能力,能够轻松切换背景和服装风格,满足用户的个性化需求。

微信截图_20250325173547.png

【AiBase提要:】

📏 证件照功能支持多种尺寸适配,用户无需担心尺寸问题,适合各种场合。

✨ 具备无痛换头换装功能,用户可轻松切换背景和服装,展现不同风格。

🌟 百变形象照功能让用户快速完成形象转换,满足个性化需求。

7、腾讯云宣布上线DeepSeek最新版V3模型API接口

腾讯云于3月25日晚宣布推出DeepSeek-V3-0324版本模型的API接口,允许企业和开发者直接调用该模型,提供稳定优质的服务。新版本在推理任务、编程能力和中文写作等方面有显著提升,特别是在数学和代码评测中超越了GPT-4.5。

【AiBase提要:】

🛠️ 新版DeepSeek-V3模型通过强化学习技术提升了推理任务的表现,特别是在数学和代码评测中超越了GPT-4.5。

💻 编程能力显著增强,生成的HTML代码可用性和视觉效果更佳,开发者认为其能力可与Claude3.5/3.7Sonnet相媲美。

✍️ 中文写作方面,优化了中长篇文本的创作质量,并在联网搜索场景下输出更详实准确的结果。

详情链接:https://cloud.tencent.com/document/product/1772/115963

8、清华大学开源 Video-T1:无需重新训练 AI视频秒变高清大片

清华大学的研究团队开源了Video-T1技术,利用测试时缩放(TTS)策略显著提升视频生成质量和文本一致性。该方法通过在推理阶段增加计算资源,避免了昂贵的模型重训,展现了视频生成的新可能性。实验表明,TTS能够持续提升模型性能,尤其在图像质量和场景描述的贴合度上取得显著进展。

image.png

【AiBase提要:】

🎯 TTS策略通过增加推理计算资源,显著提升视频生成质量和一致性。

🔍 Video-T1采用随机线性搜索和帧树搜索策略,优化了候选视频的生成和评估过程。

📈 实验结果显示,TTS在多个视频生成模型上稳定提升性能,尤其在图像质量和场景描述的贴合度上。

详情链接:https://top.aibase.com/tool/video-t1

9、苹果将利用苹果地图“Look Around” 照片训练AI模型

苹果公司近日宣布将于2025年3月起利用其“Look Around”功能收集的图像来训练人工智能模型。这些模型将应用于图像识别和创作等技术。苹果承诺在收集数据时保护用户隐私,所有图像均经过模糊处理。用户若希望自家房屋图像被模糊处理,可提出请求。

【AiBase提要:】

🌍 苹果将于2025年3月起利用“Look Around”图像训练人工智能模型。

📷 收集图像的过程中,苹果承诺保护用户隐私,模糊处理人脸和车牌。

🖼️ 苹果的多项功能已由人工智能图像生成模型驱动,包括照片应用的清理工具等。

10、宝马官宣与阿里达成AI合作 通义大模型将上车

宝马集团与阿里巴巴集团在中国市场达成战略合作,聚焦人工智能大语言模型与智能语音交互技术。阿里巴巴的通义大模型将应用于宝马新世代车型,提升智能交互体验。宝马的360度全链AI战略将优化生产流程,为智能汽车制造提供保障,计划在2026年量产新车型,赋能AI智能个人助理,带来自然流畅的用户互动体验。

【AiBase提要:】

🤝 宝马与阿里巴巴达成战略合作,共同开发符合中国用户需求的AI解决方案。

🚀 阿里巴巴的通义大模型将为宝马新车型提供智能化升级的技术支持。

🛠️ 宝马计划在2026年量产新世代车型,首次引入AI大语言模型,提升用户交互体验。

举报

  • 相关推荐
  • OpenAI发布GPT-5.1:情商大涨 本周开始推送

    OpenAI正式推出GPT-5.1模型,以“智商与情商深度融合”为核心亮点。新模型优化推理能力,强化情绪价值与个性化交互,包含Instant与Thinking两大核心版本:Instant首次引入自适应推理功能,针对复杂任务延长思考时间,简单问题保持极速响应;Thinking版本智能分配思考时长,提升回答透彻度与通俗性。新增Auto功能自动匹配最佳模型,支持六种官方预设风格及精准微调。安全评估首次纳入心理健康与情感依赖维度,防范拟人化风险。付费用户可保留旧版三个月过渡期。

  • AI日报:李飞飞Marble 3D世界模型公测;OpenAI首次推出ChatGPT群聊功能;百度发布多模态 AI助手超能小度

    本期AI日报聚焦多项技术突破:World Labs推出Marble 3D模型,实现多模态生成可交互虚拟世界;OpenAI在韩新试点ChatGPT群聊功能,支持多人协作互动;苹果更新隐私政策,要求第三方AI调用需明示授权;百度发布多模态助手“超能小度”,支持空间感知与设备免费升级;LinkedIn推出AI人脉搜索,通过自然语言精准匹配专业人士;Cursor完成23亿美元融资,估值达293亿;Character AI与耶鲁合作实现音画同步技术Ovi;Google NotebookLM上线深度研究工具,支持多格式文件分析与知识库构建。

  • AI全面落地双11,淘宝走出一条和OpenAI不同的路

    ​今年的双11已经进入最后阶段,消费者和商家都有一个明显的感受是,AI的浓度真的很高,并且AI的全面落地应用,真的在改变传统用户购物、商家经营的链路。 消费者能感受到两个比较明显的变化:一个是AI导购开始走进真实的购物场景。淘宝为双11投入了六款AI导购类产品,其公布的数据显示,AI万能搜已经帮助消费者解决了5000万个消费需求。 另一个则是平台推荐的商品越

  • OpenAI和微软的关系没那么糟,跟英伟达也没那么好

    OpenAI的动作比所有人想象的都要快。 上周二,OpenAI完成重组。其中一个重要变化是:彻底取消了与微软的排他性协议,结束了Azure长达六年的云服务独占模式。此前,OpenAI所有模型的训练、推理与部署都必须优先选择Azure,微软还享有优先购买权。 宣布与Azure“分手”后不到一周,OpenAI便火速宣布了与AWS的战略合作——双方达成一项价值380亿美元的云计算协议,OpenAI将全面接入

  • AI日报:月之暗面开源AI新框架Kosong;百度发布新模型ERNIE-4.5-VL;GPT-5.1“隐身”登场

    本期AI日报聚焦多项技术突破:月之暗面开源AI代理框架Kosong,支持异步编排与插件化设计;Replit推出AI集成功能,可一键调用300+模型;商汤发布空间智能模型SenseNova-SI,性能超越GPT-5;百度推出多模态模型ERNIE-4.5-VL,新增图像思考能力;谷歌地图全面AI化,集成Gemini实现智能交互;ChatTutor上线可视化教学系统,覆盖多学科实时推演;新版Google Finance引入AI深度搜索与财报追踪;OpenAI低调上线Polaris Alpha模型,支持256K上下文并更新知识库至2024年10月。

  • OpenAI也来了,巨头为何决战AI浏览器?

    AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas,这是OpenAI推出的首款人工智能驱动的网页浏览器。 这也被外界认为OpenAI要向谷歌宣战,挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天,谷歌母公司Alphabet股价应声下挫,盘中最大跌幅接近5%,足见市场对这一新品的敏感度。 近一年来,AI浏览器的战略价值成为行业共识,从业者更是将其与智能代理(Agent)、搜索引�

  • AI日报:上海首例涉AI提示词著作权案宣判;Kimi K2 Thinking发布;中文图像编辑新王UniWorld-V2发布

    今日AI领域动态:上海首例AI提示词著作权案宣判,法院认定提示词不具独创性;月之暗面发布Kimi K2思考模型,实现自主多轮工具调用;UniWorld-V2图像编辑模型支持中文框选即改,性能超越GPT-Image;谷歌推出AI文件检测工具Magika 1.0,支持超200种格式;Sora安卓版首日下载量达47万次;我国发布全球首个AI海洋大模型“瞰海”,可精准预测10天内海洋变化;宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控;谷歌Gemini API推出文件搜索工具,简化私有RAG系统集成。

  • 百度搜索AI API全面开放 绝大多数结果由AI生成

    11月13日,百度创始人李彦宏在2025百度世界大会上宣布,百度搜索已实现绝大多数结果由AI生成,首条结果富媒体覆盖率高达70%。他强调,百度正通过AI技术深度重构搜索结果页,从传统文字链接模式转向以图片、视频等富媒体内容为核心的AI应用。李彦宏指出,百度是全球搜索引擎中对AI化改造最激进的,正引领行业进入全新时代。他还表示,企业需善用AI方能立于不败之地,个人也需掌握AI技能以掌控未来。目前,百度已通过AI+API开放搜索能力,与三星、荣耀、vivo等主流厂商建立合作,共同探索AI搜索的无限可能。

  • 小米超级小爱AI大模型推出随心修图功能

    小米宣布超级小爱AI大模型推出随心修图功能,用户只需一句话即可轻松修出具有大片质感的照片。该功能有两种使用方式:在相册大图页面直接唤醒AI或通过应用上传照片并输入指令。使用需满足版本要求:超级小爱需v7.8.50及以上,相册编辑功能需v2.1及以上,相册本身需v4.3.0.30及以上。目前仅限Xiaomi HyperAI机型支持在相册大图页使用。超级小爱于2024年12月面向正式版用户开放升级,支持全局多模态交互和自然语音搜索,提升使用体验。

  • AI日报:Sora正式登陆Android;网易云音乐推AI调音大师;谷歌将推Nano Banana2

    本期AI日报聚焦多领域突破:OpenAI视频应用Sora登陆安卓平台并引入付费角色功能;网易云音乐推出AI调音大师实现智能音效适配;字节跳动高薪布局人形机器人赛道;谷歌Gemini平台将升级图像生成技术;llama.cpp实现多模态革命;特斯拉秘密实验室通过行为数据训练机器人;上海首例AI著作权案宣判保护原创;微软推出自研图像生成器MAI-Image-1,在创意效率与质量间取得平衡。

今日大家都在搜的词: