首页 > 业界 > 关键词  > 图像生成模型最新资讯  > 正文

谷歌Nano Banana 2图像模型正式发布:4K生图 速度更快 成本砍半

2026-02-27 08:53 · 稿源: 快科技

2月27日,谷歌公司正式推出其新一代图像生成模型Nano Banana 2。该模型旨在为用户提供更为高效、经济且操作简便的高质量图像生成服务。

根据官方计划,Nano Banana 2将逐步整合至Gemini、谷歌搜索、AI Studio、Flow、付费API及谷歌广告等多个核心平台,并计划在未来全面取代上一代模型。

据悉,新模型基于Gemini 3.1 Flash Image架构开发,在图像生成质量、逻辑推理与知识整合方面达到了专业水准,同时保持了高速生成的特点,力求在画面品质与处理速度之间取得更佳平衡。

在技术改进上,Nano Banana 2着重优化了中文文本处理、语义理解准确性以及画面伪影等问题。其输出分辨率已从2K提升至4K,画面光照效果更为自然,纹理细节更加丰富,整体清晰度与锐度均有显著提升。

谷歌发布Nano Banana 2图像模型:支持4K生成,速度提升且成本降低

此外,该模型在生成一致性方面表现突出,可支持最多5个角色特征保持高度统一,并能高保真呈现多达14个对象。其在主体稳定性与复杂场景控制上的能力得到加强,更适合包含多角色、多元素的创作任务。

谷歌发布Nano Banana 2图像模型:支持4K生成,速度提升且成本降低

成本控制是本次升级的另一重点。Nano Banana 2的单张图像生成成本约为0.067美元,较前代专业版本下降约一半。在维持高质量输出的同时,这一调整有望降低使用门槛,推动该技术在商业与创意领域的广泛应用。

举报

  • 相关推荐
  • 谷歌Gemini再升级!解锁新玩法:输入提示词即可生成交互式3D模型

    近日,谷歌Gemini AI推出最新升级,用户只需输入提示词,就能让聊天机器人生成交互式3D模型和实时模拟。 这一新功能支持多种互动操作,包括旋转模型、拖动滑块调整参数或输入数值改变模拟结果。 例如,用户询问月球绕地球轨道时,Gemini会创建一个3D模型,并提供轨道速度滑块、路径线切换开关以及暂停按钮。

  • 谷歌发布Gemma 4大模型:31B登顶开源第三!手机可离线运行

    今天凌晨,谷歌DeepMind正式推出新一代开源大模型Gemma 4,该模型与谷歌闭源旗舰Gemini共享底层技术,也是时隔一年对Gemma 3的重大升级。 此次谷歌一改此前自有协议,采用Apache 2.0商业友好型许可证开源,开发者可无门槛自由修改、分发和商用。 一口气推出四款不同规格模型,覆盖从手机、边缘设备到工作站、服务器的全场景部署,在参数效率上表现亮眼,31B版本更是跻身Arena

  • 京东开源图像模型JoyAI-Image-Edit:达到世界一流水平

    京东探索研究院近日开源了自研的JoyAI-Image-Edit图像模型,其核心突破在于能理解图像的三维空间结构,解决了传统AI修图空间逻辑混乱的问题。该模型具备三大空间编辑能力:视角变换、空间漫游和物体空间关系操控,并兼容15类通用编辑功能。应用场景广泛,尤其在具身智能领域,可为机器人理解世界提供关键底层能力。京东近期在AI领域动作频频,持续推动AI与产业深度融合。

  • 阿里发布Wan2.7-Video视频生成模型!从演迈向导 聚焦创作全链路

    阿里巴巴今日正式发布Wan2.7-Video视频生成系列模型,涵盖文生视频、图生视频、参考生视频和视频编辑四大模型。 新模型拥有全面的创作控制力,将AI的能力从单一素材生成扩至创作全链路,从演”迈向导”。

  • OpenAI女神官宣离职了!曾被誉为GPT-4o之母

    那个给GPT-4o注入灵魂的人,走了。 近日,被业内誉为GPT-4o之母”的OpenAI高管Joanne Jang在X平台正式发文,宣布结束其在公司长达4年半的职业生涯。 作为赋予ChatGPT灵魂的关键人物,她的离去无疑为这家AI巨头的IPO之路蒙上了一层阴影。 据悉,Joanne Jang斯坦福大学应用数学与计算机科学双学士学位,计算机科学硕士学位。 她加入OpenAI时,该公司还只是一个不到200人的研究实验室

  • AI日报:谷歌发布Veo3.1Lite;ClawHub 推出官方中国镜像站;阿里Wan2.7-Image发布

    本期AI日报聚焦多领域进展:谷歌发布Veo 3.1 Lite视频生成模型,成本降超50%;阿里推出Wan2.7-Image大模型,支持像素级“捏脸”与个性化创作;ClawHub上线中国镜像站,加速AI Agent开发;字节跳动启动Seed 2027校园招聘,培养大模型人才;高德开源机器人基座模型ABot-M0,推动具身智能发展;OpenAI适配苹果CarPlay,支持语音交互;Anthropic因疏忽致Claude Code源码泄露,引发安全关注。

  • OpenAI停止视频生成工具Sora 将内部进行重组

    OpenAI公司近日宣布了一个让不少用户感到意外的决定:在推出Sora独立应用程序仅仅六个月后,他们计划停止这项视频生成服务,目的是为了简化自家的AI产品线。 按照官方给出的说法,Sora的消费者端应用、开发者接口以及与ChatGPT相关的功能都将全面关闭。OpenAI团队在社交平台上发布了一封告别信,信中承诺会公布用户内容的保存方案以及具体的停运时间表。他们感谢了用户一

  • 聚焦AI+视听!itc保伦股份邀您相约2026北京InfoComm China展,共赴行业视听盛会

    北京InfoComm China 2026展会将于4月15日至17日在北京国家会议中心举行,标志着该品牌迎来二十周年里程碑。本届展会将汇聚全球400家参展企业,吸引超26,000名专业观众,集中展示AI技术应用、沉浸式体验、专业音视频与显示创新等前沿领域的最新成果。国内音视频系统解决方案服务商itc保伦股份将携六大场景展区及超15款明星产品亮相E3馆01展位,聚焦指挥中心、会议室等核心场景,呈现AI指挥调度、视频分析、智慧安防等一体化解决方案,并展示一系列行业前沿的音视频系统矩阵。展会还将提供详细的交通指南、周边酒店推荐及北京旅游攻略,方便参展观众规划行程。

  • 年轻人第一辆运动轿车!小鹏Mona M03累计交付突破25万台

    小鹏汽车官方今日宣布,小鹏MONA M03累计交付突破25万台,并且,平均每5位车主里,就有1位是00后。 M03作为小鹏入门级家轿,核心亮点在于智能辅助驾驶、动力续航、配置以及颜值层面,与同级车型相比都有领先优势。 最重要的是,2026款M03的售价区间仅为11.98-15.18万元,相较同级车型,价格优势极其鲜明。 据了解,2026款小鹏MONA M03为年度改款车型,整体延续现款车型的设计

  • 智谱发布GLM-5V-Turbo模型:编程告别纯文本 一张图片就能生成代码

    智谱AI于4月2日发布GLM-5V-Turbo多模态编程模型,专为视觉编程打造。该模型深度融合视觉与文本能力,能看懂设计稿、截图、网页界面并生成可运行代码,实现“看得懂画面、写得出代码”。其三大核心特性包括:原生多模态编程基座,支持图片、视频、设计稿等多模态输入;兼顾视觉与编程能力,在多模态编程、GUI+Agent等基准上表现领先;深度适配Claude Code与龙蜥场景,可实现环境规划与动作执行的完整闭环。实测显示,该模型在设计稿还原、视觉代码生成等任务中表现优异,在AndroidWorld、WebVoyager等GUI操控测试中同样突出,纯文本编程能力稳定。目前已落地图像即代码、龙蜥视觉赋能等典型场景。

今日大家都在搜的词: