首页 > 业界 > 关键词  > StableDiffusion最新资讯  > 正文

Stable Diffusion模型发布新版本:生成图像以假乱真

2023-06-24 17:28 · 稿源: 快科技

快科技6月24日消息,近日,Stability AI官方宣布,推出SDXL0.9版本更新,对Stable Diffusion进行了优化。

AI绘画 赛博朋克 元宇宙 女性 酷 (1)

与此前的SDXL Beta相比,新版本下的Stable Diffusion模型在图片的生成上有着更为明显的优势。

从官方提供的对比图片可以看出,新版本生成的图片在质感上更加逼真,一定程度上甚至可以做到以假乱真。

同时,新版本终于能够正确的理解人类的手”,从而正常生成五指,进一步提升了图片的真实性。

其他方面,Stability AI表示SDXL0.9版本配置要求和此前相同,需要16GB内存和NVIDIA RTX20系列及更高显卡(需8GB以上显存),支持Win10、Win11与Linux 发行版。

需要注意的是,Stability AI计划在今年7月推出SDCL的1.0版本,值得期待。

举报

  • 相关推荐
  • 苹果iOS 26新版本来了:任何人都能升级

    苹果爆料人Mark Gurman透露,苹果公开测试版系统预计将于7月23日前后发布。也就是说,iOS 26、iPadOS 26、macOS 26等系统的公开测试版在下周某个时间点推出。 具体来说,苹果将发布的公开测试版系统包括iOS 26、iPadOS 26、macOS 26、tvOS 26、watchOS 26、HomePod Software 26等等,根据苹果官网公布的信息,该公司不打算推出visionOS 26的公开测试版。 任何人都可以免费注册成为苹果测试版软件�

  • 一个月更新4次 鸿蒙版微信再推新版本:四大新功能

    鸿蒙版微信凭借高频次的更新优化,持续为用户带来惊喜。近一个月内,鸿蒙版微信已正式上架4个新版本。 如今,其又马不停蹄推出全新版本,带来四项实用新功能。 此次更新后,图库操作便利性大幅提升。用户如今可直接在图库中选中视频及多张图片,一键转发至微信。 消息管理也变得更加高效。多选消息功能上线后,用户能对多条消息进行批量选中,无论是清理无用�

  • AI日报:字节将发布AI编程工具TRAE2.0版本;Mistral重磅推出音频模型Voxtral;月之暗面回应Kimi K2 API速度慢

    AI日报栏目聚焦AI领域最新动态:1)字节跳动将发布TRAE 2.0编程工具,新增语音交互功能;2)Mistral推出开源音频模型Voxtral,支持多语言;3)月之暗面回应Kimi K2API速度慢问题,正在优化系统;4)昆仑万维发布AgentOrchestra框架,实现多智能体协作;5)OpenAI前CTO创立的Thinking Machines Lab获20亿美元融资;6)Kimi-2上线,性能超越GPT-4.1;7)TRAE推出Kimi-K2模型服务,国际版支持Grok-4;8)字节跳动Seed�

  • 苹果发布iOS 18.6开发者预览版Beta 3:国行AI遥遥无期

    今日,苹果向iPhone用户推送了iOS 18.6开发者预览版Beta 3。 开发者可在兼容设备上通过设置”应用,进入通用软件更新”下载该测试版。 目前尚未发现有可见更新内容,不过此前有消息称,iOS 18.6将会针对欧盟地区用户进行实用性更新。 苹果当前在欧盟地区的iOS版本虽然支持上述两种行为,但会插入一些警告屏幕,这引起了欧盟监管机构的关注,将会进行一些调整。 值得注意�

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • ZEGO AI Agent:支持一张图生成数字人

    即构科技推出AI Agent2.4,用户只需上传一张正面照即可生成1080P高清数字人,支持实时互动对话。该技术具备400ms超低延迟、2秒内完成自然交互响应,唇形同步准确,支持文本/音频/语音流驱动。适用于教育、客服等场景,提供API灵活定制,实现低成本批量生成。核心技术融合照片驱动与实时AI交互引擎,在生成效率、拟真度方面显著提升,带来低门槛、高沉浸的数字人互动体验。

  • AI日报:美图发布影像AI Agent RoboNeo;1.8bit量化Kimi K2模型上线;亚马逊推AI代码编辑器 Kiro

    【AI日报】今日AI领域重要动态:1)美图推出RoboNeo,通过自然语言指令实现图片精修、品牌设计等全能影像处理;2)Unsloth AI将Kimi K2模型量化至1.8bit,体积缩减78%保持性能;3)谷歌Gemini嵌入模型登顶MTEB榜单,超越OpenAI;4)亚马逊发布免费AI代码编辑器Kiro,集成Claude模型;5)Claude新增应用工具目录功能提升工作效率;6)MiniMax完成近3亿美元融资,估值超40亿美元;7)UTCP新协议让AI代理直

  • AI日报:阿里通义开源音频生成模型ThinkSound;谷歌Veo3支态图片生成视频;昆仑万维发布 Skywork-R1V 3.0

    【AI日报】今日AI领域重要动态:1)阿里开源支持链式推理的音频生成模型ThinkSound,实现高保真空间音频生成;2)谷歌Veo3升级,支持静态图片生成生动视频;3)Hugging Face发布30亿参数小模型SmolLM3,性能优于Llama-3.2-3B;4)阿里开源网络智能体WebSailor,展现强大推理和检索能力;5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5;6)Vidu Q1支持最多七张参考图像生成一致性视频;7)苹果�

  • iOS 26 Beta 3发布 苹果又砍一刀!液态玻璃再被削弱

    今日,苹果发布iOS26第3个开发者预览版,液态玻璃设计再被削弱,玻璃感的通透高级氛围没了。 许多升级iOS26Beta3的用户反馈称液态玻璃质感削弱、类似毛玻璃和液态玻璃的中间值,液态玻璃0.5的感觉。 数码博主i冰宇宙”也表示,iOS26Beta3的液态玻璃基本上砍没了,现在基本上就是磨砂玻璃。

  • AI 图像神器 Luminar Neo 中国官网上线!正版授权价仅 399 元起

    AI图像编辑软件Luminar Neo正式登陆中国市场,由思杰马克丁作为官方授权经销商。该软件整合前沿AI技术,提供六大核心功能:智能换天、人像精修、智能结构优化、无损图层编辑、硬件加速和动态创意模板,显著提升专业摄影师和设计师的工作效率。中国用户现可通过官网以399元优惠价购买正版授权,比国际官网价格直降384元。软件提供完整本地化支持,包括中文指南和视频教程,并承诺持续更新和技术支持服务。Luminar Neo特别适合需要高效处理视觉内容的专业人士,将复杂编辑流程简化为几分钟操作,释放创意潜能。