11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
GPT-4o,被击败了?最近大伙都被GPT-4o生成的各种“整活”图像刷屏了吧,各种动漫油画风格改图、经典影视复现、漫画设计改图……新的玩法每天都在涌现,大有“AI一日,人间一年”之势。甚至OpenAICEOSamAltman都累了:“收手吧,我们需要休息!”但就在GPT-4o火遍全球之际,一个来自初创团队的新模型ReveImage,却凭借其在特定图像生成领域的出色表现,悄然赢得了用户和专业榜单的
今天凌晨2点,OpenAI进行了技术直播,对GPT-4o和Sora进行了重大更新,提供了全新文生图模型。除了文生图之外,该模型还支持自定义操作、连续发问、风格转换、图像PPT等超实用功能,例如,更改图片的宽高比、图像物体中的角度,用十六进制代码指定精确颜色等。面向企业版、教育版和API即将到来。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱发布首个能生成汉字的开源文生图模型CogView42025年3月4日,北京智谱华章科技有限公司推出了CogView4,这是首个支持生成汉字的开源文生图模型,具备强大的双语输入和图像生成能力。他强调了完善人工智能终端标准体系的重要性,呼吁制定以用户体验为导向的智能化分级标准,并强化国际国内标准的有效衔接。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、震撼登场!英伟达开源图像生成模型Sana,1秒生图、支持中英文和emoji英伟达近日开源了图像生成模型Sana,凭借仅0.6亿个参数和高达4096×4096分辨率的生成能力,极大降低了使用门槛
著名大模型开源平台StabilityAI,开源了超强文生图模型——StableDiffusion3.5。StableDiffusion3.5一共有Large、LargeTurbo和Medium三个版本,可根据不同的商业环境提供高度定制功能,同时对这些模型进行了大幅度优化可在消费级GPU就能轻松推理运行。StableDiffusion3.5在可定制性、高效的性能以及多样化的输出方面表现出色,使其成为市场上最可定制和最易访问的文生图像模型之一,同时在提
打造更强大文生图模型新思路有——面对Flux、stablediffusion、Omost等爆火模型,有人开始主打“集各家所长”。清北、牛津、普林斯顿等机构的研究者提出了⼀个全新文生图框架IterComp。更多细节欢迎查阅原论文。
比美国SB-1047更疯狂的法案来了——AB-3211。AB-3211是美国加州在今年2月16日制定的一项专门针对文生图模型的法案,经过6次修订最近以62:0投票在州参议院通过。但对于那些没有资金、资源的开源开发者来说,已经无法像以前一样把项目直接扔在Github上就行了,需要一直改到符合技术标准为止,不然就无法分享你的项目。
【新智元导读】近日,来自加州大学尔湾分校等机构的研究人员,利用延迟掩蔽、MoE、分层扩展等策略,将扩散模型的训练成本降到了1890美元。训练一个扩散模型要多少钱?之前最便宜的方法用了28400美元像StableDiffusion这样的模型还要再贵一个数量级。由上表结果可知发现,在所有三个性能指标上,分层缩放方法都优于基线的恒定宽度方法,这表明分层缩放方法更适合DiT的掩蔽�
昨天Midjourney刚进行大更新,今天文生图片开源领域就杀出了一匹大黑马—FLUX.1。根据其测试数据显示,性能大幅度超过了DALL·E-3、MidjourneyV6闭源模型,开源SD3系列的Ultra、Medium、Turbo和SDXL被全线秒杀。FLUX.1生成的图片质量、细节和光影效果还行吧,期待一下他的文生视频模型。
PixArt-sigma由华为诺亚方舟实验室联合多个研究机构共同开发的项目,是一个强大的文本到图像生成模型,通过弥散Transformer进行弱到强训练,旨在实现4K分辨率的图像生成。PixArt-sigma采用了弥散Transformer进行弱到强训练,从能够更好地生成高质量的4K分辨率图像。在应用方面,PixArt-Σ是一款强大的文本到图像生成工具,具有广泛的应用场景,可以满足艺术、设计、游戏开发、营销