英伟达推新AI图像生成器Perfusion ：大小仅100KB、训练只需4分钟

2023-08-02 15:12 · 稿源：站长之家

站长之家（ChinaZ.com）8月2日消息:在人工智能艺术创作工具快速发展的背景下，Nvidia 研究人员推出了一种创新的文本到图像个性化方法，称为Perfusion。

与大AI图片生成模型不同的是，Perfusion 只有100KB大小，训练时间短，只需要4分钟。

Nvidia 和以色列特拉维夫大学共同撰写的一篇研究论文中介绍了所用的技术。尽管体积很小，但在特定版本的效率方面，它能够胜过Stability AI 的 Stable Diffusion v1.5、新发布的 Stable Diffusion XL （SDXL）和 MidJourney 等领先的 AI 艺术生成器。

Perfusion 通过一种名为 “Key-Locking” 的新方法，在图像生成过程中将用户想要添加的新概念与更一般的类别联系起来，从而避免过度拟合。这样可以灵活地表达个性化的概念，同时保持其核心特征。与其他 AI 图像生成器相比，Perfusion 具有更高的视觉质量和与文本的对齐性。

此外，Perfusion 还可以将多个个性化概念结合在一张图像中，并允许用户在推理过程中通过调整一个100KB 的模型来控制视觉保真度和文本对齐性之间的平衡。与其他调整输出的方法相比，Perfusion 的体积更小，效果更好。

此研究与 Nvidia 在人工智能领域的发展方向相一致，该公司的股票在2023年大涨230%，其 GPU 在训练 AI 模型方面占据主导地位。

据分析，Perfusion 模型的创新性可能会使 Nvidia 在生成式人工智能领域获得优势。不过，Nvidia 目前只公布了研究论文，并承诺很快发布代码。

Perfusion 研究网址:

https://research.nvidia.com/labs/par/Perfusion/

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
微软加强Bing AI图像生成内容限制以规避恐怖主义等内容

微软Bing搜索平台集成了基于DALL-E3的图片生成式AI功能，让用户可以通过文字提示来生成图像。但是这项新功能很快就在用户的“测试”中出现了问题，他们尝试输入一些敏感词语，AI结果生成了涉及恐怖主义和侵犯知识产权的图像。尽管仍不完美，但微软此举显示出了一定程度约束自己技术的意图。

Bing AI图像生成图片生成
Pika Labs AI视频生成器现在可以嵌入文字和图像了

PikaLabs在Discord上部署的AI视频生成器增加了两项新功能。第一项名为“视频字母化”，可以将不同样式的字母和文字嵌入到短视频中。PikaLabs正不断丰富其AI视频生成器的功能，为用户提供更多定制化选择。

Pika AI头条
Getty推出人工智能图像生成器

在对人工智能进行了一年多的训练后，图片库盖蒂图片社将允许用户通过其网站使用人工智能生成图像。该公司承诺用户不必担心版权纠纷，因为其人工智能仅接受盖蒂自有图片进行训练。用于训练的图片数据以及人工智能生成的图片输出应该具有透明度。
OpenAI推出新版人工智能图像生成器DALL-E 3

当地时间周三，OpenAI推出了新版人工智能图像生成器DALL-E3。DALL-E3是一个文本转图像生成器，可根据书面提示生成图像。DALL-E3使OpenAI与Ideogram展开了直接竞争，Ideogram也使用自己的专有AI模型提供图像生成服务。
Getty Images 推出人工智能图像生成器

图片供应GettyImages最近宣布推出一款基于生成式AI的图像创建工具GettyImagesGenerativeAI。该工具能根据文本描述生成图像，用户可以获得标准的免版税许可。在人工智能可能对创作环境带来深远影响的今天，GettyImages在发展新技术和保护创作者权益之间找到平衡，其解决方案值得关注。
T2I扩散模型PIXART-α：图像生成质量媲美Stable Diffusion

文本到图像生成模型如DALLE2、Imagen和StableDiffusion的发展，开启了逼真图像合成的新时代。这不仅对图片编辑、视频制作、3D素材创建等领域产生了深远影响为研究社区和企业提供了许多下游应用的机会。控制功能:PIXART-α还提供了控制功能，允许用户生成定制图像，精确修改物体颜色等，以满足特定需求。

PIXART-α 扩散模型 AI头条
微软必应聊天Bing Chat将引入Open AI图像生成工具 DALL-E3

微软宣布BingChat将引入OpenAI图像生成工具DALL-E3，并面向“一小部分用户”进行推出。DALL-E3的集成采用了ChatGPT技术，与DALL-E2不同，新的DALL-E3在处理图像内的文本方面表现更出色。如果你不想支付ChatGPTPlus的费用，你可以使用BingChat的DALL-E3图像生成器，它提供了同样的功能，并且是免费的。
AI新模型KOSMOS-G：实现零样本高保真图像生成

图像生成技术取得了显著的进展，尤其是在从文本描述生成图像以及将文本和图像结合生成新图像方面。一个尚未充分探索的领域是从广义视觉语言输入生成图像，例如从描述涉及多个对象和人物的场景生成图像。KOSMOS-G是将图像生成塑造成一种语言的初步步骤。

KOSMOS-G AI模型 AI头条
SyncDreamer:从单视图图像生成多视图一致图像以实现3D重建

3D生成领域经历了迅猛的进展，其中一个备受瞩目、在GitHubRepo上广受欢迎的项目备受关注。这个项目被认为是最为稳定和通用的，用户只需提供一张图像，模型就能自动合成多个视图并生成相应的3D模型。SyncDreamer生成的图像可以用于高质量的3D重建。

SyncDreamer
Omdia：英伟达二季度出货900吨H100 AI GPU 相当于约30万块

市场研究公司Omdia披露，2023年第二季度，英伟达出货了900吨H100AIGPU。Omdia认为，一个带有散热器的H100GPU的平均重量超过3公斤，因此英伟达在第二季度出货了30多万块H100。Omida的最新报告显示，该公司有望达到这一里程碑。

今日大家都在搜的词：

热文

3 天
7天

英伟达推新AI图像生成器Perfusion ：大小仅100KB、训练只需4分钟

今日大家都在搜的词：

热文

站长商机