首页 > 业界 > 关键词  > 自回归文生图最新资讯  > 正文

刚拿下NeurIPS论文,字节就开源VAR文生图版本,拿下SOTA击败扩散模型

2025-01-03 16:18 · 稿源:量子位公众号

自回归文生图,迎来新王者——新开源模型Infinity,字节商业化技术团队出品,超越Diffusion Model。值得一提的是,这其实是从前段时间斩获NeurIPS最佳论文VAR衍生而来的文生图版本。在预测下一级分辨率的基础上,Infinity用更加细粒度的bitwise tokenizer建模图像空间。同时他们将

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 刚刚,OpenAI发布新文生图模型,免费、逼真到难以分辨

    今天凌晨2点,OpenAI进行了技术直播,对GPT-4o和Sora进行了重大更新,提供了全新文生图模型。除了文生图之外,该模型还支持自定义操作、连续发问、风格转换、图像PPT等超实用功能,例如,更改图片的宽高比、图像物体中的角度,用十六进制代码指定精确颜色等。面向企业版、教育版和API即将到来。

  • 挑战GPT-4o!AI文生图惊现黑马,国产团队HiDream如何逆袭?

    HiDream是一款由国内团队开发的AI模型,擅长生成复杂的图片与多种风格的艺术作品。它在多个测试中表现出对细节、材质、光影控制以及创意概念的良好理解,尤其在人物动态、精细绘画等方面效果显著。HiDream支持输出4K高清图片,并兼容多种应用领域,包括商业用途。尽管在某些特定要求下还需提升表现,但其潜力和实际效果已受到关注。

  • 比GPT-4o更强?三位Adobe老将出走,做出了超强文生图模型丨AI新榜评测

    GPT-4o,被击败了?最近大伙都被GPT-4o生成的各种“整活”图像刷屏了吧,各种动漫油画风格改图、经典影视复现、漫画设计改图……新的玩法每天都在涌现,大有“AI一日,人间一年”之势。甚至OpenAICEOSamAltman都累了:“收手吧,我们需要休息!”但就在GPT-4o火遍全球之际,一个来自初创团队的新模型ReveImage,却凭借其在特定图像生成领域的出色表现,悄然赢得了用户和专业榜单的

  • GPT-4o像生成功能上线今起免费用,我们和国内文生图PK了一下

    OpenAI创始人兼CEO萨姆�阿尔特曼直播发布了GPT-4o图像生成功能,作为多模态模型的GPT-4o补齐了图片生成这一重要拼图。GPT-4o图像生成可以遵循指令生成更准确的图像,OpenAI还为其挂载了固有知识库,可以根据知识库或上下文帮用户生成、编辑图像。文心一言生成的4张图片之一豆包生成的4张图片之一目前看来是有些差距。

  • 刚刚,OpenAI发布GPT-image-1模型,更强吉卜力版本来啦

    OpenAI发布全新图像生成模型GPT-image-1,通过API向全球开发者开放。该模型支持精细控制图像敏感度、生成效率、背景、输出格式等参数,并集成吉卜力模式。Adobe、Figma等企业已将其应用于产品中。API支持批量生成、蒙版编辑、透明度调整等高级功能,图像生成成本从0.02-0.19美元/张不等。CEO Sam Altman表示该模型与ChatGPT版本差异显著,开发者可通过API实现更多创意场景。新模型在�

  • 阿里开源通义新模型:指定首尾片生成视频

    快科技4月18日消息,据报道,阿里巴巴旗下通义万相宣布开源其创新视频生成技术首尾帧生视频14B模型。这项突破性AI技术能够根据用户提供的起始和结束画面,智能生成720p高清过渡视频,为视频创作带来全新可能。该模型通过先进的深度学习算法,能够精准理解输入画面的内容、风格及主题特征。当用户提供首尾两帧图像后,模型会智能分析画面中的视觉元素,包括物体形�

  • 字节发布豆包1.5深度思考模型:“实拍级”像生成

    快科技4月17日消息,据报道,今日,在火山引擎AI创新巡展杭州站的现场,字节跳动旗下火山引擎总裁谭待正式发布了备受瞩目的豆包1.5深度思考模型。谭待指出,豆包1.5深度思考模型在多个关键领域展现出卓越性能。在数学、编程、科学推理这类专业领域中,它能够精准高效地处理复杂问题;在创意写作等通用任务方面,同样表现出色。该模型采用MoE架构,总参数为200B,激�

  • 檀健次《滤镜》口碑出圈!不被定义的他,凭何拿下“作品+商业”双王牌?

    终究还是吹到了电视剧。孙悟空、羊驼、拖把、铜人……你敢信,这些竟然是一部现偶剧里的女主?近期热播的电视剧《滤镜》,凭借新颖的题材和超“癫”的剧情,在一众偶像剧中杀出重围。随着檀健次演艺事业的不断发展和商业价值的持续突显,也相信檀健次能继续保持对表演的热爱与专注,凭借自身实力,在影视与商业领域续写更多精彩,为观众和市场带来更多惊喜,为�

  • 苦等一年 Meta终于放大招 正式发布开源大模型Llama 4

    美国科技巨擘Meta重磅推出其迄今最为强大的开源AI模型Llama4,恰逢Llama3上市一周年之际。Llama4系列采用了先进的混合专家架构,这一架构在模型训练及用户查询回答过程中展现出更高效率,通过将模型划分为多个专注于特定任务的专家”子模型,实现精准高效的处理。Meta首席执行官扎克伯格表示:他们的目标是建立世界领先的人工智能,将其开源,并使其普遍可用,以便世界上每个人都能受益。

  • Neuron Studio 一站式开发工具,联发科重构AI应用开发全流程

    AI技术的飞速发展为用户体验带来了无限可能。整个应用生态正在经历从硬件、软件到产业链的深刻变革。在AI从“技术爆发期”迈入“体验普及期”的关键阶段,联发科通过芯片、工具和生态的协同作用,推动智能体化用户体验的真正落地,加速AI体验的普及,让人与智能终端的交互进入全新的阶段。