首页 > 业界 > 关键词  > 图像生成最新资讯  > 正文

北大字节开辟图像生成新范式,超越Sora核心组件DiT,不再预测下一个token

2024-04-16 08:45 · 稿源: 量子位公众号

北大和字节联手搞了个大的:提出图像生成新范式,从预测下一个token变成预测下一级分辨率,效果超越Sora核心组件Diffusion Transformer(DiT)。并且代码开源,短短几天已经揽下1.3k标星,登上GitHub趋势榜。具体是个什么效果?实验数据上,这个名为VAR(Visual Autoregressive Mod

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 大厂抢滩的小游戏,不止需要“下一个爆款”

    曾为打发碎片休闲时间而生的小游戏,正爆发出越来越强的生命力。 从21世纪初功能机时代萌芽,到智能机普及后的快速发展和变革,手机游戏早已随着互联网的发展在我国拥有了广阔的市场规模。而随着行业的持续深化,曾风光无限的app游戏开始面临流量红利见顶、同质化严重等挑战。 在此背景下,没有独立APP,依托于内容平台的小游戏,以即点即玩、不用下载、易上手�

  • AI日报:阿里通义推Qwen-TTS模型;Cursor已支持网页和手机端;字节发布图像合成技术XVerse

    【AI日报】今日AI领域7大突破:1)阿里通义Qwen-TTS实现方言语音合成重大突破;2)Cursor发布Web版AI编程工具;3)字节XVerse技术实现多对象精准图像生成;4)NoteGen跨平台AI笔记工具革新知识管理;5)ManimML动画库可视化Transformer架构;6)TEN+Agent开源语音交互技术降低延迟;7)Chai-2抗体设计模型将药物研发周期缩短至两周。淘宝同时上线RecGPT推荐模型提升购物体验。

  • A日报:B站升级动漫视频生成模型AniSora V3;字节开源4D视频生成框架EX-4D;DeepSWE开源AI Agent系统强势登顶

    AI日报栏目汇总了近期AI领域的重要进展:1)字节跳动开源EX-4D框架,可将单目视频转换为多视角4D视频;2)B站开源动漫视频生成模型AniSora V3,支持多种风格;3)DeepSWE+开源基于Qwen3-32B的AI Agent系统;4)字节开源3亿参数图像编辑模型VINCIE-3B;5)Stability AI推出移动端音频生成模型Stable Audio Open Small;6)谷歌发布免费教育AI工具套件Gemini for Education;7)Topview推出革命性AI数字人带货技术Avatar

  • 100%签约!优刻得加码乌兰察布“Token之都”建设

    6月初,优刻得在乌兰察布智算中心B栋约2300个机柜正式启动交付,目前所有客户已完成签约,机柜资源被全面抢订。B栋主要服务大型通信设备厂商,重点聚焦AI大模型训练推理场景,平均设计功率达12kW,满足大模型训练等高算力需求。依托当地充沛绿电、优惠电价等优势,乌兰察布正发展成为全国重要大数据产业聚集区。优刻得作为代表企业,在当地自建14万平方米智算中心,可容纳12000个机柜,持续为AI训练、智能驾驶等领域提供算力支持。乌兰察布正加快从"能源输出地"向"AI生产力输出地"转型,打造特色"Token之都"。优刻得将持续推进AI智算资源布局,助力当地产业升级。

  • 探索AI时代出海新范式!impact.com荣获TopDigital创新营销奖「年度营销技术公司」

    2025年7月1日,impact.com在第十三届TopDigital创新营销盛典上荣获"年度营销技术公司"大奖。该平台凭借技术能力、商业影响和全球化战略的综合表现获得认可,其AI技术正深刻改变品牌营销工作方式,尤其在效率提升与流程优化方面成效显著。impact.com通过智能推荐、智能审批等功能,将AI能力引入合作伙伴管理核心环节,帮助出海企业构建全球化合作网络。大中华区总裁Jennifer Zhang表示,AI不是替代营销人,而是释放其判断力与创造力。作为全球合作伙伴经济核心引擎,impact.com已服务众多中国出海品牌,未来将继续深化AI在营销管理平台的应用。

  • 字节跳动公布核心人才观 称用人看潜力不看资历

    昨日,字节跳动公布六大人才观。字节跳动表示,自创业之初便坚信人才是公司成功的关键要素,秉持“和优秀的人,做有挑战的事”的理念吸引众多人才加入。 公司认为,随着业务复杂度提升,保持优秀人才密度大于业务复杂度是组织有效运行的关键,更倾向于通过优秀人才的创新意愿和能力来应对挑战,而非单纯依赖增加规则和管理措施。 字节跳动鼓励人才在工作中大�

  • 科大讯飞最新发布!打造下一代智能交互新范式

    2025年6月12日,科大讯飞在深圳举办“交互领航 智启新章”发布会,重磅发布AIUI、机器人超脑等四大平台及十大场景方案,展示百款创新产品,推动AI从通用向垂直落地。讯飞生态已覆盖1152万开发者,全球化布局加速,开启智能交互新纪元。

  • LiblibAI 重磅发布「星流 Agent」:中文语义 + 图片视频3D全能生成,中国最强设计 Agent

    LiblibAI推出Lovart中文版"星流Agent",这是一款专为中国市场深度优化的AI设计工具。该产品在保留Lovart全球版"生成-编辑-排版-交付"全链路能力基础上,针对中文语义、国风审美和本土使用场景进行了全面重构。星流Agent支持从创意构思到设计交付的全流程自动化,可处理平面设计、视频生成和3D建模等跨模态创作,内置符合中国文化的视觉风格库。该产品的推出标�

  • 腾讯王炸新品今天开测,超2000万预约,专访黄凌冬:目标下一个长青

    今天,《无畏契约:源能行动》开启了第二次测试。在大众认知上,它还有另一个名字:「瓦手」。 作为《无畏契约》的手游产品,《瓦手》自出生起就获得了别人羡慕不来的声量。IP端游刚刚迎来全球5岁生日,国服则上线不到2年,它正处于数据猛增的壮年期,用户量庞大,诸如「瓦学弟」的游戏梗更是一度破圈。这让《瓦手》的预约量很快就突破了2000万,成为行业关注焦点�

  • AI时代的营销答卷:淘宝天下摘得TopDigital桂冠

    淘宝天下凭借AI技术在营销领域的创新实践,在第十三届TopDigital创新营销盛典上斩获两项大奖。其获奖案例《淘宝蛇年"一起上春晚"云参演证互动传播》通过AIGC技术生成个性化"云参演证",结合明星联动和裂变式传播策略,实现超45亿曝光量,累计生成1.18亿张参演证,重塑了传统春节文化互动模式。同时,与神州租车合作的小米SU7 Ultra上新营销案例,通过头部KOL传播和社交化内容裂变,达成2.36亿+曝光量,获"社会化营销"铜奖。淘宝天下已布局AI驱动的全链路营销解决方案"淘天智家平台",支持从创意生成到多媒介内容生产的全流程,持续推动数字营销创新。