首页 > 业界 > 关键词  > StoryDiffusion最新资讯  > 正文

StoryDiffusion:保持角色一致,可生成多图漫画和长视频

2024-05-06 10:46 · 稿源:站长之家

划重点:

🔮 Consistent self-attention 实现角色连贯图像生成

🎥 Motion predictor 实现长视频生成

🎨支持漫画生成、图像转视频、长短视频等多种内容生成功能

站长之家(ChinaZ.com)5月6日 消息:南开大学 HVision 团队开发了 StoryDiffusion,一款能够创造神奇故事的工具。StoryDiffusion可以保持角色一致,生成多图漫画和长视频。

image.png

该工具通过实现 Consistent self-attention 和 Motion predictor,能够生成连贯的图像和视频。用户可以提供文本提示来生成角色连贯的图像序列,同时也能实现长视频生成,预测不同条件图像之间的运动,实现更大幅度的运动预测。

StoryDiffusion 的应用范围广泛,可用于漫画生成、图像转视频等多种场景。通过 Consistent self-attention 机制生成的图像,可以顺利过渡为视频,实现两阶段长视频生成方法。此外,结合两个部分,还能生成常长且高质量的 AIGC 视频。

image.png

用户可以通过提供一系列用户输入的条件图像,使用 Image-to-Video 模型生成视频。此外,用户可以通过 Jupyter notebook 或本地 adio demo 来生成漫画。目前,该项目发布了生成漫画部分的源码。

产品入口:https://top.aibase.com/tool/storydiffusion

试玩入口:https://huggingface.co/spaces/YupengZhou/StoryDiffusion

举报

  • 相关推荐
  • 长视频做短剧,一场平台的南辕北辙?

    2月20日,影视行业迎来了2025年的“开年第一会”——首届中国电视剧制作产业大会。爱优腾芒等平台大佬纷纷出席,制作公司、导演编剧们也围绕过去两年影视行业的变革激烈讨论。做短剧只是长视频平台发展道路上的一个小分支,做好长视频本身的内容才是重中之重,否则注定是一场南辕北辙,下沉市场的用户没抓住,高价值用户也渐渐流失。

  • 微信终于解除限制!朋友圈可以发5分钟长视频

    日前,有网友发现,微信朋友圈现在支持发布5分钟的长视频了,可以直接从相册选择或拍摄长视频。经快科技实测,现在选择时长5分钟内的视频,可以直接在朋友圈发布,大于5分钟的需要裁剪至5分钟内才能发布。朋友圈上线初期仅支持发15秒短视频,2021年微信8.0.3版本发布时,微信将朋友圈视频时长由15秒延长至30秒。

  • 网易就情人节宣发用未成年角色道歉:文案由AI生成

    快科技2月17日消息,近日,网易超级会员2月13日情人节推送中,使用《燕云十六声》未成年女性角色红线,引发游戏玩家不满。游戏玩家表示,成年角色那么多,网易却用未成年小女孩当情人节宣发,应该给红线道歉。2月17日,网易超级会员发布道歉声明:文章内涉及《燕云十六声》NPC红线的内容部分,存在对游戏人设了解不足并错误使用游戏内NPC角色人设进行节点内容宣传的情况,内容文案由AI生成,与游戏实际内容无关,我们第一时间对该篇文章进行了下线处理。经核实,该篇内容涉及网易多款产品。其中,涉及《燕云十六声》的部分并未经过《燕云?

  • 苹果Vision Pro将引入Apple Intelligence:增加定制空间内容

    据报道,知名爆料人马克古尔曼透露,苹果公司的人工智能技术AppleIntelligence即将登陆其头戴式显示设备AppleVisionPro。AppleIntelligence作为苹果公司于去年6月推出的个人智能系统,通过一系列智能化的工具和应用,显著优化用户在日常生活及工作中的体验与效率。尤其值得注意的是,AppleVisionPro凭借其搭载的MacM2芯片和16GB内存,能够高效处理复杂的AI任务,为AppleIntelligence在VisionPro上的稳定运行提供了坚实的硬件支撑。

  • 网易就情人节宣发用未成年角色道歉:红线情人节文案由AI生成

    网易超级会员在2月13日情人节推送中,因使用《燕云十六声》游戏中的未成年女性角色红线作为宣传元素,引发了大量游戏玩家的强烈不满。玩家们纷纷表示,在众多成年角色可选的情况下,网易却选择未成年小女孩作为情人节宣发对象,这一做法显然欠妥,并要求网易向红线角色及其粉丝道歉。网易超级会员表示,将致力于为玩家提供更好的服务,以弥补此次事件带来的不良影响。

  • Fusion Fund宣布四期基金超募1.9亿美元,深化AI及前沿科技投资布局

    2025年3月12日消息,FusionFund宣布1.9亿美元的第四期基金募资,目前管理资金总规模超过5亿美元。FusionSuperFounderNetwork由多位成功退出的连续创业者组成,成为基金获取前沿创新项目的重要来源。在全球科技变革加速的背景下,,FusionFund将继续以前瞻视角深化AI基础设施、智能制造、边缘计算、太空科技等核心领域的布局,推动科技创新企业迈向更广阔的发展空间,构建一个能支撑未来数十年科技发展的长远投资平台,为全球科技变革注入新的活力。

  • 刘晓庆打假AI生成假冒视频:画面、声音像我 但不是我

    快科技3月3日消息,今日,有微博网友@刘晓庆反馈,称微信视频号有博主用AI生成视频假冒她。随后,刘晓庆转发并配文:天哪,我点进去看了一下,画面是我,声音很像我,但不是我!这是怎么做到的?大家以后不会搞不清楚哪个才是真的我了吧?我在各个平台都叫刘晓庆。”据了解,该网友反馈的假冒刘晓庆的微信视频号名为晓庆人生”,目前,该账号已无法在微信中搜索

  • AI日报:可生成汉字!智谱开源文生模型CogView4;大模型工具Ollama存在严重漏洞;腾讯元宝下载量超DeepSeek

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、智谱发布首个能生成汉字的开源文生图模型CogView42025年3月4日,北京智谱华章科技有限公司推出了CogView4,这是首个支持生成汉字的开源文生图模型,具备强大的双语输入和图像生成能力。他强调了完善人工智能终端标准体系的重要性,呼吁制定以用户体验为导向的智能化分级标准,并强化国际国内标准的有效衔接。

  • 微软发布创新大模型:一张片就能生成游戏,游戏界ChatGPT来了

    微软在官网发布了专用于游戏领域的创新大模型——Muse。虽然Muse基于Transformer架构,但创建游戏场景的方式却非常独特,并不依赖传统的文本提示是通过游戏画面和控制器操作的序列化数据作为输入提示,从生成连贯的游戏场景和玩法,同时更符合游戏机制和物理规则的游戏内容。Muse模型可以在微软的AzureAIFoundry上体验。

  • 微软CEO:Xbox将运用生成式AI开发一系列视频游戏

    据报道,近日,微软首席执行官萨蒂亚纳德拉透露,公司计划推出一系列利用最新生成式人工智能模型Muse”开发的视频游戏,这标志着AI技术在游戏领域的应用迈入新阶段。本周早些时候,微软发布了Muse,这是一款能够生成游戏视觉效果、控制器动作,或者两者兼有之”的生成式AI模型。这不仅将提高游戏的质量和体验将为玩家提供更多个性化的选择和互动方式。