StoryDiffusion：保持角色一致，可生成多图漫画和长视频

2024-05-06 10:46 · 稿源：站长之家

划重点:
🔮 Consistent self-attention 实现角色连贯图像生成
🎥 Motion predictor 实现长视频生成
🎨支持漫画生成、图像转视频、长短视频等多种内容生成功能

站长之家（ChinaZ.com）5月6日消息:南开大学 HVision 团队开发了 StoryDiffusion，一款能够创造神奇故事的工具。StoryDiffusion可以保持角色一致，生成多图漫画和长视频。

该工具通过实现 Consistent self-attention 和 Motion predictor，能够生成连贯的图像和视频。用户可以提供文本提示来生成角色连贯的图像序列，同时也能实现长视频生成，预测不同条件图像之间的运动，实现更大幅度的运动预测。

StoryDiffusion 的应用范围广泛，可用于漫画生成、图像转视频等多种场景。通过 Consistent self-attention 机制生成的图像，可以顺利过渡为视频，实现两阶段长视频生成方法。此外，结合两个部分，还能生成常长且高质量的 AIGC 视频。

用户可以通过提供一系列用户输入的条件图像，使用 Image-to-Video 模型生成视频。此外，用户可以通过 Jupyter notebook 或本地 adio demo 来生成漫画。目前，该项目发布了生成漫画部分的源码。

产品入口：https://top.aibase.com/tool/storydiffusion

试玩入口：https://huggingface.co/spaces/YupengZhou/StoryDiffusion

（举报）

相关推荐

关键词：

三星于 IFA 2025 推出 Vision AI 伴侣，开启 AI 驱动的显示新时代

三星电子在IFA2025展会上推出Vision+AI伴侣，通过生成式AI技术赋能电视与显示器产品。该技术整合升级版Bixby语音助手，实现自然对话交互，提供个性化内容推荐和场景化智能服务。Vision+AI伴侣突破传统电视功能边界，支持多设备智能联动，覆盖影视、艺术、美食等多领域内容交互。该方案将于2023年9月下旬通过软件更新在韩国、北美及部分欧洲市场首发，后续逐步推广至全球。

生成式AI Vision AI伴侣
阿联酋部长在京见证｜Klickl与Investopia开启全面战略合作

2025年9月19日，阿联酋数字金融平台Klickl与阿联酋政府支持的全球投资平台Investopia在北京签署全面战略合作协议。双方将在金融科技、数字金融基础设施、绿色能源投资、跨境支付与资本对接等重点领域展开深度合作，推动中阿经贸合作从政策沟通迈向实体产业协同。Klickl将于2026年起成为Investopia全球战略合作伙伴，共同打造区域经济联动与全球共建的新里程碑。

阿联酋数字金融中阿经贸合作数字经济
荐AI日报：腾讯发布混元3D 3.0模型；昆仑万维上线Agent Studio功能；阿里Qoder推出付费订阅服务

AI日报汇总最新行业动态：腾讯发布混元3D+3.0模型，建模精度提升3倍；昆仑万维Mureka上线音乐创作功能；阿里Qoder推出付费订阅服务；VEED Fabric 1.0实现图片转视频；OpenAI发布GPT-5-Codex革新编程；全国发布AI安全治理框架2.0；Mini-o3实现超长视觉推理；上海AI Lab推出多模态模型Lumina-DiMOO；腾讯微调技术提升图像美感300%；Meta推出轻量级MobileLLM-R1；腾讯启动AI应用繁荣计划；谷歌DeepMind�

AI日报腾讯混元3D 3D建模
不止于价格，DigitalOcean、AWS和Linode该选谁？

本文对比了DigitalOcean、AWS和Linode三大海外云服务商，从定位、成本、易用性、GPU性能及本土化支持等维度分析其优劣势。DigitalOcean以开发者友好、简单易用和高性价比著称，适合初创企业和中小团队；AWS功能全面但复杂昂贵，适合大型企业；Linode性能稳定但生态有限。特别强调DigitalOcean通过卓普云提供本土化支持，解决支付、备案和技术响应等痛点，是中国企业出海的高效选择。

云服务商选择中国企业出海 AWS对比
曝苹果Vision Air头显2027年登场：售价腰斩重量更轻

知名苹果分析师郭明錤透露，苹果计划于2027年推出轻量版Vision Air，旨在解决当前Vision Pro产品过重、价格高昂的问题。预计Vision Air重量将大幅减少超40%，售价下降约50%。该产品将通过更轻巧外观设计和钛金属材质实现减重目标。苹果CEO库克对其寄予厚望，期待这款头戴设备在未来十年内替代iPhone，成为新一代空间计算时代的引领产品。

苹果 Vision Air
苹果官网Apple Store开始维护！iPhone 17系列今晚开启预购

苹果年度新品预售即将拉开帷幕。今晚8点，iPhone17、iPhone17Pro及iPhone17Pro Max三款机型将在苹果官网及授权渠道同步开启预购。目前，苹果官网Apple Store页面已进入维护状态，系统提示将于北京时间20:00准时开放订购，首批成功下单的用户预计最快可在9月19日（周五）清晨收到新机。

苹果新品预售 iPhone17预购苹果官网维护
Claude 用不了？蓝耘 Coding Agent 提供原生替代方案，更轻量、高性价比的替代选择

Anthropic宣布停止向中国资本控股企业提供Claude服务，蓝耘Coding Agent凭借强代码能力、灵活适配性及高性价比成为可靠替代选择。支持多模型切换、低迁移成本，提供可视化控制台和本地化服务，助力开发者无缝衔接开发流程，确保工作连续性。

文章搜索核心标签 Claude服务
基于华为云Token服务的稿定AI上线，一站式解决设计难题

在视觉时代，AI正重塑设计交付方式。9月19日，华为全联接大会期间，中国商业设计品牌“稿定设计”推出基于华为云Token服务的AI设计平台“稿定AI”，实现从创意激发到成品交付的一站式服务。该平台具备灵感采集、创意激发、视觉精修等能力，通过分层内容生成和无限画布功能，让设计更高效可控。依托华为云算力支持，稿定AI大幅提升多模态大模型生成速度，文生图提速2倍，文生视频/图生视频提速3.5倍。目前平台已服务超1亿用户，赋能中小企业零门槛搞定营销设计。

AI设计平台视觉营销创意激发
荐AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃发布语音大模型Step-Audio 2 mini

AI日报栏目每日更新AI领域热点内容，聚焦开发者需求。本期重点包括：阶跃星辰发布端到端语音大模型Step-Audio2 mini，在多项基准测试中表现优异；9月1日起AI生成内容需强制标识；美团推出开源大模型LongCat；上海AI实验室发布多模态大模型InternVL3.5；腾讯ARC团队推出音频生成模型AudioStory；OpenAI发布实时语音模型GPT-realtime；Meta与UCSD合作推出DeepConf技术；xAI代码库遭窃事件；阿里巴巴Qwen团队发布GUI自动化框架；微软推出Copilot Labs实验中心；小红书自动化工具xiaohongshu-mcp上线。

AI 语音大模型 Step-Audio2mini
腾讯云TencentOS Server AI发布，为千行百业打造安全可靠的国产化数字底座

腾讯云在2025全球数字生态大会上推出国内独家“OS+AI”解决方案TencentOS Server AI，旨在打造安全可靠的企业级服务器Linux操作系统。该系统通过AI技术优化算力调度与资源管理，显著提升大语言模型推理性能，在智能客服场景中吞吐性能提升超100%。同时支持GPU虚拟化与资源隔离，已帮助客户节约60%硬件成本。目前已在金融、政务等行业规模化应用，成为国产操作系统标杆。

OS+AI TencentOS Server

今日大家都在搜的词：

热文

3 天
7天

StoryDiffusion：保持角色一致，可生成多图漫画和长视频

三星于 IFA 2025 推出 Vision AI 伴侣，开启 AI 驱动的显示新时代

阿联酋部长在京见证｜Klickl与Investopia开启全面战略合作

荐AI日报：腾讯发布混元3D 3.0模型；昆仑万维上线Agent Studio功能；阿里Qoder推出付费订阅服务

不止于价格，DigitalOcean、AWS和Linode该选谁？

曝苹果Vision Air头显2027年登场：售价腰斩重量更轻

苹果官网Apple Store开始维护！iPhone 17系列今晚开启预购

Claude 用不了？蓝耘 Coding Agent 提供原生替代方案，更轻量、高性价比的替代选择

基于华为云Token服务的稿定AI上线，一站式解决设计难题

荐AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃发布语音大模型Step-Audio 2 mini

腾讯云TencentOS Server AI发布，为千行百业打造安全可靠的国产化数字底座

今日大家都在搜的词：

热文

AI日报：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去

小米召回116887辆SU7电动汽车：将OTA升级消除安全隐患

雷军回应小米召回11.7万辆SU7：将为用户带来更多期待功能

AI日报：小米开源首个原生端到端语音大模型；通义万相Wan2.2-A

iPhone17 Pro Max续航实测夺冠 iPhone Air表现不俗

AI日报：阿里云开源通义DeepResearch；夸克推医师考试大模型；

小米发布REDMI 15R 5G手机：售价1099元起搭载6000mAh电池

苹果 iPhone 17/Pro 系列今日发售多维度升级

卢伟冰：9月19日将直播在线解答小米17系列17个问题

京东：iPhone 17开卖4小时全国超3万人签收

站长商机