B站团队推出AniSora开源动漫视频生成模型，一键打造多种风格动画！

2025-05-19 08:57 · 来源： AIbase基地

近日，B 站（哔哩哔哩）团队在5月12日正式开源了一款名为 AniSora 的动漫视频生成模型。这个新工具使用户能够一键创建多种动漫风格的视频片段，涵盖系列剧集、中国原创动画、漫画改编、VTuber 内容、动漫宣传片以及鬼畜动画等类型，丰富了动漫创作的可能性。

B 站团队指出，虽然目前市面上已经有 Sora、Kling、CogVideoX 等多款自然视频生成模型，但在动漫视频领域，现有技术仍显不足。动漫以其独特的艺术风格、夸张的动作和对现实物理规律的突破，给视频生成带来了不小的挑战。因此，AniSora 的推出，将填补这一领域的空白。

AniSora 项目包含了一整套的系统，主要由以下几个部分构成:首先是数据处理流水线，该模型训练使用了超过1000万条高质量的数据;其次，AniSora 引入了可控生成模型，加入了时空掩码模块，支持多项关键动画制作功能，比如图像生成视频、帧插值和局部图像引导等;最后，团队还收集了948段多样化的动画视频，建立了评测数据集，经过双盲实验及 VBench 测试后，得出人物一致性与运动一致性均达到了当前的最高标准（SOTA）。

为了让公众更好地理解 AniSora 的强大功能，B 站还分享了一系列生成视频的示例。比如，在一段视频中，一个角色坐在一辆行驶的汽车上，随风而动的头发展现出自然的动态;另一段中，两位身穿红色婚服的人物手持红绳缓缓走向远方;而在第三段中，金发角色伸手轻触跪着的人物，展现出细腻的情感表达。

AniSora 的开源地址已在 GitHub 和其他平台发布，感兴趣的开发者和动画爱好者们可以前往查看和使用。随着这一技术的推出，未来我们或许能在创作和观看动漫内容时，体验到更多创新与惊喜。

相关推荐

荐AI日报：QQ浏览器升级为AI浏览器；OpenAI全新编程智能体Codex；B站团队推动漫视频生成模型AniSora

本文介绍了AI领域多项最新进展：1)B站团队推出开源动漫视频生成模型AniSora，支持多种风格创作；2)OpenAI发布编程智能体Codex，提升开发效率；3)Google测试AI问答功能AI Mode；4)ChatGPT将整合MCP协议，支持第三方AI服务对接；5)阿里推出ZeroSearch框架，减少对搜索引擎的依赖；6)Stability AI与Arm合作推出手机端音频生成AI；7)Qwen发布WorldPM系列大模型；8)GPT-5将整合多款产品功能；9)ListenHub上线AI播客生成工具；10)QQ浏览器升级为AI浏览器；11)数学建模AI助手MathModelAgent面世；12)GenSpark推出全球首个智能下载代理；13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

AI日报动漫视频生成 AniSora
豆包视频生成模型Seedance 1.0 lite发布：“迅速生成影视级的视频”

火山引擎在FORCE LINK AI创新巡展上发布多款AI模型升级产品：1）Seedance 1.0 lite视频生成模型，支持5-10秒480P/720P视频生成，具备影视级画质和生成速度优势，适用于电商广告、影视创作等场景；2）豆包1.5视觉深度思考模型，仅20B参数但具备多模态理解能力，在60项基准测试中38项达SOTA水平；3）升级版豆包音乐模型，新增英文歌曲创作功能，并能根据视频内容自动适配BGM。目前这些模型已在火山方舟平台和豆包APP上线。

AI模型升级视频生成技术火山引擎发布
对标Sora！谷歌发布AI视频生成器Veo 3：可同时生成视频和音效

谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3，对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频，还能为人物对话、鸟鸣等场景自动匹配音效，实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户，月费249.99美元，并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是，谷歌在AI图像生成领域并非一帆风顺，此前Imagen 3曾因生成含历史错误的图像引发争议。

谷歌视频生成模型 Veo
持续霸榜！可灵2.0模型登顶全球视频生成大模型榜单

快手旗下可灵AI 2.0模型在权威AI评测中表现优异，以1124分超越自研1.6版本，连续三个月蝉联全球图生视频领域冠军。4月15日发布的2.0大师版在视频质量、语义理解和画面美学等核心指标持续领先行业。数据显示，自2023年6月上线以来，可灵AI全球用户突破2200万，月活激增25倍，累计生成视频1.68亿个、图片3.44亿张。商业化方面，其单月流水已超千万元，并与伊利、vivo等头部品牌达成深度合作，展现出AI视频生成技术的广阔商业前景。
腾讯混元视频生成工具全新开源：人物不会“变脸” 物体不会“漂移”

腾讯混元5月9日宣布推出开源的多模态定制化视频生成工具HunyuanCustom。该工具基于混元视频生成大模型打造，支持文本、图像、音频等多模态输入，能生成高质量定制视频。主要功能包括：单/多主体视频生成、视频配音、局部编辑等，在保持主体一致性的同时可灵活调整场景和动作。适用于广告、电商、影视等场景，如快速更换商品背景、制作数字人视频等。目前单主体生成功能已开源，其他功能将于5月陆续开放。用户只需上传图片和文字描述即可生成连贯自然的视频内容。

多模态视频生成腾讯混元 HunyuanCustom
荐AI日报：扣子空间开放测试；腾讯混元开源视频生成工具HunyuanCustom；阿里开源大模型搜索引擎ZeroSearch

本文汇总了近期AI领域多项重要进展：1)扣子空间开放测试，无需邀请码即可体验AI协作平台；2)腾讯推出HunyuanCustom视频生成工具，实现音视频同步编辑；3)阿里巴巴ZeroSearch技术降低AI训练成本88%；4)OpenAI新增GitHub连接器，强化代码分析功能；5)联想发布天禧个人超级智能体，具备感知交互能力；6)OpenAI在亚洲推出数据驻留计划；7)Multiverse发布全球首款AI生成多人游戏；8)秘塔AI上线"讲题"功能辅助家长辅导；9)Genspark推出智能电子表格工具AI Sheets；10)Google Gemini API新增缓存功能可节省75%成本；11)PixVerse v4视频生成速度质量双提升；12)快手推出内容净化器KuaiMod；13)英伟达开源新一代OCR代码推理模型。这些创新覆盖AI应用、开发工具、成本优化等多个维度，展现了AI技术的快速发展和广泛应用。

AI产品人工智能技术趋势
荐AI日报：GPT-4.1正式上线ChatGPT；阿里通义万相Wan2.1-VACE开源；可灵大模型视频生成量约占30%份额

本文报道了AI领域最新动态：1)阿里通义万相开源视频编辑统一模型VACE；2)OpenAI发布GPT-4.1增强编码能力；3)Stability AI推出超轻量341M文字转语音模型；4)快手可灵视频生成模型占据30%市场份额；5)微软WizardLM团队整体加入腾讯混元大模型研发体系；6)腾讯宣布混元图像2.0将于5月16日发布；7)上海成立人工智能标识生态联盟；8)Lightricks发布13B参数视频生成模型LTX-Video；9)谷歌DeepMind推出AlphaEvolve优化AI训练速度；10)腾讯元宝浏览器插件上线Chrome平台。这些进展展示了AI技术在视频处理、大模型、语音合成等领域的快速发展。

人工智能视频编辑开源项目
AI简历教程！用 deepseek 一键生成高质量简历

本文介绍如何利用AI工具Deepseek快速制作专业简历。传统简历制作依赖WPS模板或作图软件，过程繁琐。现在通过Deepseek平台，只需输入自然语言指令（如工作经验、技能等关键信息），系统即可自动生成排版精美的HTML版简历，还能转换为PDF格式。操作流程分三步：1.访问官网输入需求指令；2.查看并运行生成的HTML代码；3.保存文件或转为PDF。该工具特别适合求职者快速制作突出个人优势的专业简历，大幅提升求职效率。

深度思考R1模型 AI简历制作求职工具
雷军祝大家五一快乐晒超级小爱新功能：一键生成拍立得照片

快科技5月1日消息，雷军今早发文祝大家五一节快乐，并且还晒出了小米手机上超级小爱的新功能一键生成拍立得照片。雷军用自己在武大与SU7合影的照片，以及发布会上穿皮衣的照片生成了对应图像，整体非常传神，而且是Q版特效，很适合五一发朋友圈。这是超级小爱一项最新推送的功能，只要对小米手机的超级小爱说生成拍立得照片”，就可以生成这样效果的照片。超级小爱在去年底开始推送给用户，相比传统小爱更聪明、更智能。小米重塑了界面UI，能够与系统界面融合，在任何页面都可以唤醒超级小爱，并与它交流，不再有单独的APP感。支持全局多?

小米超级小爱拍立得
DeepSeek + Kimi一键生成高质量PPT

文章介绍如何用两个免费AI工具快速制作PPT：先用微信版DeepSeek生成大纲，再用Kimi智能助手一键生成PPT。操作步骤包括：1）在微信搜索DeepSeek，输入需求生成结构化大纲；2）访问Kimi网页版，将大纲粘贴至PPT助手功能；3）选择模板样式，一键生成PPT。该方法适用于教师备课、学生汇报、职场报告等多种场景，能自动完成从构思到排版的全部流程，高效且效果惊艳。

AI工具 PPT制作 DeepSeek

今日大家都在搜的词：

热文

3 天
7天

B站团队推出AniSora开源动漫视频生成模型，一键打造多种风格动画！

荐AI日报：QQ浏览器升级为AI浏览器；OpenAI全新编程智能体Codex；B站团队推动漫视频生成模型AniSora

豆包视频生成模型Seedance 1.0 lite发布：“迅速生成影视级的视频”

对标Sora！谷歌发布AI视频生成器Veo 3：可同时生成视频和音效

持续霸榜！可灵2.0模型登顶全球视频生成大模型榜单

腾讯混元视频生成工具全新开源：人物不会“变脸” 物体不会“漂移”

荐AI日报：扣子空间开放测试；腾讯混元开源视频生成工具HunyuanCustom；阿里开源大模型搜索引擎ZeroSearch

荐AI日报：GPT-4.1正式上线ChatGPT；阿里通义万相Wan2.1-VACE开源；可灵大模型视频生成量约占30%份额

AI简历教程！用 deepseek 一键生成高质量简历

雷军祝大家五一快乐晒超级小爱新功能：一键生成拍立得照片

DeepSeek + Kimi一键生成高质量PPT

今日大家都在搜的词：

热文

苹果WWDC2025定档6月9日-13日，iOS大改版、没有AI…

调查发现：近 50% 年轻人宁愿活在“没有互联网”的世界！

谷歌投资1.5亿美元，携手Warby Parker开发AI眼镜

谷歌谢尔盖·布林：我在 Google Glass 上犯了很多错！

XReal牵手谷歌，推出新一代AR眼镜 Project Aura

英特尔考虑出售网络和边缘业务，去年营收 58 亿美金

特朗普签署法案，将“报复性色情”和“露骨AI深度伪造”定为犯

Windows时光倒流：30 年前的系统仍在火车、银行、医院运行着

苹果与Epic诉讼战升级，法官施压：要么批准《堡垒之夜》上架，

学生发现教授用ChatGPT生成课件，要求退费 8000 美元

OpenAI 推出首款成熟编程 AI 代理 Codex

黄仁勋：AI十年变革拉开序幕，“这个赛道没有第二名”

帝国用脏话反击：AI 达斯・维达“黑化”，满口粗言秽语

iOS 19 或将大幅提升你 iPhone 的电池续航能力

AI 驱动高效转型，Klarna 人均收入飙升至近 100 万美元

高通确认9月底发布骁龙8 Elite 2，将与天玑9500正面交锋

站长商机