视频生成新突破！PixelDance还可以做复杂动作和特殊效果

2023-11-24 14:14 · 稿源：站长之家

要点:
PixelDance是一项新的视频生成技术，相较于其他模型，它在生成高度一致性和丰富动态性的视频方面取得了显著的进展，引起了广泛关注。
PixelDance提供基础模式和高级魔法模式两种生成模式。基础模式仅需一张指导图片和文本描述，而高级魔法模式则需要两张指导图片，为用户提供更大的创造空间。这两种模式均能产生复杂、生动的视频效果。
PixelDance在视频生成中的创新在于采用文本指导和首尾帧图片指导的方法，使模型更关注学习视频的动态信息。值得注意的是，PixelDance在公开的WebVid-10M数据集上，只使用1.5B大小的模型就取得了出色的效果，相对于其他方法，不依赖于复杂的数据集和大规模的模型训练。

站长之家（ChinaZ.com）11月24日消息:近期，视频生成技术取得了显著的进展，其中PixelDance成为焦点。相较于其他模型如Runway的Gen-2、Meta的Emu Video、Stability.ai的SVD等，PixelDance在生成高度一致性和丰富动态性的视频方面表现出色。

PixelDance分为基础模式和高级魔法模式两种，前者只需一张指导图片和文本描述，而后者需要两张指导图片，为用户提供更大的创造空间。

体验地址:https://top.aibase.com/tool/make-pixels-dance

从官方展示的效果来看，PixelDance能够处理不同风格和复杂度的指导图片，包括真实风格、动画风格、二次元风格和魔幻风格。不仅如此，它能够完成人物动作、脸部表情、相机视角控制、特效动作等，展现了出色的生成效果。

PixelDance的技术创新在于采用文本指导和首尾帧图片指导的方法。这使得模型更专注于学习视频的动态信息，克服了视频生成中动作多样性和特征空间显著更大的挑战。

此外，PixelDance在公开的WebVid-10M数据集上，只使用1.5B大小的模型就取得了出色的效果，相较于其他方法，这显示了其对数据集和模型规模的简洁性。

在展示的3分钟故事短片中，PixelDance展现了出色的能力，无论是真实场景如埃及、长城，还是虚幻场景如外星球，都能生成细节丰富、动作丰富的视频。这为用户提供了创作空间，使得长视频生成不再依赖于拼凑弱相关的短视频片段。

PixelDance的突破意味着人们可以更轻松地生成复杂动作和炫酷特效的视频，为视频生成领域带来了新的可能性。未来，PixelDance将进一步迭代模型效果，并在2-3个月内放出供人们试用的模型，为创作者提供更多可能性。

（举报）

相关推荐

关键词：

科杰科技入选赛迪AI Infra平台市场研究报告，引领Data&AI数据基础设施新范式

近日，赛迪顾问发布《2025中国AI Infra平台市场研究报告》，全面梳理中国AI基础设施平台市场格局、技术趋势与竞争态势。报告显示，2024年中国AI Infra平台市场规模达345亿元，预计2025年将飙升至673亿元，同比增长95.1%。企业AI应用正从单点验证迈向嵌入核心业务流的深度阶段，对基础设施提出更高要求。科杰科技凭借Data&AI融合架构、湖仓一体引擎及企业级AI落地能力强势入选，位列“挑战者”象限，彰显其在Data&AI领域的领先地位。

AI基础设施市场研究报告 Data&AI融合
微算法科技（NASDAQ MLGO）：以隐私计算区块链筑牢多方安全计算（MPC）安全防线

微算科技开发的隐私计算区块链将区块链技术融入多方安全计算（MPC），构建安全可信的分布式计算平台。通过区块链共识机制、加密算法和智能合约，对MPC参与方身份验证、数据加密存储、任务执行及结果验证等环节进行保护，确保数据“可用不可见”。该技术显著提升数据隐私保护和计算可靠性，在金融、医疗、政务等领域实现跨主体数据安全协作，释放数据价值。

数据流通多方安全计算隐私计算
荐AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；Kimi K2成功接入Perplexity

本期AI日报聚焦多项技术突破：蚂蚁集团"灵光"AI助手实现30秒生成可编辑应用；xAI推出免费Grok 4.1模型显著提升质量与速度；Poe推出200人群聊功能支持多模型协作；OceanBase发布首款AI数据库seekdb实现混合搜索；国产模型Kimi K2接入Perplexity展现国际竞争力；谷歌DeepMind推出通用智能体SIMA2在3D游戏中任务完成率达62%；ElevenLabs升级为一站式内容生成平台；昆仑万维推出轻量级多模态智能体Skywork R1V4-Lite，用户拍照即可自动完成任务。

AI助手蚂蚁集团灵光App
权威专家齐聚CDA详解YOUMAGIC舒立缇的创新价值，学术赋能促行业提升

11月6-9日，中国医师协会皮肤科医师分会学术年会在重庆召开，聚焦新一代单极射频抗衰技术。会议中，专家深入解读了YOUMAGIC舒立缇单极射频的医学原理与技术优势，指出其单极有回路设计能实现更深层加热，有效促进胶原再生重塑，改善皮肤松弛。临床数据显示，该设备在安全性和有效性上表现优异，未来将持续深化医研合作，推动行业标准化与精准化发展。

中国医师协会皮肤科医师分会单极射频抗衰
荐AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异常致全球宕机；百度Q3 AI收入96亿元

谷歌发布Gemini 3大模型及Antigravity AI开发平台，支持参数灵活调整；Cloudflare因配置异常致全球服务中断6小时；微软测试AI文件连接器，允许Claude直接读取本地文件；百度Q3 AI收入96亿元，萝卜快跑订单激增；小米AI眼镜新增直播与语音控制功能；TikTok推出AI内容推荐调节选项；微软将Copilot全面集成至Office应用；谷歌推出实时生成交互界面的Generative UI技术；Manus发布Browser Operator，将浏览器升级为全功能AI代理。

AI Gemini 3
不锈钢勺子售价1300元 Prada回应：技术来自意大利

Prada一款标价1300元的不锈钢长柄勺引发网络热议。该产品虽售价高昂但提供24期免息分期，页面显示已售出5件。网友质疑奢侈品餐具是否物有所值，品牌方回应称设计简约流畅，勺柄末端三角形细节呼应徽标，承载品牌美学基因，强调产品从设计到质量监管均由意大利团队完成。部分消费者认为餐具作为日用品，高价更多源于品牌溢价。目前该商品仅深圳、成都门店有少量现货，调货周期较长。

奢侈品 Prada 不锈钢长柄勺
百度搜索推出“百度猎户座”AI引擎，涵盖基座模型、搜索AI API、 MCP、垂类优势能力

2025年11月13日，百度发布“百度猎户座”AI引擎，全面开放25年搜索技术与前沿AI能力。该系统整合底座模型、搜索API、MCP及垂直领域能力，基于多智能体架构统一连接信息、工具、服务与模型，融合搜索技术优势与全网MCP生态资源。即日起对外开放，支持企业快速接入打造专属AI应用。同时，文心助手上线个性化记忆功能，视频生成推出“参考生成”玩法，AI短剧创作平台免费提供超30万部IP资源及全流程工具。

百度猎户座 AI引擎搜索技术
YOUMAGIC舒立缇高能亮相CDA2025，引领皮肤医学前沿研究与创新

第二十届中国医师协会皮肤科医师年会暨全国美容皮肤科学大会在重庆召开。YOUMAGIC舒立绯通过科技展台、设备拆解展示及四场技术课堂，呈现其单极射频抗衰技术优势：100ms闪脉冲降低痛感，动态调节实现个性化治疗，临床验证显示3个月有效率100%。产品依托清华基因与医研融合，构建“更舒适、高效、安全”的技术体系，为行业提供精准抗衰新范式。

皮肤科医师年会美容皮肤科学大会技术创新
数智驱动，共赢跨境｜RixDesk亮相ICBE 2025，重磅发布“跨屏全媒介广告投放解决方案”

在ICBE2025深圳跨境电商博览会上，RixDesk发布“跨屏全媒介广告投放解决方案”。该方案针对用户多设备切换导致的广告触点分散问题，通过跨屏整合、一次创建全媒介触达、智能优化及数据闭环四大核心功能，帮助品牌实现多平台高效投放，提升传播效果与ROI。系统利用AI技术自动分发内容、优化策略，助力跨境品牌在复杂流量环境中精准获客与持续增长。

跨境电商广告投放数字营销
火山引擎Data Agent赋能金融行业，打造智能投顾与精准营销新范式

在平安保险AIGC嘉年华上，火山引擎专家指出，企业正从“数据驱动”迈向“认知驱动”新时代，核心是构建沉淀集体智慧的“企业级认知引擎”。火山引擎推出数据智能体Data+Agent，定位新一代企业AI数字专家，具备主动思考、分析与行动能力，助力构建“数据大脑”。其聚焦智能分析Agent与智能营销Agent两大场景：前者实现“提问即生产”的数据消费新模式，提升金融业务分析效率90%；后者依托“一客一策”个性化服务，动态融合客户数据，突破传统标签限制。该产品已在多行业验证，营销点击率提升30%、投资回报率提高80%。未来将持续强化预测与模拟能力，深化金融、制造、医疗等领域的智能决策应用。

企业级认知引擎数据驱动认知驱动

今日大家都在搜的词：

热文

3 天
7天

视频生成新突破！PixelDance还可以做复杂动作和特殊效果

科杰科技入选赛迪AI Infra平台市场研究报告，引领Data&AI数据基础设施新范式

微算法科技（NASDAQ MLGO）：以隐私计算区块链筑牢多方安全计算（MPC）安全防线

荐AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；Kimi K2成功接入Perplexity

权威专家齐聚CDA详解YOUMAGIC舒立缇的创新价值，学术赋能促行业提升

荐AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异常致全球宕机；百度Q3 AI收入96亿元

不锈钢勺子售价1300元 Prada回应：技术来自意大利

百度搜索推出“百度猎户座”AI引擎，涵盖基座模型、搜索AI API、 MCP、垂类优势能力

YOUMAGIC舒立缇高能亮相CDA2025，引领皮肤医学前沿研究与创新

数智驱动，共赢跨境｜RixDesk亮相ICBE 2025，重磅发布“跨屏全媒介广告投放解决方案”

火山引擎Data Agent赋能金融行业，打造智能投顾与精准营销新范式

今日大家都在搜的词：

热文

华为Mate X7外观公布搭载全新折叠玄武架构

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

董明珠再回应玫瑰空调：创新尝试打造家电艺术品

华为Mate X7今日开启预订搭载第二代红枫影像等配置

苹果回应iPhone17PM被湿巾擦掉色：高浓度酒精或是诱因

参与开发iPhoneAir设计师离职转投AI初创公司

AI日报：谷歌Gemini 3 Pro Preview模型上线；Cloudflare文件异

华为FreeBuds Pro 5悦彰耳机价格公布：1449元支持星闪音频

小米端到端辅助驾驶“Xiaomi HAD增强版”将于11月12日发布

小米AI眼镜推出1.4.16.0固件版本支持英语口语陪练

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

华为Mate X7外观公布搭载全新折叠玄武架构

阿里巴巴回应千问崩了：状态良好欢迎来问

AI日报：xAI推出Grok 4.1；OceanBase发布首款AI数据库seekdb；

荣耀500系列官宣将于11月24日发布

小米超级小爱AI大模型推出随心修图功能

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

站长商机