在中关村论坛年会未来人工智能先锋论坛上,生数科技联手清华大学隆重推出中国首创的长时长、高一致性、高动态性视频大模型 Vidu。
作为 Sora 之后国际视频大模型领域的重大突破,Vidu 的性能堪比全球领先水平,并持续优化升级中。
Vidu 采用独创的 Diffusion 与 Transformer 融合架构 U-ViT,支持一键生成时长长达 16 秒、分辨率高达 1080P 的高清视频内容。
除了时长上的突破,Vidu 在视频效果方面也取得了显著进步:
生成场景细节丰富复杂,符合真实物理规律;
生成虚构画面,创造出具有深度和复杂性的超现实内容;
支持复杂的动态镜头,超越了推、拉、移等固定镜头,可在一帧画面内实现远景、近景、中景、特写等镜头转换;
16 秒时长内画面连贯流畅,随着镜头移动,人物和场景在时间和空间上保持一致;
能够生成具有中国特色的元素,如熊猫、龙等。
(举报)