4月28日更新,Sora的流行引发全球范围内对AI视频生成技术的激烈竞争。最近,国内一款AI生成的视频片段吸引了广泛关注。该片段源自生数科技与清华大学合作发布的视频大模型Vidu。
官方透露,Vidu模型采用团队原创的Diffusion与Transformer融合架构U-ViT,具备一键生成长达16秒、分辨率高达1080P高清视频内容的能力。
举例来说,只需输入“画室中一艘船向镜头驶来”这样的简单指令,Vidu就能生成视觉效果逼真、镜头衔接流畅的视频。视频的整体品质可媲美Sora。
Vidu不仅能够生成复杂、细节丰富的场景,还能虚构场景并想象超现实主义画面,支持多镜头语言,擅长生成熊猫、龙等具有中国文化特色的形象。
证券时报指出,生数科技团队利用在机器学习和多模态大模型领域的深厚积累,在两个月内攻克多项关键技术,成功开发出Vidu视频大模型。
公开信息显示,生数科技成立于2023年3月,核心团队成员包括清华大学人工智能研究院的专家以及来自北京大学和阿里巴巴、腾讯、字节跳动等公司的技术人才。截至2024年3月,公司员工总数超过70人,其中研发人员占比近90%。
生数科技由瑞莱智慧RealAI、蚂蚁集团和百度发起的BV百度风投共同孵化创立,专注于打造可控多模态通用大模型。去年3月,公司开源了基于U-ViT框架的全球首个多模态扩散大模型UniDiffuser。
去年6月,生数科技获得了蚂蚁集团、BV百度风投、卓源资本的近亿元天使轮融资;8月,完成数千万元天使轮融资,由锦秋基金独家投资。
2024年3月,公司完成了新一轮数亿元融资,启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲继续跟投。
证券时报报道指出,在三轮融资总计数亿元人民币的投入下,生数科技已成为国内多模态大模型初创企业中估值最高的公司之一。
(举报)