首页 > 业界 > 关键词  > 视频大模型最新资讯  > 正文

对标Sora!首个国产纯自研视频大模型Vidu全球上线:30秒生成

2024-08-01 16:44 · 稿源: 快科技

**首个国产自研视频大模型Vidu震撼发布**

日前,由生数科技清华大学携手打造的Vidu视频大模型(www.vidu.studio)正式面向全球上线。该模型是业界首个纯自主研发的国产视频大模型。

Vidu开放了文生视频和图生视频两大核心功能,支持4秒和8秒时长选择,最高分辨率可达1080P。用户只需注册邮箱即可体验,无需申请。

Vidu生成视频时长最长可达16秒,全面超越同类产品。

自今年4月在中关村论坛首次亮相以来,Vidu经过数月完善,不仅保留了原有的高动态性、高逼真度和高一致性优势,还新增了角色一致性、动漫风格和文字与特效画面生成等特色功能。

Vidu视频大模型

值得一提的是,Vidu在推理速度方面取得了突破,生成一段4秒片段仅需30秒。

在画面质感上,Vidu在构图、叙事和光影等方面展现出的效果可媲美电影级。

此外,Vidu还具备生成影视级特效画面的能力,如烟雾、炫光和CG特效等。

举报

  • 相关推荐
  • 持续霸榜!可灵2.0模型登顶全球视频生成大模型榜单

    快手旗下可灵AI 2.0模型在权威AI评测中表现优异,以1124分超越自研1.6版本,连续三个月蝉联全球图生视频领域冠军。4月15日发布的2.0大师版在视频质量、语义理解和画面美学等核心指标持续领先行业。数据显示,自2023年6月上线以来,可灵AI全球用户突破2200万,月活激增25倍,累计生成视频1.68亿个、图片3.44亿张。商业化方面,其单月流水已超千万元,并与伊利、vivo等头部品牌达成深度合作,展现出AI视频生成技术的广阔商业前景。

  • 对标Sora!谷歌发布AI视频生成器Veo 3:可同时生成视频和音效

    谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3,对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频,还能为人物对话、鸟鸣等场景自动匹配音效,实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户,月费249.99美元,并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是,谷歌在AI图像生成领域并非一帆风顺,此前Imagen 3曾因生成含历史错误的图像引发争议。

  • 用DeepSeek30秒极速生成年终总结

    本文介绍DeepSeek AI工具如何快速生成年终总结:1)支持上传文档、图片等多格式资料;2)输入简单指令即可10-30秒生成专业内容;3)可随时调整结果,补充数据或简化段落;4)支持导出Word/文本格式。操作流程:访问官网→上传资料→输入指令→生成内容→调整导出。该工具能显著提升职场人士撰写总结、报告等文档的效率,适合需要整合多份资料的工作场景。

  • 全球首个女性肿瘤AI大模型 “木兰”正式进入临床应用

    快科技5月14日消息,华中科技大学宣布,全球首个女性肿瘤AI大模型木兰”,正式进入临床应用阶段。目前,公众可通过华中科技大学同济医院”公众号或掌上同济”APP,在互联网医院下的同济木兰AI咨询”栏目中获得免费服务。未来,该模型还将通过更多手机端线上平台、电脑端应用以及各级医疗机构等多种渠道,向公众开放。据介绍,木兰”由华中科技大学同济医学院附属同济医院主导研发,该模型以国内外权威的女性肿瘤医疗指南和高质量专家共识为基础,融合了同济医院近20年来的高质量病例数据。还整合了中国工程院院士、同济医院妇产科学系主任

  • 豆包大模型1.6发布:全球第一梯队!可生成1080p高品质视频

    字节跳动旗下豆包大模型正式升级为1.6版,在推理、数学、指令遵循、Agent等方面的能力均有较大提升,同时豆包视频生成模型Seedance 1.0 pro、豆包语音播客模型也正式发布。 豆包大模型1.6包括三部分,分别是豆包1.6、豆包1.6-thinking、豆包1.6-flash。 其中,豆包1.6支持on/off/auto三种思考模式,豆包1.6-thinking强化了思考能力,支持多模态,在多个权威测评集上达到了全球第一梯队�

  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居全球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。

  • 低成本、高速度、1080p高清 可灵2.1打造视频大模型新标杆

    快手可灵AI推出全新2.1系列视频生成模型,包含标准版(720p)和高品质版(1080p),主打高性价比与高效生成。大师版则提供更卓越的运动表现和语义响应,分辨率提升至1080p。新模型在成本控制方面优势明显,5秒视频生成仅需20-35灵感值,速度不到1分钟,处于行业领先水平。模型质量全面提升,动态细节更丰富、物理模拟更真实、提示词响应更精准。目前可灵AI全球用户突破2200万,累计生成超1.68亿视频,商业化进程加速,2025年Q1营收超1.5亿元。新系列将满足从短视频创作到专业影视制作的多场景需求。

  • 日本内容产业的新宠:揭秘Vidu征服东京的三大法宝

    生数科技旗下AI视频生成平台Vidu在全球范围内快速扩张,尤其在日本动漫市场表现亮眼。其旗舰产品Vidu Q1模型在VBench评测中位居榜首,能快速生成高质量动漫风格视频,极大提升创作效率。平台已覆盖200多个国家和地区,用户超2500万。Vidu通过文生视频、图生视频等功能,结合丰富模板库,实现"秒级创作",解决日本动漫行业制作周期长、人力成本高等痛点。典型案例�

  • 全球首款生成式人形机器人运动大模型发布:可根据指令生成跑步、舞蹈等连贯动作

    今日上午,国家地方共建人形机器人创新中心联合复旦大学未来信息创新学院,正式发布了全球首款生成式人形机器人运动大模型 龙跃”(MindLoongGPT)。 龙跃大模型以自然语言驱动”为核心,构建了从多模态输入到高保真动作生成的完整闭环,颠覆传统运动控制范式。 也就是说,用户无需学习专业术语或操作复杂软件,仅需像与人类对话一样发出指令,例如以优雅的姿势递

  • 超越OpenAI、拿下全球双料第一,“AI吴彦祖”背后大模型SOTA了!

    超越OpenAI! 国产大模型突袭,AI语音生成天花板被重新定义了。 MiniMax最新发布Speech-02,同时拿下Artificial Analysis Speech Arena和Hugging Face TTS Arena两项全球权威语音基准测评第一!