首页 > 业界 > 关键词  > viva最新资讯  > 正文

viva发布类Sora视频生成模型 支持4K分辨率

2024-05-20 09:52 · 稿源:站长之家

站长之家(ChinaZ.com)5月20日 消息:海外产品 viva 近期推出了一个基于 Sora 架构的视频生成模型,这是首个向所有用户开放的同类工具,目前阶段免费使用。这一工具的发布对于希望快速制作视频内容的普通人来说是一个重大利好。

QQ截图20240520095335.png

主要功能:

  • 文本生成视频:用户可以通过输入文本描述来生成视频内容。

  • 图片生成视频:用户上传图片,模型能够据此生成视频。

  • 4K 分辨率放大:模型支持将视频内容放大至4K 分辨率,提升画质。

  • 提示词自动优化:模型能够根据用户输入的提示词自动优化生成的视频内容。

  • 视频长度:文本生成的视频单次可生成最长5秒,而图片生成的视频为4秒。

根据用户测试,viva 视频生成模型在生成具有较大运动幅度的视频方面表现出色,图像分辨率也是目前可用的视频生成产品中最高的。文本生成的视频效果优于图片生成视频,建议将运动幅度调整至大约20左右以获得较好的效果。

viva 的一大优势在于能够生成高质量的竖屏视频。尽管许多视频模型生成的演示视频都是横屏的,竖屏视频在短视频内容中占据重要地位,因此其生成质量非常关键。

然而,在一致性方面,viva 在某些测试中的表现并不尽如人意,没有展现出 Sora 那样强大的物理特性模拟和3D 一致性。与谷歌最近发布的 Veo 模型相比,viva 在写实内容生成方面已经非常接近。

用户还提供了使用相同提示词在 viva 和谷歌的 Veo 模型之间进行的对比测试,以及一些竖屏视频的演示。这些对比和演示可以帮助潜在用户更好地了解 viva 视频生成模型的实际效果和应用潜力。

这一进展标志着视频内容创作工具的民主化,使得没有专业视频制作技能的普通人也能够轻松创作高质量的视频内容。随着技术的进步和工具的普及,我们可以预见视频内容创作将变得更加多样化和丰富。

产品体验地址:https://top.aibase.com/tool/viva

举报

  • 相关推荐
  • 必应引入OpenAI的Sora视频生成器,完全免费使用

    微软表示:“Bing 视频生成器体现了我们让 AI 视频创作变得全民可及的努力。我们相信,创造力应当轻松且人人可用,从而助力你的探索与表达。”

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • 对标Sora!谷歌发布AI视频生成器Veo 3:可同时生成视频和音效

    谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3,对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频,还能为人物对话、鸟鸣等场景自动匹配音效,实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户,月费249.99美元,并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是,谷歌在AI图像生成领域并非一帆风顺,此前Imagen 3曾因生成含历史错误的图像引发争议。

  • 多模态2025:技术路线“神仙打架”,视频生成冲上云霄

    一场大会,聚集了中国多模态大模型的“半壁江山”。 智源大会2025为期两天的论坛中,汇集了学界、创业公司和大厂等三方的热门选手,关于多模态的集中讨论达到了前所未有的热度。其中,创业公司就有爱诗科技、生数科技、Sand.ai、智象未来、Luma AI、智谱等六家公司创始人、CEO分享心得;隶属大厂队的字节、腾讯、百度的多模态技术负责人,以及学术界的人大和MIT(麻省�

  • Baidu Steamer-I2V推动视频生成技术突破,擎舵平台赋能原生创意营销

    百度推出全球领先的视频生成模型Baidu Steamer-I2V,以89.38%综合评分登顶VBench榜单。该模型通过精准画面控制、高清画质和中文语义优化,能将静态图像转化为连贯动态视频。百度营销平台迎来2周年,已服务超13万家企业,日均生产素材超10万+。在"AI驱动营销全链路升级"主题下,百度与核心代理商共同探讨AIGC技术突破与创意升级,推出"AI创"原生创意大赛。百度商业体系表示将持续巩固传统广告优势,同时突破创意边界,实现营销效果飞跃。未来百度将优化模型性能,拓展应用场景,推动营销行业迈向"一杯咖啡时间完成创意生产"的全智能化时代。

  • 豆包大模型1.6发布:全球第一梯队!可生成1080p高品质视频

    字节跳动旗下豆包大模型正式升级为1.6版,在推理、数学、指令遵循、Agent等方面的能力均有较大提升,同时豆包视频生成模型Seedance 1.0 pro、豆包语音播客模型也正式发布。 豆包大模型1.6包括三部分,分别是豆包1.6、豆包1.6-thinking、豆包1.6-flash。 其中,豆包1.6支持on/off/auto三种思考模式,豆包1.6-thinking强化了思考能力,支持多模态,在多个权威测评集上达到了全球第一梯队�

  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居全球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。

  • REDMI K Pad杀到!首发多项新技术 4K内配置最豪华小平板

    今日,REDMI官宣旗下首款旗舰小平板REDMI K Pad。 小米中国区市场部总经理、REDMI品牌总经理王腾表示,REDMI K Pad全面超越iPad mini,做到4K以内配置最豪华的小平板”,推动安卓小平板全面进入旗舰时代。 据了解,REDMI K Pad采用LCD屏幕,与手机只需一颗DDIC驱动屏幕不同,K Pad为了让屏幕更清晰、采用超高分辨率,需要两颗IC来驱动屏幕。 王腾指出,双驱动IC的难度在于数据、亮度�

  • 全球首款生成式人形机器人运动大模型发布:可根据指令生成跑步、舞蹈等连贯动作

    今日上午,国家地方共建人形机器人创新中心联合复旦大学未来信息创新学院,正式发布了全球首款生成式人形机器人运动大模型 龙跃”(MindLoongGPT)。 龙跃大模型以自然语言驱动”为核心,构建了从多模态输入到高保真动作生成的完整闭环,颠覆传统运动控制范式。 也就是说,用户无需学习专业术语或操作复杂软件,仅需像与人类对话一样发出指令,例如以优雅的姿势递

  • 快手可灵AI上线2.1系列模型:生成5秒视频不到1分钟

    快手旗下可灵AI发布2.1系列模型,包含720p标准版和1080p高品质版,在性价比、生成速度和质量三大维度实现突破。新模型生成5秒视频仅需20-35灵感值,与上代保持相同成本;1080p视频生成时间不到1分钟,快于行业同级产品2-3倍。模型在动态表现、物理模拟和语义理解方面均有优化,人物动作更真实自然。可灵AI自发布以来发展迅猛,全球用户突破2200万,月活增长25倍,累计生成1.68亿视频和3.44亿图片。商业化进程加速,2025年Q1营收超1.5亿元人民币,展现强劲市场潜力。