首页 > 业界 > 关键词  > 正文

国际水平!首个Sora级国产自研视频大模型Vidu发布

2024-04-28 10:15 · 稿源: 快科技

在中关村论坛年会未来人工智能先锋论坛上,生数科技联手清华大学隆重推出中国首创的长时长、高一致性、高动态性视频大模型 Vidu。

作为 Sora 之后国际视频大模型领域的重大突破,Vidu 的性能堪比全球领先水平,并持续优化升级中。

Vidu 采用独创的 Diffusion 与 Transformer 融合架构 U-ViT,支持一键生成时长长达 16 秒、分辨率高达 1080P 的高清视频内容。

除了时长上的突破,Vidu 在视频效果方面也取得了显著进步:

生成场景细节丰富复杂,符合真实物理规律;

生成虚构画面,创造出具有深度和复杂性的超现实内容;

支持复杂的动态镜头,超越了推、拉、移等固定镜头,可在一帧画面内实现远景、近景、中景、特写等镜头转换;

16 秒时长内画面连贯流畅,随着镜头移动,人物和场景在时间和空间上保持一致;

能够生成具有中国特色的元素,如熊猫、龙等。

举报

  • 相关推荐
  • 视频生成模型Vidu Q1怎么用?Vidu Q1官网是什么?

    国产视频生成大模型Vidu Q1在性能、价格和功能上实现重大突破。该模型由生数科技推出,在VBench评测中超越Sora等国内外顶尖模型,支持1080p高清视频生成,每秒价格低至3毛钱。其首尾帧功能仅需两张图即可实现电影级运镜效果,支持多元风格生成和48kHz高采样率混音功能。Vidu Q1已深度赋能影视、广告、动漫等行业,大幅降低创作门槛。

  • 或超过人类平均水平!AI 大模型将如何改造智能客服?

    本文探讨了AI大模型如何推动智能客服升级。每日互动产品总监高志成指出,传统智能客服存在"答非所问"问题,主要受限于算法覆盖不足、相似性匹配机制和逐句识别方式。而大语言模型能基于上下文深度理解,精准把握客户意图,实现"所答即所问"的基本要求。未来智能客服将朝五个方向升级:1)精准理解应答;2)更自然的沟通方式;3)主动挖掘需求和销售转化;4)自动构建决策模型;5)实现营销服务一体化应用。高志成认为,随着AI技术发展,智能客服水平将超越人工客服平均水平,不仅能处理售前咨询,还能部分解决售后问题。企业需构建完善的知识库体系,将商品信息、活动信息等单独做成知识库,通过数据标注构建更立体的用户画像。最终,智能客服将向"售前+售后"全能型发展,承担更大责任。

  • 挤爆字节服务器的Agent到底啥水平?一手实测来了

    字节推出"量子位"智能协作系统"扣子空间",具备信息整理、任务执行、工具调用等多项能力。测试显示其自主任务规划和资料搜集表现惊艳,已具备解决实际任务的潜力。系统分为探索和规划两种模式,前者重效率,后者可详细拆解任务。实测中能自动整理信息生成报告,并直接制作包含丰富内容的网页或PPT。在虚拟沙盒环境中还能操作电脑、浏览网页、订票�

  • 女生过度防晒睡觉翻身时骨折 体内维生素D水平严重不足

    ​近日,四川成都一名48岁女性因长期过度防晒导致体内维生素D水平严重不足,进而引发严重骨质疏松,在一次睡觉翻身时的轻微动作中即发生骨折,引发社会对科学防晒与骨骼健康的关注。 据了解,该女性日常生活中从不穿短袖,严格使用各类防晒产品,导致体内维生素D水平仅7.8ng/ml,远低于正常参考值20-50ng/mL。医生指出,维生素D是钙吸收的关键媒介,缺乏维生素D会阻碍

  • 持续霸榜!可灵2.0模型登顶全球视频生成大模型榜单

    快手旗下可灵AI 2.0模型在权威AI评测中表现优异,以1124分超越自研1.6版本,连续三个月蝉联全球图生视频领域冠军。4月15日发布的2.0大师版在视频质量、语义理解和画面美学等核心指标持续领先行业。数据显示,自2023年6月上线以来,可灵AI全球用户突破2200万,月活激增25倍,累计生成视频1.68亿个、图片3.44亿张。商业化方面,其单月流水已超千万元,并与伊利、vivo等头部品牌达成深度合作,展现出AI视频生成技术的广阔商业前景。

  • 全球首个女性肿瘤AI大模型 “木兰”正式进入临床应用

    快科技5月14日消息,华中科技大学宣布,全球首个女性肿瘤AI大模型木兰”,正式进入临床应用阶段。目前,公众可通过华中科技大学同济医院”公众号或掌上同济”APP,在互联网医院下的同济木兰AI咨询”栏目中获得免费服务。未来,该模型还将通过更多手机端线上平台、电脑端应用以及各级医疗机构等多种渠道,向公众开放。据介绍,木兰”由华中科技大学同济医学院附属同济医院主导研发,该模型以国内外权威的女性肿瘤医疗指南和高质量专家共识为基础,融合了同济医院近20年来的高质量病例数据。还整合了中国工程院院士、同济医院妇产科学系主任

  • 豆包视频生成模型Seedance 1.0 lite发布:“迅速生成影视视频

    火山引擎在FORCE LINK AI创新巡展上发布多款AI模型升级产品:1)Seedance 1.0 lite视频生成模型,支持5-10秒480P/720P视频生成,具备影视级画质和生成速度优势,适用于电商广告、影视创作等场景;2)豆包1.5视觉深度思考模型,仅20B参数但具备多模态理解能力,在60项基准测试中38项达SOTA水平;3)升级版豆包音乐模型,新增英文歌曲创作功能,并能根据视频内容自动适配BGM。目前这些模型已在火山方舟平台和豆包APP上线。

  • 三星OLED 产品搭载NVIDIA G-SYNC技术,打造顶尖游戏体验

    三星2025款OLED产品将支持NVIDIA G-SYNC技术,提供165Hz高刷新率和Motion Xcelerator技术,实现无卡顿、低延迟的游戏体验。产品同时兼容AMD FreeSync Premium Pro,配备自动低延迟模式(ALLM)和AI游戏优化功能,可智能分析游戏场景并自动调节画质。通过三星游戏中心可一键直达主机和云游戏平台,搭载AI画质增强和防眩光技术,兼顾影院级视听效果与智能家居控制。该技术将率先应用于旗舰机型S95F,后续扩展至全系2025 OLED产品线。

  • 对标Sora!谷歌发布AI视频生成器Veo 3:可同时生成视频和音效

    谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3,对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频,还能为人物对话、鸟鸣等场景自动匹配音效,实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户,月费249.99美元,并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是,谷歌在AI图像生成领域并非一帆风顺,此前Imagen 3曾因生成含历史错误的图像引发争议。

  • ​海信重磅发布“云信·通途交通大模型”: 以AI之力,解锁智能交通无限可能

    4 月 23 日, 第十五届中国国际道路交通安全产品博览会在武汉国际博览中心盛大启幕。海信网络科技公司重磅发布“海信云信·通途交通大模型”, 标志着其在智慧交通领域的AI技术创新应用迈入了全新阶段。 该交通大模型是海信深度融合二十余年交通行业经验与前沿AI技术的产物。基于海量交通专业数据与多模态感知能力,构建“问答-分析-决策”一体化系统,通过AI指挥官

热文

  • 3 天
  • 7天