首页 > 传媒 > 关键词  > PixVerse最新资讯  > 正文

全球首个通用实时世界模型PixVerse R1发布 视听媒体进入交互时代

2026-01-14 14:34 · 稿源: 站长之家用户

1月14日,爱诗科技正式发布PixVerse R1,全球首个支持最高1080P分辨率通用实时世界模型:一个基于Omni原生多模态基础模型、自回归流式生成机制和瞬时响应引擎构建的下一代实时世界模型。该模型首次将视频生成的延迟从“秒级”降至“即时”响应,实现了“所想即所见、所说即所现”的实时交互体验,标志着AIGC领域的视频生成正式从“静态输出”迈入“实时交互”的全新阶段。PixVerse R1通过实现连贯且实时的生成,代表了全世界范围内视听媒体领域的一次重要演进。

PixVerse R1

在传统视频制作流程中,高延迟、固定时长生成是长期存在的痛点,难以满足用户对实时响应与内容共创的需求。PixVerse R1通过三大核心技术突破,系统性地解决了上述问题,推动数字媒体从“预录制回放”向“实时动态生成”演进。

三大核心技术突破,构建“实时交互世界引擎”

PixVerse R1的发布,标志着 AI 视频生成正式迈入 “实时交互”时代。其背后并非单一技术的跃进,而是由 Omni 原生多模态基础模型、自回归流式生成机制,与瞬时响应引擎 三大技术支柱协同构建的完整“实时交互世界引擎”。

首先,Omni 原生多模态基础模型(Native Multimodal Foundation Model)打破了传统多模态系统“拼接式”处理的局限。它采用Transformer架构,具有高扩展性,模型统一Token流架构(stream of tokens),将文本、图像、音频与视频融合为单一生成序列,实现真正端到端的跨模态理解与输出。更为关键的是,模型全程在原生分辨率下训练,避免了上采样带来的模糊与伪影。通过scaleup训练,使光影变化、物体运动与物理交互具备一致性和真实感。这意味着,AI 不再只是“画图”,而是在模拟一个符合现实场景的世界。

在此基础上,自回归流式生成机制(Consistent Infinite Streaming via Autoregressive Mechanism)解决了长时序一致性这一行业难题。通过引入记忆增强注意力模块,可生成任意长度的视频内容,并长期维持角色身份、物体状态与环境逻辑的一致性。用户不再受限于几秒片段,而能在生成过程中随时插入新指令,系统即时响应并动态调整叙事,实现真正的“流式交互”。画面突变、逻辑断裂等传统生成痛点,由此成为历史。

而让这一切“实时”成为可能的,是创造性的瞬时响应引擎(Instant Response Engine ——IRE)。IRE 通过时间轨迹折叠、引导校正和自适应稀疏采样三大创新,将传统扩散模型所需的50+ 采样步数压缩至惊人的1–4步,计算效率提升数百倍,让动态画面进入人眼可感知的“即时”响应阈值。不仅可以支撑高并发 API 服务,更为未来终端设备部署铺平道路。

三大核心技术环环相扣:Omni 提供现实世界的“计算基座”,自回归流式生成机制赋予其“持久记忆”,IRE 则注入即时反应的“神经反射”。它们共同构成了 PixVerse-R1这一全球首个支持1080P 实时生成的通用视频大模型,也正式开启了“视频即交互、世界可共创”的新范式。

从“观看”到“共创”:重新定义视频体验

PixVerse R1不仅仅是一个视频生成工具,更是一个“可交互的数字世界计算基础设施”。其应用场景覆盖游戏、影视、娱乐、创意等多个领域:

·游戏:非玩家角色(NPC)与环境可实时响应玩家操作;

·互动娱乐:观众通过语音或手势实时塑造剧情走向;

·共创体验:用户协同生成并重塑动态世界,涵盖科研实验、场景推演、经典影像重制到实时产品模拟。

例如,用户输入“一只猫跳上窗台,窗外下雨”,系统可同步生成1080P高清视频、雨声音效与动态光影;在交互过程中,若用户补充指令“把天空变成黄昏”,画面将在半秒内实现自然过渡。

从“回放过去”到“未来创作”

爱诗科技创始人兼CEO王长虎表示:“PixVerse R1是全新的媒体形式。第一次,AI可以基于用户的意图实时生成一个持续演化、物理上合理的世界。传统视频是被记录的历史,而PixVerse R1开创了‘正在发生的现在’的实时生成新纪元。无论是 AI 原生游戏、互动电影,还是生成式直播体验,叙事都能‘所想即所现’(As You Think)。创作与消费的边界逐渐模糊:视频消费者同时也是创作者,能够在观看的同时立即调整和生成新内容。我们相信,智能化媒体应实时响应用户意图,让每个人都能成为动态叙事的创作者。”

PixVerse R1的发布,不仅是视频生成技术模型上的突破,更标志着一种新媒介形态的诞生——视频不再是封闭的“内容成品”,而是可交互、可延续、可共同演进的数字世界。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • ​积分限免!字节跳动视频生成大模型Seedance 2.0接入剪映App

    字节跳动旗下视频生成大模型Seedance2.0已接入剪映App,用户更新至18.8.0版本后即可体验。该模型在视频编辑维度实现重大革新,支持像素级元素增删,官方称“让视频精修如P图般简单”。春节期间剪映推出积分限免活动,但明确暂不支持真人面孔生成功能,以规避伦理争议。模型上线后引发全球关注,马斯克转发演示视频并评论“进化速度惊人”。海外创作者实测显示,其生成的15秒视频在运镜、光影和角色一致性上达专业水准,部分作品被赞“媲美好莱坞特效”。面对外界赞誉,字节跳动保持谨慎态度,指出当前版本在细节稳定性、多人口型同步等方面仍存不足,需持续优化。研发团队透露,正构建更精细的物理世界模拟引擎,以解决流体流动、布料褶皱等动态效果难题。

  • 字节跳动旗下火山引擎发布视频生成大模型Seedance2.0

    字节跳动旗下火山引擎近日发布的视频生成大模型Seedance2.0,凭借“导演级”创作能力引发全球AI圈震动。这款在1.5Pro版本基础上迭代升级的模型,不仅攻克了人物一致性、视听同步等长期困扰行业的难题,更通过自动生成专业镜头切换功能,被业内人士评价为“可能抢走专业导演饭碗”的突破性产品。

  • 豆包视频生成模型Seedance 2.0正式接入豆包 暂不支持上传真人图片

    今日,豆包正式对外宣布,其自主研发的视频生成模型 Seedance2.0已全面接入豆包 App、电脑端及网页版,为用户带来前所未有的视频创作体验。此次升级,字节跳动再次展现了其在视频生成技术领域的领先地位。 用户只需打开豆包 App 对话框,即可发现新增的“Seedance2.0”入口。点击进入后,通过输入相关提示词,用户便能轻松生成5秒或10秒的精彩视频。更令人兴奋的是,豆包�

  • 实时生成开放世界:新AI模型贴脸开大,游戏研发慌不慌?

    这两天,又有一款全新的AI模型出现了。 虽说如今AI改变各行各业的事情早就屡见不鲜,在游戏业,很多岗位也或多或少已经用上了AI技术,但最近发布的这款AI模型,它真不一样。 这款AI模型名叫PixVerse R1,按官方说法,PixVerse R1是全球首个真正意义上的「实时生成世界模型(Real-time World Model)」。

  • 字节跳动即梦AI视频生成模型Seedance2.0怎么用?Seedance 2.0在哪?

    字节跳动旗下即梦平台近日正式上线新一代AI视频生成模型Seedance2.0,凭借多模态参考、高效创作与后期编辑融合等核心突破,成为影视、广告、短视频创作领域的焦点。该模型支持同时上传12个参考文件(图片、视频、音频),可精准复刻运镜逻辑、动作细节与音乐氛围,生成15秒视频仅需约30积分,较前代速度提升超10倍,显著降低废片率。

  • 重新定义“实时在线交互”,Soul App开源实时数字人生成模型SoulX-FlashTalk

    Soul AI Lab开源实时数字人生成模型SoulX-FlashTalk,实现0.87秒亚秒级超低延迟、32fps高帧率,支持超长视频稳定生成。该模型具备“零延迟”即时反馈、高精细度全身动作合成、超长视频稳定生成等亮点,通过双向蒸馏与多步回溯自校正机制解决传统方案延迟高、画面不一致等问题。在电商直播、短视频制作、AI客服等场景提供高质量、可落地的解决方案,推动大参数量实时生成式数字人迈入具体商用阶段。

  • 边看边创造,在 PixVerse R1 的实时世界模型里,你真是上帝

    想象一下,用一句话生成一个世界,一句话改变一个世界,一句话无限延伸一个世界。 1月13日晚,爱诗科技正式发布 PixVerse R1,它是“全球首个通用实时世界模型”,支持最高1080P 分辨率,基于原生多模态架构、自回归流式生成和瞬时响应引擎构建。

  • 三星显示器为2026年米兰科尔蒂纳冬奥会实时执裁与转播制作提供支持

    三星显示器在2026年米兰-科尔蒂纳冬奥会中发挥关键作用。其ViewFinity S8显示器用于短道速滑等项目的实时视频回放与赛程监控,凭借4K超高清分辨率与HDR10技术,助力裁判清晰辨识毫厘之差,确保比赛公平公正。同时,三星玄龙骑士电竞显示器Ark为赛事转播与制作团队提供支持,通过高曲率与大屏幕实现流畅的多路信号监控。三星自1998年起成为奥运会全球合作伙伴,将持续通过创新技术塑造奥运数字未来,其支持将延续至2028年洛杉矶奥运会及残奥会。

  • Sigmob公益行 | 用色彩与陪伴,守护“太阳花”的春天

    新春前夕,Sigmob联合多家爱心伙伴走进北京太阳花言语康复中心,陪伴孩子们举办了一场热闹的“策马闻春 声享庙会”联欢会。舞台上,孩子们带来了精心准备的表演,舞台下,庙会活动充满欢声笑语。这已是Sigmob陪伴太阳花的第四个年头,未来将继续践行企业社会责任,益路同行。愿每一朵“太阳花”都能在关爱中慢慢盛放。

  • 万兴科技引领移动视频剪辑新潮流 旗下万兴喵影移动端全面升级,视频免费剪

    万兴科技旗下明星产品万兴喵影移动端迎来全面升级,在国内移动剪辑领域率先推行“基础普惠+AI增值”服务策略。升级后,基础编辑功能及海量资源素材面向用户免费开放,仅对AI功能及素材等增值服务收费。同时,万兴喵影移动端开放十余项AI功能的每日高额限免体验权益,并取消登录设备数量限制,助力创作者高效创作。此举深化了万兴科技在视频创意领域的“AI+移动”及“创意平权”布局,旨在推动移动视频剪辑迈向AI驱动全民创作的新阶段。

今日大家都在搜的词:

热文