首页 > 业界 > 关键词  > 世界模型最新资讯  > 正文

与谷歌Genie 3竞争!阿里发布世界模型HappyOyster

2026-04-16 16:56 · 稿源: 快科技
阿里发布新型数字世界构建产品

阿里推出“快乐生蚝” 可实时构建交互式数字世界

4月16日 快科技讯

阿里巴巴集团今日正式发布了一款名为“快乐生蚝”(HappyOyster)的新型数字产品。该产品基于先进的多模态架构开发,具备对多种媒体格式的理解能力,并能同步生成音视频内容。

据介绍,“快乐生蚝”主要提供“漫游”与“导演”两项核心功能,允许用户实时创建并进入一个可互动、可演绎且可探索的动态数字空间。

用户在该平台上构建的数字世界不仅可以完整保存,还能开放给其他用户进行后续的修改与再创作。

该产品由阿里巴巴ATH创新事业部团队研发,与之前备受关注的“快乐马”(HappyHorse)项目出自同一团队。

在技术领域,构建能够模拟真实世界动态的模型被视为前沿方向。阿里的“快乐生蚝”与谷歌的Genie3等项目同属“世界模拟器”这一技术流派。

技术分析指出,与同类产品相比,“快乐生蚝”采用了时间跨度更长的世界演化建模方法,这使其在生成高保真度、长时序的动态场景方面表现出色。

此外,该产品设计了多元的控制信号体系,使其能够在统一的时序框架下,协同优化生成质量、长时间序列的连贯性以及实时控制能力。

在具体功能上,“快乐生蚝”不仅支持用户以“漫游”模式自由探索,还提供了独特的“导演”功能。用户可通过自然语言指令,随时介入数字世界的演化过程,调度角色与事件发展。

在视觉呈现方面,“漫游”模式下的画面质量、风格适应能力以及动态效果均得到了强化。通过这两种模式的结合,该产品旨在为用户提供沉浸式的世界交互体验。

在漫游模式下,用户仅需输入一句话或上传一张图片,即可生成一个物理规则一致的数字空间。其中物体位置稳定,场景持久存在,视角与光照效果能随用户视角的移动而持续变化。

用户还可以自由切换观察方向与镜头运动,突破初始画面的边界,体验无限延伸的探索过程。

目前,“快乐生蚝”的漫游模式支持长达1分钟的连续实时位移与镜头控制,并允许用户进行多样化的视觉风格切换。

在导演模式下,用户可以在视频时间轴的任意节点,通过输入文字、语音或图像等方式,随时实现镜头切换、剧情改写或角色调度。系统将在充分的交互中,生成一个光照、重力、角色动作与场景因果关系持续演化的世界,用户也可为其选择特定的题材风格。

据悉,该产品的导演模式目前能够连续生成3分钟以上的480p或720p实时画面。

尽管构建动态世界模型的技术仍处于发展初期,但“快乐生蚝”已在多个领域展现出改变传统模式的潜力。

例如,游戏开发者可利用其快速生成可玩原型;影视创作者只需用自然语言描述创意,系统便能实时生成分镜画面,并支持在视频任意节点进行修改;在文旅与教育领域,用户能够以第一视角“走入”历史名画或古代文明场景,在交互中探索因果、改变事件走向。

展望未来,该技术还有望应用于线下智能空间或娱乐场景。例如,通过与可穿戴设备等智能硬件结合,根据人的位置、动作和语言动态,实时生成沉浸式内容,实现数字世界与现实环境的联动。

目前,用户可通过其官方网站(https://www.happyoyster.cn/)了解更多信息。

举报

  • 相关推荐
  • 少年科学家陈佳玉:8年读完本硕博,用因果世界模型让机器人自主思考

    27岁的北大本科、普渡直博、卡内基梅隆博士后、现任港大助理教授陈佳玉,用5年完成本硕博一体化研究,成为具身智能与强化学习领域一流学者。他通过原力无限发布的双臂协作演示,展示了基于因果世界模型的机器人自主执行能力——机器人不仅能完成桌面清扫等长程任务,还能在持续执行中根据实时状态动态调整策略,而非依赖预编程或简单视觉识别。这标志着从“看见未来”到“理解行动后果”的转变,因果世界模型正重新定义机器人的思维方式。

  • 谷歌展示新一代智能眼镜:Gemini加持 实时识别世界

    在今年的I/O大会上,谷歌首次展示了新一代智能眼镜,意图在可穿戴设备市场抢占一席之地。 谷歌宣布,将与三星以及眼镜品牌Gentle Monster、Warby Parker合作推出新款智能眼镜。该产品内置Gemini AI助手,支持与安卓及iOS手机配对使用。 谷歌XR业务总经理兼副总裁Shahram Izadi在主题演讲中表示,这款眼镜预计于今年秋季晚些时候推出,目标是将信息私密地通过语音传入耳中,而非�

  • 小米自动驾驶模型Xiaomi OneVL开源:业内率先统一VLA、世界模型路线

    今日,小米正式发布并开源Xiaomi OneVL自动驾驶模型。 该模型在业内率先实现VLA、世界模型、潜空间推理等多个技术路线的统一,在具备XLA模型强悍推理能力的基础上,大幅提升了推理的速度和精度,是行业内具备开创性的方案。 其在精度上超越显式CoT、在速度上对齐仅答案”预测的潜空间CoT方案。过去,VLA和世界模型是自动驾驶领域两条相对独立的技术路线:VLA专注于理解�

  • 多模态训练提速45% 百度智能云推出开源全模态训练框架

    多模态大模型时代,训练基础设施正面临结构性错位。传统框架基于“数据同质、结构单一、平台固定”设计,难以应对多模态异构数据、模型组件协同及跨平台算力需求。百度百舸开源的全模态训练框架LoongForge,以Megatron为核心引擎,通过统一模型抽象、系统层优化和硬件插件化设计,实现“一套代码多平台运行”。其CCT通算传并行、ChunkPipe流水线并行、自适应FP8等技术,在主流模型上实现15%-45%端到端训练加速,在DeepSeek等前沿架构上实现倍级性能提升,并在5000+卡昆仑P800集群上达到90%+线性扩展效率。

  • 5年研发,腾讯两款“世界”游戏齐上阵,能打过原神吗?

    3月底至4月中旬,腾讯游戏在开放世界赛道密集落子,先后上线《洛克王国:世界》与《王者荣耀世界》,形成双“世界”同台格局,引发行业与玩家热议。 两款新作均脱胎于腾讯顶级IP,却承载着不同的战略使命。《洛克王国:世界》主打情怀回归,唤醒童年用户记忆;《王者荣耀世界》依托国民级MOBAIP,试图将海量流量转化为开放世界新用户,二者表现直接影响腾讯该赛道布�

  • 中国正在成为世界内容工厂

    「目前海外短剧市场存到9-10倍的增长空间。」 在今年4月的网络视听大会AI论坛上,NetShort CEO王利在演讲中用数据推论出短剧出海的巨大潜力:据主流媒体统计,海外短视频用户已达20亿。参照国内短剧到短视频的用户渗透率,海外短剧潜在用户可以达到9亿规模,而目前海外短剧月活用户仅为8000万。 面对有十倍增长潜力的全球市场,从业者普遍相信,中国短剧与AI内容产业正�

  • 小米汽车CTO胡峥楠祝贺任周灿圆梦:坚守十几年终被世界认可

    昨日,小米汽车官宣,YU7 GT以7分34秒931的成绩刷新了纽北最速SUV圈速纪录。 更有意义的是,这一纪录由小米汽车工程师、首席测试车手任周灿创造,他如今也是首位获得纽北圈速认证的中国车手。 随后,小米汽车CTO胡峥楠发布长文祝贺自己的兄弟圆梦,称十几年的坚守终于有被世界认可的时刻”,原文如下: 首先还是要恭喜兄弟圆梦,真的替阿灿感到高兴。十几年的坚守�

  • 看世界杯不能将就!6款口碑大屏电视推荐,精准还原热血现场

    距离2026年美加墨世界杯不足一个月,本届赛事被誉为科技含量最高的一届。为获得最佳观赛体验,RGB-Mini LED电视凭借原生色彩、舒适视觉和节能优势成为首选。2026年一季度,国内RGB-Mini LED电视销量爆发,月均销量达2025年3月后的329%,其中海信以79.4%销量份额占据主导地位,单品销量TOP10中独占7席。海信拥有覆盖六大系列、4000元至10万元价格段及55-116英寸尺寸的最强产品矩阵,重点推荐UX2026款(高端)和小墨E5S+ Pro(大众),两者均搭载先进画质技术,适合不同家庭需求。

  • 借力顶级赛事破圈,东鹏特饮让中国能量走向世界

    东鹏特饮作为中国能量饮料标杆,从补充品升级为大众抗疲劳刚需。其科学配方以牛磺酸、咖啡因为核心,搭配B族维生素、赖氨酸、肌醇等,实现“提神+补能+抗疲劳”协同效应。2025年单品营收155.99亿元,销量市占51.6%连续五年领跑。品牌携手张雪机车成为WSBK全球冠名伙伴,以“中国能量驰骋世界”输出国货实力,代表中国品牌“醒着拼”精神走向全球。

  • 真实世界数据飞轮:灵初智能正在构建具身智能的新护城河

    具身智能行业共识:缺乏真实世界数据难以训练出可落地的机器人。不同于语言模型和自动驾驶,机器人需学习复杂物理交互,涉及视觉、语言、空间、触觉等多模态融合。摩根士丹利指出,机器人“大脑”技术未定型,真实世界数据正成为核心壁垒。灵初智能通过自研数据采集方案ψ-SynEngine,大幅降低成本并积累10万小时人类手部操作数据,开源首批1000小时数据集。其核心在于构建“数据—模型—执行—反馈—再训练”闭环,让每次场景落地转化为数据积累,推动模型持续进化。未来竞争将聚焦于稀缺、有效、可持续的真实世界数据掌控能力。

今日大家都在搜的词: