首页 > 业界 > 关键词  > 世界模型最新资讯  > 正文

生成视频好看还不够,还要能自由探索!昆仑万维开源Matrix-Game,单图打造游戏世界

2025-05-13 13:47 · 稿源: 机器之心公众号

世界模型的进度条,最近坐上了火箭。去年11月,两家创业公司打造的 Oasis,首次在开源世界模型中实现了实时、可玩、可交互。生成的虚拟环境不仅包含画面,也体现出了对物理和游戏规则的理解。今年4月,微软开源的交互式世界模型 MineWorld,再次提升了视觉效果,大幅提升了动作生成

......

本文由站长之家合作伙伴自媒体作者“机器之心公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • AI日报:昆仑万维天工超级智能体APP上线;谷歌重磅发布三大Gemma模型变体;字节推出开源多模态模型BAGE

    本文介绍了AI领域最新动态:1)昆仑万维推出全球首款AI+Agent架构的Office智能体应用;2)研究显示ChatGPT能提升K12学生成绩近87%;3)谷歌视频生成工具Veo3扩展至更多地区;4)谷歌发布三款Gemma模型变体,覆盖医疗、手语翻译和海豚语言研究;5)VideoTutor实现一句话生成定制教学视频;6)字节跳动开源多模态模型BAGEL;7)Rork支持无代码开发iOS/Android应用;8)AingDesk降低AI助手开发门槛;9)Claude4登陆亚马逊Bedrock平台;10)Youware通过MCP协议提升网页生成能力。这些创新展示了AI技术在各领域的快速发展和应用潜力。

  • AI日报:昆仑万维天工超级智能体发布;OpenAI核心API支持MCP;百度飞桨PaddleOCR 3.0开源

    【AI日报】汇总了近期AI领域重要动态:1)百度飞桨发布PaddleOCR3.0,提升文字识别精度13%;2)昆仑万维发布天工超级智能体,AI办公成本仅为OpenAI的40%;3)OpenAI API新增MCP支持简化开发流程;4)xAI推出实时网页搜索API;5)谷歌Sparkify可将问题秒变动画;6)Mistral发布高效代码模型Devstral;7)Video Ocean推出4K视频生成工具;8)谷歌推出AI内容识别工具SynthID;9)谷歌NotebookLM使用量半年增长56%;10)硅基流动升级128K长文本模型;11)DeepMind发布音乐生成模型Lyria2;12)多模态大模型MMaDA实现跨模态推理;13)微软发布网页智能体Magentic-UI;14)Framer推出AI建站套件。

  • 对标Sora!谷歌发布AI视频生成器Veo 3:可同时生成视频和音效

    谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3,对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频,还能为人物对话、鸟鸣等场景自动匹配音效,实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户,月费249.99美元,并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是,谷歌在AI图像生成领域并非一帆风顺,此前Imagen 3曾因生成含历史错误的图像引发争议。

  • Baidu Steamer-I2V推动视频生成技术突破,擎舵平台赋能原生创意营销

    百度推出全球领先的视频生成模型Baidu Steamer-I2V,以89.38%综合评分登顶VBench榜单。该模型通过精准画面控制、高清画质和中文语义优化,能将静态图像转化为连贯动态视频。百度营销平台迎来2周年,已服务超13万家企业,日均生产素材超10万+。在"AI驱动营销全链路升级"主题下,百度与核心代理商共同探讨AIGC技术突破与创意升级,推出"AI创"原生创意大赛。百度商业体系表示将持续巩固传统广告优势,同时突破创意边界,实现营销效果飞跃。未来百度将优化模型性能,拓展应用场景,推动营销行业迈向"一杯咖啡时间完成创意生产"的全智能化时代。

  • 国产科幻机甲游戏《解限机》定档7月2日公测,登顶Steam国产游戏愿望榜首

    国产科幻机甲游戏《解限机》正式定档2025年7月2日全球公测。游戏凭借硬核品质登顶Steam国产游戏愿望单榜首、全球第四,已吸引超500万玩家预约。作为近年国产3A级工业实力的代表,该作以独特的中国视角重构科幻机甲叙事,成为指定出海科幻大作。游戏将推出多项更新:免费解锁12台机兵、优化新手教程、新增PvPvE玩法"玛什马克"等。制作人郭炜炜将于6月9日晚进行全球直播介绍详情。目前游戏在Steam愿望单排名全球第四,国产第一,测试首日在线人数突破31万,全球预约量超500万持续增长。

  • 豆包视频生成模型Seedance 1.0 lite发布:“迅速生成影视级的视频

    火山引擎在FORCE LINK AI创新巡展上发布多款AI模型升级产品:1)Seedance 1.0 lite视频生成模型,支持5-10秒480P/720P视频生成,具备影视级画质和生成速度优势,适用于电商广告、影视创作等场景;2)豆包1.5视觉深度思考模型,仅20B参数但具备多模态理解能力,在60项基准测试中38项达SOTA水平;3)升级版豆包音乐模型,新增英文歌曲创作功能,并能根据视频内容自动适配BGM。目前这些模型已在火山方舟平台和豆包APP上线。

  • 大师AI 创建表上线!一句话生成,好用到超乎想象!

    表单大师推出全新AI表单创建功能,用户只需用自然语言描述需求,系统即可自动生成专业表单。该功能覆盖问卷调查、活动报名、课程预约等各类场景,省去传统拖拽设计流程。AI能智能优化字段排版,并匹配行业场景添加表头等元素。用户反馈显示,原本需要2小时制作的活动报名表,现在10分钟即可完成,且字段更全面。产品支持在线编辑和发布,适用于企业及个人用户,大幅提升表单制作效率。

  • 淘宝跑步进入三世界

    6月10日,苹果给今年获得苹果设计大奖(Apple Design Award,简称ADA)的应用颁了奖。 要知道,在业内,ADA是被称作应用界“奥斯卡”的。1997年,苹果濒临破产时,乔布斯再次回归苹果,同一年的 WWDC(苹果全球开发者大会) 上,苹果正式推出“人机交互杰出设计奖”,以表彰苹果生态中最出色的第三方软件设计,两年后,这一奖项更名为大众熟悉的苹果设计大奖。 今年尤其特

  • AI日报:GPT-4.1正式上线ChatGPT;阿里通义相Wan2.1-VACE开源;可灵大模型视频生成量约占30%份额

    本文报道了AI领域最新动态:1)阿里通义万相开源视频编辑统一模型VACE;2)OpenAI发布GPT-4.1增强编码能力;3)Stability AI推出超轻量341M文字转语音模型;4)快手可灵视频生成模型占据30%市场份额;5)微软WizardLM团队整体加入腾讯混元大模型研发体系;6)腾讯宣布混元图像2.0将于5月16日发布;7)上海成立人工智能标识生态联盟;8)Lightricks发布13B参数视频生成模型LTX-Video;9)谷歌DeepMind推出AlphaEvolve优化AI训练速度;10)腾讯元宝浏览器插件上线Chrome平台。这些进展展示了AI技术在视频处理、大模型、语音合成等领域的快速发展。

  • 三筒!明牌! 海信棉花糖Ultra全家筒开启洗衣“空间自由”时代

    海信洗衣机推出三筒系列新品,满足消费者对分区洗护的健康需求。5月30日,海信在青岛发布"棉花糖Ultra全家筒"系列,包含旗舰版、轻享版和青春版三款产品。旗舰版是全球首款4合1热泵洗烘一体机,支持13kg洗涤+9kg热泵烘干,配备双mini筒独立洗烘;轻享版搭载专利活水洗4.0技术,毛屑去除率达90%;青春版主打高性价比基础分区洗护。产品通过物理分区方式解决母婴、�