首页 > 业界 > 关键词  > 微软最新资讯  > 正文

微软发布DragNUWA 1.5版本 可精细控制视频物体的运动路径

2024-01-09 10:34 · 稿源:站长之家

站长之家(ChinaZ.com)1月9日 消息:微软最近发布了DragNUWA1.5版本,这个新版本的功能让用户在通过图像生成视频之前,能够在图像上画出对应方向的箭头标记。这意味着,如果你标记的不是具体的物体,镜头就会按照你标记的方向运动。而如果你标记的是具体的物体,这个物体就会按照标记的方向运动。

image.png

项目地址:https://top.aibase.com/tool/dragnuwa

这一新功能的发布对于那些希望能够更方便地编辑视频的用户来说,无疑是一个非常实用的工具。这个功能的出现,将让用户可以更加方便地在编辑视频时进行定位和移动画面,无需复杂的后期编辑。这将大大提高视频编辑的效率和方便性。

从技术层面来看,DragNUWA1.5版本的功能可以通过人工智能技术来实现,通过识别用户在图像上的标记,自动调整视频画面的运动方向。这一技术的应用,不仅提高了视频编辑的效率,也为用户带来了更加直观和简便的编辑方式。

核心功能:

DragNUWA 的核心功能在于提供视频生成的精细控制。更新于2024年1月8日的1.5版本使用稳定的视频扩散作为骨干,根据特定路径对图像进行动画处理。该模型将文本、图像和轨迹作为关键控制因素,从语义、空间和时间的角度促使对视频生成进行精准控制。

入门指南:

要开始使用DragNUWA,用户只需克隆GitHub存储库并创建专用的Python环境。预训练权重可以手动下载到models/目录,也可以运行提供的脚本。设置完成后,用户可以使用python DragNUWA_demo.py命令启动Gradio演示,从而能够拖动图像并实时观察其动画效果。

举报

  • 相关推荐
  • AppleWatch充电器成美甲神器:环形磁场可形成特殊纹理

    近日,美甲爱好者群体中掀起了一股创意热潮,他们解锁了Apple Watch充电器的一项别样用途——借助其内置的环形磁铁,轻松打造出独特的“猫眼”美甲效果,这一新奇玩法在社交平台上引发了广泛关注。 与传统使用的条形或U形磁铁不同,Apple Watch充电器有着特殊的环形磁场分布,正是这一特性,让它能够创造出别具一格的渐变纹理,为美甲增添了独特的魅力。

  • Apple Watch充电器成美甲神器:内置磁铁使指甲油金属颗粒偏移

    有美甲爱好者近期解锁了Apple Watch充电器的一项创意妙用:借助其内置的环形磁铁,可以轻松打造出独特的猫眼”美甲效果。 与传统条形或U形磁铁不同,Apple Watch充电器因其特殊的环形磁场分布,能创造出别具一格的渐变纹理。 在社交平台上,用户peninkling详细分享了操作步骤:先将指腹轻按在充电器的磁吸面上,随后涂上磁性指甲油。 在磁场作用下,甲油中的金属颗粒会�

  • 拖拽下图像就能生成视频,中科大、微软等DragNUWA属实惊艳

    随着ChatGPT、GPT-4、LLaMa等模型的问世,人们越来越关注生成式模型的发展。相比于日渐成熟的文本生成和图像生成,视频、语音等模态的AI生成还面临着较大的挑战。下图6通过展示文本、轨迹和图像的不同组合说明了这些控制条件的必要性。

  • AI日报:微软宣布Win11原生支持MCP协议;联想亮出AI眼镜概念机

    本期AI日报涵盖多项重要动态:微软Win11原生支持MCP协议,推动AI深度融合;抖音第二总部落户深圳南山,同步建设AI研究项目;联想在CES 2026展示轻量化AI眼镜,瞄准生产力场景;Liquid AI发布面向边缘设备的小型模型LFM2.5;Anthropic推出支持多会话并行的Claude Code桌面预览版,提升编程效率;高德上线自研“飞行街景”模型,实现高保真实景导航;惠普推出全球首款键盘式AI PC,重新定义办公设备;Google Gemini新增“引导式学习”功能,革新个性化教育;直播电商迎来新规,明确AI主播违规责任;开源视频生成模型LTX-2发布,可一次生成20秒4K音画同步视频。

  • DragNUWA :一个可以实现精细控制的视频生成模型

    DragNUWA是一种基于扩散算法的视频生成模型,DragNUWA模型旨在解决视频生成中的精细控制问题。该模型通过引入文本、图像和轨迹信息,并从语义、空间和时间角度提供精细控制。该模型在实验中展现出优越的细粒度控制性能。

  • 带你穿越清明上河图!DragNUWA惊艳亮相:一拖一拽让静图秒变视频

    微软提出文本图像轨迹条件视频生成模型DragNUWA,支持手绘轨迹驱动图像动态化,实现复杂运动及场景控制。微软开发的视频生成模型DragNUWA让清明上河图动起来了!只要用拖动的方式给出运动轨迹,DragNUWA就能让图像中的物体对象按照该轨迹移动位置并生成连贯的视频。他被评为中国计算机协会杰出会员、CCF-NLPCC青年科学家、DeepTech中国智能计算科技创新人物。

  • draggan官网地址多少 draggan在哪下载 DragGAN怎么用?

    一个名为DragGAN的AI图片编辑工具备受瞩目。它实现了简单的点击鼠标、拖动关键点,就能达到与Photoshop相似的效果。案例5:让小姐姐眯眼操作方式和上面一样,先把要修改的部分画个圈“涂白”,让后在眼皮的上下各设一个点,让其向中间靠拢,就可以轻松实现眯眼效果了。

  • 从Meta收购Manus看行业趋势 MasterAgent立国产智能体新标杆

    2025年12月30日,全球AI行业迎来重磅变局!美国科技巨头Meta宣布收购AI智能体产品Manus,创下Meta成立以来第三大收购纪录。就在这一国际智能体赛道格局重塑的关键节点,国产力量同步亮剑——深元人工智能研发的全球首个L4级智能体母体系统MasterAgent宣布正式全面开放,以全栈自主研发的核心优势直面国际竞争,树立国产智能体新标杆,为中国AI智能体赛道的全球博弈注入关键动

  • AI修图工具DragGAN怎么用?DragGAN体验地址多少?

    最近来自马克斯·普朗克计算机科学研究所、MIT+CSAIL和Google的研究员,研究了一种新的GAN控制方法DragGAN。只需点击拖拽,用户就可以+"改变汽车的尺寸,将人物嘴巴张开或合上等。这个过程将一直持续到控制点到达其对应的目标点。

  • Dragon Fly:别玩小鸟了 玩小龙吧

    玩够了愤怒的小鸟?厌倦了小鸟的唧唧歪歪?试试这款目前在Android market上相当火爆的横版飞行类小游戏吧。故事情节很简单,一个新出生的小翼龙,想要独自远走高飞,既要越过重重山脉和丘陵,也要避免被母龙追赶上。

今日大家都在搜的词: