首页 > 业界 > 关键词  > 正文

腾讯混元团队推出图生视频模型“Follow-your-Pose-V2”

2024-06-07 17:19 · 稿源:站长之家

站长之家(ChinaZ.com)6月7日 消息:腾讯混元团队联合中山大学、香港科技大学宣布推出全新图生视频模型"Follow-your-Pose-V2”,实现单张图片多人动作驱动。

微信截图_20240607171559.png

据悉,用户只需输入一张人物图片和一段动作视频,模型便能巧妙地让图片中的人物跟随视频中的动作舞动,生成的视频长度可达10秒。这一技术革新不仅降低了视频制作的门槛,还极大地提升了创作的效率。

更为重要的是,该模型在性能上实现了质的飞跃。它能在保证推理耗时更少的同时,支持多人视频动作的生成,满足了更多复杂场景下的应用需求。此外,模型还具备强大的泛化能力,无论是年龄、服装各异的人物,还是背景杂乱的场景,亦或是动作复杂的视频,它都能轻松应对,生成出高质量的视频作品。

举报

  • 相关推荐
  • 一机在手,随心创作:佳能R50V满足你对Vlog、人像与美食视频的所有想象

    佳能R50V微单相机专为视频创作者设计,兼具专业画质与便携性。机身仅重323克,支持6K超采4K视频,配备第二代全像素双核AF系统,可智能追踪人物、动物等多种主体。内置14种色彩滤镜与平滑皮肤功能,优化人像表现。创意拍摄模式支持慢快动作、电影宽银幕比例,竖拍优化与直播兼容性进一步提升创作效率,是Vlog、旅拍和街拍的理想工具。

  • OPPO ColorOS 16正式版推送:首批适配11款机型

    ColorOS 16正式版于10月30日启动推送,首批覆盖11款OPPO和一加热门机型。该系统引入极光引擎、潮汐引擎与繁星编译器三大流畅技术,实现感官、性能与底层的全方位提升。极光引擎打造业内首个“无缝隙架构”,确保全场景丝滑交互;潮汐引擎首发芯片级动态追帧技术,系统重载流畅度提升37%,功耗降低13%;繁星编译器首创安卓跨级融合编译技术,大幅提升低算力芯片性能。此次升级将增强品牌市场竞争力,为用户带来更出色的使用体验。

  • OPPO ColorOS 16正式版11月升级机型公布:支持23款机型

    ColorOS 16正式版11月升级计划公布,涵盖OPPO Find X7/N3系列、一加Ace 5系列等23款机型。系统引入极光引擎、潮汐引擎及自研繁星编译器,显著提升流畅度并降低功耗。新增一键闪记功能,支持复杂图文与超长视频录制。生态互联实现突破,全面打通Apple Watch生态,支持打车、外卖等信息跨设备显示。通过软硬协同优化,为用户打造更流畅持久的操作体验。

  • AI日报:上海首例涉AI提示词著作权案宣判;Kimi K2 Thinking发布;中文图像编辑新王UniWorld-V2发布

    今日AI领域动态:上海首例AI提示词著作权案宣判,法院认定提示词不具独创性;月之暗面发布Kimi K2思考模型,实现自主多轮工具调用;UniWorld-V2图像编辑模型支持中文框选即改,性能超越GPT-Image;谷歌推出AI文件检测工具Magika 1.0,支持超200种格式;Sora安卓版首日下载量达47万次;我国发布全球首个AI海洋大模型“瞰海”,可精准预测10天内海洋变化;宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控;谷歌Gemini API推出文件搜索工具,简化私有RAG系统集成。

  • 双十一Vlog相机怎么选?佳能PowerShot V1专为新手设计,操作简单可“闭眼入”

    佳能PowerShot V1专为Vlog新手设计,解决手机拍摄画质失真、操作复杂等痛点。搭载一体化超广角变焦镜头,无需更换镜头即可满足多场景拍摄;内置14种色彩滤镜和15种创意滤镜,支持智能直出,免除后期调色烦恼。配备模式切换拨杆,可快速在照片与视频模式间转换。实测在旅行、美妆、美食等六大场景中表现专业,画质远超手机。价格低于6000元,提供完整配件套装,实现“开箱即用”,帮助新手轻松开启高质量视频创作。

  • 成都春熙路现巨型LOL冠军奖杯雕塑 网友:电竞DNA被点燃

    ​近日,成都春熙路惊现一座高度约达10米的巨型LOL(英雄联盟)冠军奖杯雕塑,该雕塑以银白色金属质感呈现,高度还原了游戏中的经典“召唤师奖杯”造型,底座上还精心镌刻了历届14支冠军战队的名称,瞬间引发了广大游戏玩家的集体回忆与热烈讨论。 这座雕塑不仅在设计上独具匠心,更融入了前沿的科技互动元素。雕塑下方配备的大屏同步播放着虚拟皇冠动画,通过�

  • 轻便Vlog相机怎么选?佳能R50V为何是便携创作的首选?

    本文推荐五款便携半画幅相机,满足Vlog博主、旅行爱好者及家庭用户对高画质与轻便易携的双重需求。佳能R50V以323克超轻机身、APS-C传感器及竖拍优化功能脱颖而出,支持6K超采4K视频与USB直播供电,是视频创作者的理想选择。佳能R50性价比高,索尼ZV-E10专注实时追踪对焦,富士X-S20内置胶片模拟模式,尼康Z30操作简洁续航强。总结指出,佳能R50V完美平衡便携性、专业画质与创作便利,真正实现“融入生活,点亮创作”。

  • 逗哥配音团队:以硬核技术铺就AI创作未来,重塑短视频创作生态

    逗哥配音平台凭借AI语音技术革新,为短视频创作者提供全方位赋能。平台集成上千款覆盖多年龄风格的真人声音资源,支持多语言合成,具备媲美真人的情感表达能力。其核心功能包括AI角色分配、5秒极速克隆及20项精细调节工具,结合去水印、字幕生成等实用功能,实现一站式创作。已获超百位大V推荐,用户量破千万,累计播放量达十万亿级,显著降低创作门槛,助力各领域内容生产。团队将持续优化技术,拓展功能生态。

  • AI日报:广电整治AI动画乱象;360发布大模型安全白皮书;百度推出小度AI眼镜Pro

    国家广电总局宣布自2026年3月起全面整治AI生成内容,要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》,提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro,集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX,实现文本化语音编辑。Grok新增纯文本生成视频功能,17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠,并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型,优化开发者体验。

  • 佳能R50V双十一钜惠:漫展COS/汉服Vlog/直播带货一机搞定!

    佳能R50V微单相机以6000元内惊喜价格亮相双十一,配备全像素双核CMOS与智能对焦系统,支持人物/动物/车辆追踪。轻巧机身仅323克,优化握持设计便于外拍。具备6K超采4K录制、14种滤镜及美肤模式,竖拍界面完美适配短视频平台。USB直连实现4K60P直播供电,特写模式自动切换焦点,适合带货与教学。多档套餐覆盖从三脚架到专业滤镜,满足动漫COS、国风Vlog等多场景创作需求,是降低门槛提升品质的优选工具。

今日大家都在搜的词: