首页 > 业界 > 关键词  > 正文

商汤科技提出Story-to-Motion:从长文本生成人体运动轨迹

2023-11-22 10:55 · 稿源:站长之家

要点:

  • 人工智能在动画、游戏和电影领域的应用中,从长篇文本中生成自然人类运动是一个复杂而困难的任务。研究团队提出了一种新的方法,通过三个主要组件,即文本驱动的运动调度、文本驱动的运动检索系统和渐进式掩蔽变换器,成功解决了这一挑战。

  • 提出的方法通过引入轨迹和语义,能够从长篇文本中生成全面的运动,从而解决了“故事到运动”问题。特别地,文本驱动的运动匹配为准确、可定制的运动合成提供了新方法。在多个子任务上的实验证明,该方法在轨迹跟踪、时间动作组合和运动混合方面优于现有技术。

  • 该系统代表了从文本叙述中合成人类运动的重大进展,将在动画、游戏和电影行业产生深远的影响。它为“故事到运动”任务提供了全面解决方案,具有改变行业格局的潜力。

站长之家(ChinaZ.com)11月22日 消息:人工智能正逐渐渗透到各行各业,其中一项重要的进展是通过长篇文本生成自然人类运动,这在动画、游戏和电影等领域具有巨大潜力。然而,从文本到运动的转化一直是一个巨大挑战,尤其是在处理角色在不同区域移动和执行特定动作时。

尽管过去已经付出了大量努力来研究文本到运动和角色控制,但迄今为止尚未找到合适的解决方案。现有的角色控制方法存在许多限制,无法处理文本描述,而当前的文本到运动方法则需要更多的位置约束,导致生成不稳定的运动。

image.png

项目地址:https://story2motion.github.io/

为了应对这些挑战,研究团队提出了一种独特的方法,该方法通过三个关键组件解决了“故事到运动”的问题。首先是文本驱动的运动调度,它利用现代大型语言模型从长篇文本中提取文本、位置和持续时间对,作为文本驱动的运动调度器,确保生成的运动基于故事并包含有关每个动作的位置和长度的详细信息。

其次是文本驱动的运动检索系统,通过将运动匹配和对运动轨迹和语义的约束相结合,创建了一个全面的运动检索系统,确保生成的运动满足预期的语义和位置属性以及文本描述。最后是渐进式掩蔽变换器,它专门设计用于处理过渡运动中的常见伪影,如脚滑动和不寻常的姿势,以提高生成运动的质量,产生更平滑的过渡和更真实的外观。

这一方法经过了在运动混合、时间动作组合和轨迹跟踪等三个子任务上的测试,结果显示在每个领域都优于先前的运动合成技术。

研究人员总结了他们的主要贡献,包括引入轨迹和语义以从长篇文本生成全面的运动,提出了一种新方法——基于文本的运动匹配,以提供准确和可定制的运动合成,并在轨迹跟踪、时间动作组合和运动混合子任务上的实验证明其优于现有技术。

总的来说,这个系统标志着从文本叙述中合成人类运动的一大步前进。它不仅为“故事到运动”任务提供了完整的解决方案,还在动画、游戏和电影等行业中具有革命性的影响。这项研究的成果为人工智能技术在创意产业中的应用开辟了新的可能性,有望为相关领域带来巨大的发展。

举报

  • 相关推荐
  • Staycation风潮来了:在酒店里躺平,比旅游更治愈

    “在酒店吹空调、吃西瓜、躺着追剧,不比在30℃的景点人挤人更香?” 刚刚过去的端午三天假期,时间不够远游,却刚好适合“逃离日常”。越来越多年轻人瞄准当地的高端酒店,开启“微度假”新姿势——Staycation。 Staycation是“Stay”(停留)和“Vacation”(假期)的结合,指的是假期或周末留在当地或附近城市住酒店放松。对于不想折腾、不愿赶车赶景点的年轻人来说,这种

  • 曝iPhone17配备120Hz屏 但不支持ProMotion自适应刷新率

    与固定刷新率相比,ProMotion自适应刷新率具有明显优势。它可以根据不同场景动态调整屏幕刷新率,从而带来更佳的使用体验。 此外,爆料还提及iPhone17标准版将搭载苹果A18芯片,并配备8GB内存。这些规格参数与iPhone16保持一致,这也使得iPhone17成为苹果近年来唯一一款没有升级处理器的标准版机型。

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • 最高网络安全标准,追觅扫地机获UL Solutions钻石级安全认证

    追觅X50系列扫地机器人获得UL Solutions颁发的"钻石级网络安全认证证书",成为全球首个获此认证的扫地机器人品牌。该认证表明产品在设备端防护、应用层数据加密、云端数据管理等全链路安全体系均达到国际最高标准。追觅还获得TÜV南德消费类物联网安全认证,构建起完善的安全防护体系。这些认证不仅验证了追觅产品的网络安全性能,更彰显了其在智能清洁赛道的核心竞争力。随着物联网安全要求提高,追觅构建的"全链路安全解决方案"或将成为行业重要参考,推动智能家居产业安全标准升级。

  • 极光GPTBots成功完成“生成式人工智能服务登记”

    极光旗下AI开发平台GPTBots.ai近日在广东省网信部门完成生成式人工智能服务登记,成为合规经营的AI服务提供商。该平台严格遵循国家《互联网信息服务深度合成管理规定》和《生成式人工智能服务管理暂行办法》等法规要求,标志着其在技术创新、服务模式和数据安全等方面获得关键合规认可。此次登记体现了极光对法律法规的严格遵守和对安全责任的高度重视,为区域AI生态发展注入新活力。未来,极光将继续优化技术与服务,保障用户权益,推动生成式AI技术的健康规范发展。

  • 2025 AI科技小巨人TOP50揭晓:Testin云测、Deepseek、宇树科技等入选

    6月11日,中国科学院主管的《互联网周刊》发布"2025AI科技小巨人TOP50"榜单,Testin云测作为唯一AI测试服务商入选。该榜单聚焦AI全产业链应用场景,覆盖大模型、芯片、测试、风控、机器人等领域。Testin云测凭借AI重构测试流程的创新实践,通过智能工具助力企业质效升级,其行业领先性获业界认可。CEO徐琨表示将持续优化AI测试工具,推动软件测试智能化发展。当前AI测试技术呈现三大跃迁:自动化深度提升、测试周期缩短、质量管控智能化。数据显示,先进AI测试方案已实现人效提升1.5倍以上。Testin云测旗下XAgent系统深度融合生成式AI技术,在金融、汽车等领域提供全链路智能测试解决方案,构建覆盖开发、测试、运维的全生命周期质量保障体系。随着AI技术发展,测试正从成本中心转型为价值创新引擎,重新定义软件质量维度。

  • 如何用DeepSeek生成高质量的竞品SWOT分析报告

    本教程介绍如何利用DeepSeek AI工具快速生成电商平台供应链SWOT分析报告。以京东vs拼多多为例,通过输入指定指令,AI可自动生成包含优势、劣势、机会和威胁四个维度的结构化分析报告,重点突出两者供应链能力差异。操作流程包括:1)登录DeepSeek官网进入对话界面;2)输入SWOT分析指令;3)获取AI生成结果。该方法能显著提升商业分析效率,建议结合最新行业数据对报告进�

  • 问界M9新一轮OTA升级黑科技:自动过ETC,智驾效率飙升

    问界M9通过最新OTA升级实现智能化新突破,重点优化五大核心体验:1. 首创"高速收费站智驾领航辅助",支持ETC自动缴费全流程;2. 实现"车位到车位"全场景无接管智能驾驶;3. 新增"小蓝灯"智能驾驶状态提示系统;4. 配备卫星通信应急保障功能;5. 升级后排悬浮窗等豪华配置。此次升级覆盖30余项功能优化,显著提升通行效率与安全性,重新定义智能出行标准,展现华为鸿蒙智行在智能驾驶领域的领先实力。

  • 锚定运动人群 iRest艾力斯特按摩椅打造运动康复新方案

    iRest艾力斯特按摩椅作为中国按摩器具行业领先品牌,积极拓展运动康复领域。其创新亮点包括:1. 接入Deepseek AI智能助手,实现个性化按摩方案推荐;2. 与美国运动科学院院士朱为模合作开发专业运动康复程序;3. 与温州医科大学开展多项临床研究,验证按摩椅在消除乳酸、缓解肌肉疲劳等方面的显著效果;4. 与华为运动健康APP数据互通,实现"运动-监测-康复"全链路智能化;5. 引入脑机接口技术,通过生物信号感知实现动态按摩调节。这些创新使产品突破传统按摩局限,为运动康复带来智能化新体验。

  • 数势科技凭SwiftAgent获评 IDC「数据管理分析与生成式AI」中国代表厂商

    IDC最新报告显示,数据管理分析与生成式AI应用呈现四大技术趋势:数据分析平台、数据平台、决策自动化和数据流管理。59%企业计划在2025年前投资自动化基础设施和AI解决方案。数势科技自主研发的SwiftAgent 3.0智能分析平台,通过实时数据洞察、异常预警和智能策略建议,构建"分析-决策-行动"闭环,显著提升企业响应速度。该平台整合企业知识库和历史数据,提供可�