首页 > 业界 > 关键词  > Boximator最新资讯  > 正文

字节发布视频控制方式Boximator 比Runway运动笔刷更精确

2024-02-06 09:15 · 稿源:站长之家

站长之家(ChinaZ.com)2月6日 消息:字节研究院发布了一个名为Boximator的视频控制方式,看起来相当不错。这种控制方式允许用户选择需要运动的物体,并绘制其结束位置和运动路径,物体将严格按照用户绘制的位置和路径进行运动。与Runway的运动笔刷相比,Boximator可以更精确地控制物体的运动结束位置。

image.png

项目地址:https://top.aibase.com/tool/boximator

Boximator采用了硬性约束和软性约束两种约束机制。用户可以通过硬性约束选择视频中特定对象的条件帧,并通过这两种约束方式来指定该对象在未来画面中的位置、形状或运动轨迹。Boximator可以作为现有视频合成模型的一个附加组件。

在训练过程中,为了保留原模型的知识,研究院选择冻结了原始权重,只对控制模块进行训练。引入创新的自我追踪技术,简化了学习框选对象与其关联的过程。

实验证明,Boximator在视频质量方面达到了行业领先水平,相较于基础模型有所提升,并在引入框选约束后进一步增强了效果。人类评估显示,用户更喜欢Boximator生成的视频效果,而不是基础模型的输出。

举报

  • 相关推荐
  • 苹果官网更新:三款MacBook被列为过时产品

    今天苹果官网过时产品名单中新增了三款Mac电脑,具体如下。 MacBook Air(11英寸,2015款) MacBook Pro(13英寸,2017款,配备4个雷雳3端口) MacBook Pro(15英寸,2017款) 据悉,某款设备自苹果停止分销之日起超过7年,便会被归为过时产品”,苹果零售店及苹果授权服务提供商通常不维修过时产品,但苹果表示,MacBook在停止分销后长达10年内仍可能符合电池更换条件,具体取决于

  • AI日报:阿里开源Qwen-Image-Edit;淘宝“AI万能搜”功能灰度测试;小红书发布DynamicFace人脸生成技术

    本期AI日报聚焦多项AI领域创新:1)阿里开源Qwen-Image-Edit图像编辑模型,支持中文渲染与精准文本编辑;2)淘宝测试"AI万能搜"功能,重构电商搜索体验;3)小红书发布DynamicFace人脸生成技术,实现高质量图像视频换脸;4)Gemini API新增URL Context功能,简化网页内容获取流程;5)Nvidia推出小型开放模型Nemotron-Nano-9B-v2,支持智能推理开关;6)马斯克发布Grok Imagine 0.1测试版,进军AI图像生成领域;7)Vercel推出iOS版AI开发工具v0;8)理想汽车发布MindGPT 3.1模型,处理速度提升5倍;9)ToonComposer工具简化动画制作流程;10)ElevenLabs推出视频到音乐生成流程。

  • B站要变成AI站

    互联网平台都在跟AI结合,B站没有成为例外。从新一季度财报来看,B站的AI味儿也越来越浓了。 8月21日,B站公布第二季度业绩,总营收达73.4亿元人民币,同比增长20%。其中,游戏业务收入为16.1亿元,同比增长60%,广告业务收入为24.5亿元,同比增长20%。由此推动B站毛利率从去年同期的29.9%提升至36.5%,调整后净利润达到5.6亿元,创下历史最好成绩。 从整体来看,B站生态集聚

  • Matrixport 受邀出席 Bitcoin Asia 2025,共议机构投资新趋势

    Bitcoin Asia 2025峰会将于8月28-29日在香港举行,由BTC Media主办。预计吸引超1.5万名与会者,涵盖主题演讲、圆桌讨论及展览等活动,突显香港在全球数字资产领域的战略地位。会议将探讨亚太市场潜力、机构化进程及多元化投资机会,并邀请200余位全球重量级嘉宾参与。Matrixport作为亚洲领先加密金融服务平台,将持续推动资产数字化及Web3基础设施落地,助力行业创新与发展。

  • 智检未来 触手可及——CASIVIBOT工业质检机器人震撼发布

    8月19日,中科慧远发布首款工业具身质检机器人CASIVIBOT,以“具身智能”为核心,融合人类质检经验与AI技术,实现灵活操作与高效检测。该机器人采用“手-眼-脑”协同架构,支持多行业复杂场景应用,具备快速部署和持续进化能力,旨在推动工业质检智能化升级,提升检测效率与灵活性。

  • 史上最大Mate!华为智慧屏MateTV将于9月4日发布

    华为终端官方微博近日宣布,备受瞩目的首款华为智慧屏MateTV将于9月4日14:30正式亮相,这款被誉为“华为史上最大Mate”的新品,无疑将再次引领智慧屏领域的创新潮流。 早在8月20日,华为便举办了2025华为智慧屏MateTV新品技术发布会,提前揭秘了MateTV的多项创新技术,引发了业界和消费者的广泛关注。此次发布的MateTV,首次将手机端成熟的界面交互引入大屏场景,其“鸿蒙追

  • 剪辑师的移动工作站!荣耀MagicBook Pro 14酷睿U9版:4K剪辑无压力

    荣耀MagicBook Pro14酷睿U9-285H版在轻薄与性能间实现完美平衡。搭载英特尔酷睿Ultra 9 285H处理器和锐炫Arc 140T核显,多核性能强劲,视频剪辑流畅高效。配备32GB大内存和高速硬盘,支持复杂多任务处理。14.6英寸3.1K OLED屏幕色彩精准,散热系统优秀,续航长达12小时,适合移动办公和专业创作。

  • AI最新资讯在哪里看?AIbase:高效获取国内外AI新闻头条与行业动态

    文章探讨了AI时代信息过载的困境:有价值的前沿动态、重磅模型发布和行业解读分散各处,筛选成本高、效率低下。AIbase资讯导航站应运而生,通过四大核心功能解决痛点:1)聚合主流信源,过滤低质噪音;2)结构化分类呈现大模型动态、行业应用等六大板块;3)提炼核心要点,拒绝标题党;4)高频更新确保信息鲜度。该平台致力于成为AI领域的"信息雷达",帮助用户节省70%信息搜集时间,将精力聚焦于思考与创造。适用于技术负责人快速掌握行业动态、产品经理调研案例、投资人捕捉趋势等多元场景。

  • 中国UP主成为不了MrBeast

    影视飓风创始人Tim刚刚结束的“100小时荒岛直播挑战”,无疑是一次B站在这个夏天难得的现象级事件——B站累计超过四千万观众进入直播间,全平台总观看量超过两亿,弹幕数以百万计,甚至带动了直播带货的即时转化。 从数据到热搜,此次直播堪称完美演绎了“爆款”的逻辑。 质疑声同样随之而来:这场直播与其说是“荒岛生存”,不如说是“带电度假”;也评论认为,它

  • OpenAI的开源模型现已在IBM watsonx.ai上提供

    OpenAI发布两款开源AI模型GPT-OSS-120B和GPT-OSS-20B,允许开发者自由下载、运行和定制。其中120B模型已部署在IBM Watsonx.ai平台,采用专家混合架构,支持本地或云端部署,不受商业用途限制。模型具备高透明度,输出完整推理链,在多项基准测试中表现优异。此次发布标志着OpenAI首次加入开源生态,IBM强调其开放战略,为企业提供灵活、安全的AI开发选择。

今日大家都在搜的词: