首页 > AI头条  > 正文

豆包视频生成模型Seedance 1.0 pro上线首尾帧能力

2025-10-23 09:27 · 来源: AIbase基地

火山引擎正式上线了豆包视频生成模型1.0pro(Doubao-Seedance-1.0-pro)的首尾帧能力,这一更新标志着AI视频创作在可控性和一致性方面迈出了重要一步。Seedance1.0pro凭借复杂场景主体一致性、大幅运动的物理合理性以及视频节奏智能推理等技术优势,将大幅提升生成视频的主角跟随效果,实现精准叙事引导,生成更具沉浸感及表现力的视频作品。

企业用户可以通过火山方舟调用Seedance1.0pro API体验该模型的首尾帧能力,而个人用户则可以在“火山方舟体验中心”直接体验。这一能力的推出,不仅为专业影像创作者提供了强大的工具,也为普通用户开启了AI视频创作的新大门。

字节跳动抖音豆包大模型

Seedance1.0pro的首尾帧能力在影视叙事中发挥了重要作用。其核心优势在于能够通过增强对“叙事主体”的结构化认知,锁定核心角色特征,在动态生成过程中维持物理逻辑与视觉呈现的双重一致性。例如,在复杂场景中,模型能够精准识别人脸作为“生成锚点”,保持主体不畸变、不漂移,过渡帧高度平滑,并完成微表情的精准呈现。此外,在复杂的镜像场景中,如镜子、水面、玻璃等反射画面里,Seedance1.0pro也能准确还原主体细节。

在大幅运动的场景中,Seedance1.0pro能够精准捕捉人体运动轨迹,保持动作连贯合理,呈现真实物理运动规律。无论是小男孩的奔跑、翻越、跳海等大幅度动作,还是人物群像场景中多人的不同动作,模型都能确保动作方向清晰、逻辑合理,共同服务于整体叙事。

Seedance1.0pro还具备深度语义理解能力,能够让视频整体节奏的起承转合自然流畅。例如,在墙壁突然破裂、大量海水涌入船舱时,水流的撞击翻涌既符合物理逻辑,与箱子的碰撞衔接也符合视频节奏的变化。

火山引擎的这一创新不仅推动了AI视频创作的发展,也为创作者提供了无限的视角和创意空间。

  • 相关推荐
  • M6 iPad Pro将加入VC散热:向iPhone 17 Pro看齐

    随着芯片性能的不断提升,苹果计划为iPad Pro配备VC散热系统,消费者最快会在M6 iPad Pro上看到。 Mark Gurman指出,如果iPhone与iPad Pro配备VC散热系统的尝试取得成功,苹果后续可能会将该技术应用到MacBook Air等其他被动散热设备上。 目前苹果对iPad Pro的更新周期约为18个月,因此下一代iPad Pro预计将在2027年春季发布。

  • 全新开源的DeepSeek-OCR,可能是最近最惊喜的模型。

    ​AI圈虽然天天卷,但是很多的模型,真的越来越无聊了。 每天就是跑分又多了几个点。 直到昨天,DeepSeek久违的发了一个新模型。 DeepSeek-OCR。 这玩意,是真的有点酷。

  • DeepSeek开源3B OCR模型:长文本识别达97%精度

    DeepSeek在GitHub开源新一代OCR模型,采用创新光学二维映射压缩技术,在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌,较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率,显著优于同类模型。该技术路径为OCR系统小型化提供解决方案,其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

  • 升级版“蓝心小V”亮相,豆包大模型助力vivo打造AI原生体验

    vivo发布全新OriginOS 6系统,升级私人助手“蓝心小V”。该系统依托蓝心大模型与豆包大模型协同,实现精准意图识别与多模态交互,支持新闻、教育、天气等场景的智能问答。通过火山引擎联网搜索及内容整合,提供低延迟、高情感语音响应。同时拓展无障碍服务,为视障用户提供实时视觉辅助。未来将持续深化AI生态建设,打造更智能便捷的原生体验。

  • AI日报:微软发布首款自研图像生成模型 MAI-Image-1;百度世界大会时间公布;AI大牛开源nanochat教学工具

    微软发布首款自研图像生成模型MAI-Image-1,跻身LMArena前十,注重实用性与光影效果;百度世界2025大会将聚焦大模型与AI全球化战略;Meta新技术使RAG推理速度提升30倍;开源项目nanochat实现低成本构建聊天AI;谷歌NotebookLM新增动漫视频生成功能;中国农大发布神农大模型3.0助力智慧农业;腾讯启动"青云奖学金"培养AI人才;苹果FS-DFM模型长文本生成效率提升128倍;谷歌Lens整合AI图像编辑功能;港大与美团提出CodePlot-CoT方法,通过代码绘图解决数学难题,性能提升21%。

  • 豆包们,开始“上链接”

    豆包,开始“带货”了。 近期有用户发现,在和豆包对话时,其回复中嵌入了抖音商城的商品链接,尤其是涉及消费类话题时,出现频次不低。不止豆包,腾讯元宝、文小言、Kimi等这类C端用户高频使用的智能助手类工具,也都在默默“上链接”。国外的ChatGPT更是与沃尔玛展开合作,用户能直接在聊天界面内完成下单支付。 从回答问题到推荐商品,这意味着AI工具正在迎来�

  • 当贝 D7X Pro 新品投影发布,和 D6X Pro 区别大吗?

    当贝D7X+Pro投影仪作为D6XPro升级款,在光源、光学设计、核心性能等方面全面优化:搭载全新QuaLas三色激光光源,色彩更纯净;新增0.98-1.3:1无损光学变焦,小空间灵活适配;升级MT9681芯片与3+64GB存储,运行更流畅;支持DynamicX深黑算法与HDR Vivid解码,画面对比度达20000:1;新增米家生态联动,语音控制智能设备。适合追求4K画质、灵活安装及智能家居联动的用户。

  • 苹果藏了一手!M5 MacBook Pro隐形升级:SSD速度提升211%

    苹果在前不久正式推出了新款M5 MacBook Pro,不过在外观上缺乏明显变化,可能给人留下了苹果只是升级了M5芯片就完事”的印象。 然而最新的测试显示,其固态硬盘速度也有着大幅提升,对比M4 MacBook Pro,读写速度最高竟提升了211%。 根据Max Tech的对比测试,M5和M4 MacBook Pro在内部布局、单风扇和单热管散热方案上保持一致,都采用了两颗NAND闪存芯片以最大化SSD性能。 不过,在

  • 向AI构建能力,用模型产出价值,让金融优质发展

    2025年云栖大会在杭州举行,聚焦“云智一体+碳硅共生”主题,展现中国前沿科技生命力。阿里云智能集团副总裁张鹰介绍,“通义点金”平台全新升级,致力于构建金融行业垂直模型,打造具备业务洞察力的“专家级智能体”。核心突破包括:通过飞轮平台实现模型与业务双向螺旋上升,构建可观测、可评测、可迭代能力;赋予模型“自知之明”,精准调用工具并内化人类逻辑思维;建立多层次交叉验证测评体系,确保金融级严谨性。未来将持续推动通用模型与金融专业知识的有机结合,助力金融业务核心效能提升。

  • 行业首款可感知呼吸的空调!海尔麦浪舒适风Pro天猫上市

    今年1-9月,海尔空调线上销售增长强劲,天猫平台销量同比增长32%。10月25日,海尔推出可感知呼吸的麦浪舒适风Pro系列,通过UWB雷达精准感知人体呼吸,实现"人近风柔、人离节能"。产品采用多维送风技术适配不同卧室布局,支持AI语音操控,具备极端天气稳定运行能力。该系列以用户需求为核心,推动空调从功能升级转向智慧生活体验,重新定义"好空气"标准。

今日大家都在搜的词: