豆包视频生成功能升级涵盖语义理解、动作连贯性等方面

2025-04-29 16:54 · 来源： AIbase基地

豆包宣布其视频生成功能进行了重大升级，这一消息迅速吸引了众多用户的关注。此次升级涵盖了语义理解、影调画质、风格类型以及动作连贯性等多个方面，显著提升了视频生成的质量和用户体验。

豆包表示，通过此次升级，用户可以生成更符合语义的视频内容，视频的影调和画质也更加细腻。此外，人物动作的连贯性得到了优化，视频生成的风格类型也更加多样化，包括彩铅风格、积木风格、黑白素描风格、像素风格和3D动画风格等，满足了不同用户的个性化需求。

微信截图_20250429165142.png

此次功能升级由豆包的视频生成模型——Seedance提供支持。用户现在可以通过打开豆包App对话框，选择“照片动起来”功能，或者在豆包电脑版及官方网站（doubao.com）上选择“视频生成”功能，输入文字或上传参考图，即可免费体验这一升级后的强大功能。

相关推荐

QQ传文件功能升级，闪传功能便捷支持长假批量传图

国庆假期临近，QQ推出“闪传”功能，解决大文件传输难题。单文件上限提升至10GB，支持批量发送与不限速传输，用户可生成链接或二维码直接分享至微信等平台，接收方无需登录QQ即可下载。该功能适用于旅行照片、婚礼影像快速分享，也便于办公人群传输设计稿、项目资料，实现跨平台无缝协作。测试期间获用户好评，摄影师称其大幅提升节日期间紧急交片效率。QQ持续优化核心功能，强化独特价值。

大文件传输 QQ闪传功能国庆假期
荐AI日报：接入MJ！夸克发布造点AI；Wan2.5-Preview发布；可灵推最新视频生成模型可灵2.5Turbo

近日AI领域迎来多项重要更新：阿里夸克发布AI创作平台“造点”，整合通义万相Wan2.5与Midjourney V7，支持音画同步视频生成；Wan2.5-Preview实现多模态输入与电影级视频同步生成，提升视觉创作能力；可灵AI推出视频生成模型2.5Turbo并降价30%，降低使用门槛；阿里通义推出Qwen3-ASR-Toolkit，实现小时级音视频转录；谷歌相册AI编辑功能扩展至安卓用户，支持语音修图；谷歌Mixboard工具助力创意设计，生成情绪板；Qwen发布Qwen3-Max模型，在代码生成与智能体能力表现突出；Figma推出MCP服务器，实现设计到代码的一键转换，提升开发效率。

AI创作平台通义万相音画同步
全球首个！OpenAI将推“AI版抖音”：禁止上传实拍内容视频100%由AI生成

国庆假期前夕，OpenAI发布了Sora 2，一款旗舰视频和音频生成模型。据介绍，Sora 2可以完成以前的视频生成模型难以完成的事情，比如运动员的奥林匹克体动作、桨板上的后空翻，准确模拟浮力和刚度的动态等等，并擅长现实主义、电影和动漫风格。一则来自《连线》杂志的重磅爆料更是指出，OpenAI的下一步棋，并非简单升级一个模型，而是要亲自下场，推出一个独立的AI影�

OpenAI Sora 2
荐重新理解「会员模式」

时至今日，「会员」在商业世界里已不是什么新鲜事。电商有会员、商超有会员、品牌有会员、视频网站有会员、社交媒体有会员……无论是阿里、京东，还是美团，各家平台对于会员的投入越来越明显和坚决。但不得不承认的是，就像“看电影时所有观众全都站了起来”的“剧院效应”，普通用户对于会员的价值感却在下降。当“加入会员”成为常态，会员好不好、值不�

会员模式商业结构用户粘性
基于通义万相美图多款APP上线全新动漫特效、AI变身等视频生成功能

今日，美图公司旗下美图秀秀、RoboNeo、Wink和开拍等多款产品，推出全新动漫特效、AI变身等视频生成功能。据悉，新功能基于通义万相系列模型进行深度开发与训练，为美图的全球用户提供全新的创作体验。近年来，美图加速布局生产力场景，不仅推出面向企业的AI算法服务和解决方案，旗下消费级产品也在快速集成大模型。去年6月，美图就开始和阿里展开大模型合作。

美图秀秀 AI变身通义万相
荐如何正确理解Token经济学？

去年5月，当大模型厂商卷起价格战时，Tokens大概率是出镜率最高的英文单词。简单来说，Tokens是大语言模型（LLM）用来切割自然语言文本的基本单位，可以直观的理解为“字”或“词”。就像工业时代用“千瓦时”度量电力消耗，互联网时代用“GB”度量数据流量，AI时代用“Token”来度量模型的工作量。一个Token可以理解为一个词或词片段（中文里可能是一个字或词语）。

大模型 Tokens 自然语言处理
免费生成10秒高清视频！通义App接入通义万相2.5

在2025云栖大会上，阿里发布通义万相Wan2.5 Preview系列模型，覆盖文生视频、图生视频、文生图和图像编辑四大功能。其视频生成模型首次实现音画同步，可生成匹配画面的人声、音效和BGM，时长从5秒提升至10秒，支持24帧/秒的1080P高清输出，降低影视级创作门槛。模型指令遵循能力增强，支持运镜等复杂连续变化控制。用户通过通义App输入指令即可自动生成10秒高清视频，每日免费使用15次，支持导出无水印视频。同时，图像生成能力全面升级，可生成中英文字符和图表，支持图像编辑功能，一句话即可完成P图。

通义万相文生视频图生视频
荐谁在视频号上，为短剧“买单”？

短剧的风这下是真的吹到了视频号。 “00后帅气多金董事长爱上干保洁40岁离异的我”;“和自己闪婚的黄昏恋老伴，竟然是豪门。”……最近小编一打开手机随便刷一刷视频号，便能邂逅许多爆款“雷人”短剧。前几天，就连金融反腐题材的《K线成长记》都火了，证券时报发的全集转发就突破1万+。它们剧情够爽、反转够快，即便有的剧情夸张、逻辑欠缺，依旧赢得网友

短剧视频号爆款
2025 世界设计之都大会“创意可计算性：设计人工智能”，特赞升级五大内容+AI解决方案

2025年9月25日至28日，上海将举办世界设计之都大会（WDCC2025），主题为“设计无界，生生不息”。大会聚焦人工智能赋能设计创新，探讨设计如何驱动产业与城市可持续发展。特赞科技作为内容与AI领域代表企业，将展示“计算×创意”如何拓展设计生命力，包括跨行业赋能、产教融合及人机协作三大板块，呈现AI在打破学科边界、推动产业创新中的实践。WDCC2025旨在为全球设计领域注入新动能，构建“设计×科技×可持续”的新想象空间。

世界设计之都大会设计无界设计人工智能
小米非常非常缺人上热搜雷军谈小米成功秘诀

9月25日，小米创始人雷军发布“雷军请回答”Day3视频，回应网友提问并分享小米成功经验。雷军指出，小米15周年最重要的两件事是“找人”和“攒钱”，强调汇聚优秀人才与充足资金是成就大事的关键。针对长期坚守一线的疑问，他解释因公司成长迅速、人才紧缺，但近年通过内外招聘已缓解压力。雷军坦言小米模式新颖易被误解，但正以行动赢得认可；高端化进展虽快，成功尚早，将持续提升产品与服务。他还幽默回应失败经历，鼓励乐观面对挑战。当晚雷军年度演讲及小米17系列新机发布会同步举行，备受关注。

雷军小米人才招聘

今日大家都在搜的词：

热文

3 天
7天

豆包视频生成功能升级涵盖语义理解、动作连贯性等方面

QQ传文件功能升级，闪传功能便捷支持长假批量传图

荐AI日报：接入MJ！夸克发布造点AI；Wan2.5-Preview发布；可灵推最新视频生成模型可灵2.5Turbo

全球首个！OpenAI将推“AI版抖音”：禁止上传实拍内容视频100%由AI生成

荐重新理解「会员模式」

基于通义万相美图多款APP上线全新动漫特效、AI变身等视频生成功能

荐如何正确理解Token经济学？

免费生成10秒高清视频！通义App接入通义万相2.5

荐谁在视频号上，为短剧“买单”？

2025 世界设计之都大会“创意可计算性：设计人工智能”，特赞升级五大内容+AI解决方案

小米非常非常缺人上热搜雷军谈小米成功秘诀

今日大家都在搜的词：

热文

雷军：小米17系列开售仅5天销量破100万台

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息

雷军：小米17系列首销权益延续至10月31日

理想汽车推出焕新版L系限时优惠 10 月 8 日前享1.5万置换补贴

比特币价格突破12.5万美元刷新历史最高纪录

小米回应“小米汽车突然自己开走”：排除车辆质量问题

小米17 1TB版明日开售售价5299元

乔布斯逝世14周年库克发文缅怀：我们深切怀念你

雷军：小米17系列开售仅5天销量破100万台

腾讯混元图像3.0登顶LMArena榜一

小米 17 标准版1TB版本 5299 元开售全系列销量同比增超20%

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息

雷军：小米17系列首销权益延续至10月31日

站长商机

豆包视频生成功能升级 涵盖语义理解、动作连贯性等方面

今日大家都在搜的词：

热文

站长商机

豆包视频生成功能升级涵盖语义理解、动作连贯性等方面