首页 > AI头条  > 正文

豆包视频生成功能升级 涵盖语义理解、动作连贯性等方面

2025-04-29 16:54 · 来源: AIbase基地

豆包宣布其视频生成功能进行了重大升级,这一消息迅速吸引了众多用户的关注。此次升级涵盖了语义理解、影调画质、风格类型以及动作连贯性等多个方面,显著提升了视频生成的质量和用户体验。

豆包表示,通过此次升级,用户可以生成更符合语义的视频内容,视频的影调和画质也更加细腻。此外,人物动作的连贯性得到了优化,视频生成的风格类型也更加多样化,包括彩铅风格、积木风格、黑白素描风格、像素风格和3D动画风格等,满足了不同用户的个性化需求。

微信截图_20250429165142.png

此次功能升级由豆包的视频生成模型——Seedance提供支持。用户现在可以通过打开豆包App对话框,选择“照片动起来”功能,或者在豆包电脑版及官方网站(doubao.com)上选择“视频生成”功能,输入文字或上传参考图,即可免费体验这一升级后的强大功能。

  • 相关推荐
  • QQ传文件功能升级,闪传功能便捷支持长假批量传图

    国庆假期临近,QQ推出“闪传”功能,解决大文件传输难题。单文件上限提升至10GB,支持批量发送与不限速传输,用户可生成链接或二维码直接分享至微信等平台,接收方无需登录QQ即可下载。该功能适用于旅行照片、婚礼影像快速分享,也便于办公人群传输设计稿、项目资料,实现跨平台无缝协作。测试期间获用户好评,摄影师称其大幅提升节日期间紧急交片效率。QQ持续优化核心功能,强化独特价值。

  • AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

    近日AI领域迎来多项重要更新:阿里夸克发布AI创作平台“造点”,整合通义万相Wan2.5与Midjourney V7,支持音画同步视频生成;Wan2.5-Preview实现多模态输入与电影级视频同步生成,提升视觉创作能力;可灵AI推出视频生成模型2.5Turbo并降价30%,降低使用门槛;阿里通义推出Qwen3-ASR-Toolkit,实现小时级音视频转录;谷歌相册AI编辑功能扩展至安卓用户,支持语音修图;谷歌Mixboard工具助力创意设计,生成情绪板;Qwen发布Qwen3-Max模型,在代码生成与智能体能力表现突出;Figma推出MCP服务器,实现设计到代码的一键转换,提升开发效率。

  • 全球首个!OpenAI将推“AI版抖音”:禁止上传实拍内容 视频100%由AI生成

    国庆假期前夕,OpenAI发布了Sora 2,一款旗舰视频和音频生成模型。 据介绍,Sora 2可以完成以前的视频生成模型难以完成的事情,比如运动员的奥林匹克体动作、桨板上的后空翻,准确模拟浮力和刚度的动态等等,并擅长现实主义、电影和动漫风格。 一则来自《连线》杂志的重磅爆料更是指出,OpenAI的下一步棋,并非简单升级一个模型,而是要亲自下场,推出一个独立的AI影�

  • 重新理解「会员模式」

    时至今日,「会员」在商业世界里已不是什么新鲜事。 电商有会员、商超有会员、品牌有会员、视频网站有会员、社交媒体有会员……无论是阿里、京东,还是美团,各家平台对于会员的投入越来越明显和坚决。但不得不承认的是,就像“看电影时所有观众全都站了起来”的“剧院效应”,普通用户对于会员的价值感却在下降。 当“加入会员”成为常态,会员好不好、值不�

  • 基于通义万相 美图多款APP上线全新动漫特效、AI变身等视频生成功能

    今日,美图公司旗下美图秀秀、RoboNeo、Wink和开拍等多款产品,推出全新动漫特效、AI变身等视频生成功能。 据悉,新功能基于通义万相系列模型进行深度开发与训练,为美图的全球用户提供全新的创作体验。 近年来,美图加速布局生产力场景,不仅推出面向企业的AI算法服务和解决方案,旗下消费级产品也在快速集成大模型。 去年6月,美图就开始和阿里展开大模型合作。

  • 如何正确理解Token经济学?

    去年5月,当大模型厂商卷起价格战时,Tokens大概率是出镜率最高的英文单词。 简单来说,Tokens是大语言模型(LLM)用来切割自然语言文本的基本单位,可以直观的理解为“字”或“词”。 就像工业时代用“千瓦时”度量电力消耗,互联网时代用“GB”度量数据流量,AI时代用“Token”来度量模型的工作量。一个Token可以理解为一个词或词片段(中文里可能是一个字或词语)。

  • 免费生成10秒高清视频!通义App接入通义万相2.5

    在2025云栖大会上,阿里发布通义万相Wan2.5 Preview系列模型,覆盖文生视频、图生视频、文生图和图像编辑四大功能。其视频生成模型首次实现音画同步,可生成匹配画面的人声、音效和BGM,时长从5秒提升至10秒,支持24帧/秒的1080P高清输出,降低影视级创作门槛。模型指令遵循能力增强,支持运镜等复杂连续变化控制。用户通过通义App输入指令即可自动生成10秒高清视频,每日免费使用15次,支持导出无水印视频。同时,图像生成能力全面升级,可生成中英文字符和图表,支持图像编辑功能,一句话即可完成P图。

  • 谁在视频号上,为短剧“买单”?

    ​短剧的风这下是真的吹到了视频号。 “00后帅气多金董事长爱上干保洁40岁离异的我”;“和自己闪婚的黄昏恋老伴,竟然是豪门。”……最近小编一打开手机随便刷一刷视频号,便能邂逅许多爆款“雷人”短剧。 前几天,就连金融反腐题材的《K线成长记》都火了,证券时报发的全集转发就突破1万+。 它们剧情够爽、反转够快,即便有的剧情夸张、逻辑欠缺,依旧赢得网友

  • 2025 世界设计之都大会“创意可计算性:设计人工智能”,特赞升级五大内容+AI解决方案

    2025年9月25日至28日,上海将举办世界设计之都大会(WDCC2025),主题为“设计无界,生生不息”。大会聚焦人工智能赋能设计创新,探讨设计如何驱动产业与城市可持续发展。特赞科技作为内容与AI领域代表企业,将展示“计算×创意”如何拓展设计生命力,包括跨行业赋能、产教融合及人机协作三大板块,呈现AI在打破学科边界、推动产业创新中的实践。WDCC2025旨在为全球设计领域注入新动能,构建“设计×科技×可持续”的新想象空间。

  • 小米非常非常缺人上热搜 雷军谈小米成功秘诀

    9月25日,小米创始人雷军发布“雷军请回答”Day3视频,回应网友提问并分享小米成功经验。雷军指出,小米15周年最重要的两件事是“找人”和“攒钱”,强调汇聚优秀人才与充足资金是成就大事的关键。针对长期坚守一线的疑问,他解释因公司成长迅速、人才紧缺,但近年通过内外招聘已缓解压力。雷军坦言小米模式新颖易被误解,但正以行动赢得认可;高端化进展虽快,成功尚早,将持续提升产品与服务。他还幽默回应失败经历,鼓励乐观面对挑战。当晚雷军年度演讲及小米17系列新机发布会同步举行,备受关注。

今日大家都在搜的词: