首页 > 业界 > 关键词  > 抖音最新资讯  > 正文

字节跳动放大招!OmniHuman数字人模型即将上线:一张图+一段音频即可生成视频

2025-02-07 19:34 · 稿源: 快科技

AI视频生成新突破:只需图片和音频,即可轻松制作生动短片!

科技界传来激动人心的消息!近期,抖音旗下图片视频工具即梦AI宣布即将推出令人惊叹的新功能。

这款全新功能采用了先进的多模态视频生成模型 OmniHuman为创作者带来了前所未有的便利。只需提供一张图片和一段音频,该模型就能生成一条栩栩如生的 AI 视频,大幅提升视频制作的效率和质量。

OmniHuman 技术主页透露,该模型由字节跳动自主研发,支持输入各种尺寸的图片,包括肖像、半身和全身。根据输入的音频,OmniHuman 可自动生成人物与其匹配的动作,包括演讲、演唱、演奏乐器和移动。

对于人物视频生成中的常见问题,如手势崩坏,OmniHuman 也做出了显著的改进。此外,该模型还支持输入动漫和 3D 卡通等非真人图片,并能保持原有的风格和动作。

从展示的演示效果来看,OmniHuman 的生成效果令人印象深刻,具有较高的自然度。为了防止该技术被滥用,字节跳动技术团队特别强调,OmniHuman 将不会对外提供下载。

即梦 AI 相关负责人透露,OmniHuman 目前已具备不俗的表现,但生成影视级别视频仍有提升空间。搭载 OmniHuman 的多模态视频生成功能将首先在即梦上进行小范围测试,并逐步开放。

该负责人还表示,即梦将对该功能实施严格的安全审核机制,并在输出视频上标注水印以提醒用户。此举旨在确保 AI 技术发挥积极作用,帮助视频创作者充分发挥想象力。

举报

  • 相关推荐
  • 字节跳动公布核心人才观 称用人看潜力不看资历

    昨日,字节跳动公布六大人才观。字节跳动表示,自创业之初便坚信人才是公司成功的关键要素,秉持“和优秀的人,做有挑战的事”的理念吸引众多人才加入。 公司认为,随着业务复杂度提升,保持优秀人才密度大于业务复杂度是组织有效运行的关键,更倾向于通过优秀人才的创新意愿和能力来应对挑战,而非单纯依赖增加规则和管理措施。 字节跳动鼓励人才在工作中大�

  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • 为何都愿去大厂!字节跳动福利让网友羡慕:100元餐标的免费三餐等

    为什么这多人想去互联网大厂呢,说到底还是福利待遇更好。 近日,有网友晒出了字节跳动的员工福利,其中就包含了100元餐标免费三餐”这一项。从内容看,早餐大概是20元左右标准,提供的种类非常的丰富,比如豆浆油条、广式虾饺烧麦、西式三明治等,搭配水果、坚果及奶制品。 至于午/晚餐(主餐标)内容更为丰富,涵盖酸菜鱼、辣子鸡、糖醋排骨等荤菜,日式寿司�

  • 华为影像放大招!Pura 80支持实时拍摄调色:新手也能拍大片

    华为Pura 80系列将于6月10日发布,作为主打影像的旗舰,华为已连续多日为新机影像功能预热。 今日,华为终端官微发布Pura 80系列最新预热短片,展示了影像另一个大招实时配色调色。 从短片可以看出,Pura 80系列在拍摄时可实时查看滤镜成片效果,拍摄画面依次切换至胶片风、电影风、动漫风。 视频中不同风格的数字编号不断变化,似乎也在暗示华为Pura 80将支持滤镜自定�

  • AI日报:腾讯混元3D 2.1大模型开源;字节跳动AI Lab负责人李航卸任;OpenAI Codex 全新升级

    本文介绍了AI领域最新动态:1)腾讯开源混元3D2.1大模型,提升3D生成质量;2)OpenAI Codex升级,优化代码生成功能;3)字节跳动AI Lab负责人李航卸任;4)微软发布700个AI应用案例;5)微软推出Code Researcher工具,解决58%系统崩溃问题;6)Observer AI实现屏幕操作自动化;7)Genspark发布AI浏览器;8)麻省理工用AI技术3.5小时修复15世纪名画;9)蚂蚁集团推出开源多模态GPT-4o模型Ming-Omni;10)MagicTryOn视频换衣框架;11)字节跳动发布实时互动AI视频生成模型Seaweed APT2;12)ChatGPT搜索功能升级;13)字节跳动与老凤祥合作开发AI智能眼镜。

  • 1年存10万太容易!35岁女生晒在字节跳动一天花销上热搜:福利好到让网友羡慕

    国内互联网大厂的福利有多好,近日35岁女生晒在字节跳动一天花销被挤上了热搜。 从这位女生分享的视频可以看到,除了自己早上去公司乘坐的地铁(4元)和买的2瓶饮料(2.7元)外,一天基本没有花钱的地方。 这位女生期间早、中、晚三顿的餐食都是公司提供,不但种类繁多,而且不收取任何费用,看得让人羡慕不已。

  • 豆包大模型1.6发布:全球第一梯队!可生成1080p高品质视频

    字节跳动旗下豆包大模型正式升级为1.6版,在推理、数学、指令遵循、Agent等方面的能力均有较大提升,同时豆包视频生成模型Seedance 1.0 pro、豆包语音播客模型也正式发布。 豆包大模型1.6包括三部分,分别是豆包1.6、豆包1.6-thinking、豆包1.6-flash。 其中,豆包1.6支持on/off/auto三种思考模式,豆包1.6-thinking强化了思考能力,支持多模态,在多个权威测评集上达到了全球第一梯队�

  • 华为Pura 80系列放大招!首发小艺看世界,随时随地陪用户探索世界

    华为Pura80系列新机发布,AI功能全面升级。核心亮点包括: 1. "小艺看世界"功能:支持实时视觉交互,可识别5000+景点并主动讲解,提供拍照打卡建议,还能根据场景创作诗歌文案 2. 连续翻译功能:实现屏幕内边浏览边翻译,支持网页和文档全篇翻译,打破语言障碍 3. 智能生活助手:覆盖100+场景的穿搭建议,综合天气、行程等数据提供专业方案 4. 无障碍设计:特别优化视障辅助功能,如电梯楼层语音指引 新机通过多模态大模型能力,让AI助手成为懂用户需求的"全能旅伴",在出行、翻译、生活等场景提供实时专业的智慧服务。

  • 宇树科技放大招!全新人形机器人来了:26关节 钢铁侠同款胸灯

    日前,宇树科技官方发布海报,海报中出现了一个全新人形机器人剪影,机器人胸口还有类似钢铁侠的三角胸灯。 海报配文26 joint DOF(6*2 2 5*2 2) ”,指26个关节活动度,定价为?000”美元。 除此以外,官方暂未公布更多新品信息,只是让大家敬请期待。 有网友猜测,此次宇树科技推出的是家庭服务机器人,但该说法未得到官方证实。 在今年3月的中国发展高层论坛2025年年�

  • Mediatom快应用聚合变现解决方案即将上线,敬请期待!

    Mediatom将全面支持快应用变现服务,为开发者提供高效灵活的解决方案。该平台通过动态分层优化和全竞价体系,帮助开发者对接多平台广告资源,最大化流量价值,预计可提升变现收益30%以上。其四大核心功能包括:一键接入主流广告平台、智能匹配最优广告形式、全样式素材支持及实时数据追踪。平台已服务5000+开发者,覆盖2万+款App,累计为开发者创收数十亿元。作为数字广告技术标杆,Mediatom凭借十年技术沉淀和安全可靠的聚合SDK平台,持续优化开发者变现效率。