视频生成大模型红毯结束，正戏开锣

2024-10-08 17:47 · 稿源：窄播公众号

这是《窄播Weekly》的第31期，本期我们关注的商业动态是:AI视频生成大模型。今年2月OpenAI通过Sora的发布，为AI视频生成明确了依靠DiT（Difffusion Transfomer）架构获得突破的技术路径。随后，快手、阿里巴巴、字节跳动、美图、生数科技、智谱AI、MiniMax纷纷入局其中，持续提升着

......

本文由站长之家合作伙伴自媒体作者“窄播公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

持续霸榜！可灵2.0模型登顶全球视频生成大模型榜单

快手旗下可灵AI 2.0模型在权威AI评测中表现优异，以1124分超越自研1.6版本，连续三个月蝉联全球图生视频领域冠军。4月15日发布的2.0大师版在视频质量、语义理解和画面美学等核心指标持续领先行业。数据显示，自2023年6月上线以来，可灵AI全球用户突破2200万，月活激增25倍，累计生成视频1.68亿个、图片3.44亿张。商业化方面，其单月流水已超千万元，并与伊利、vivo等头部品牌达成深度合作，展现出AI视频生成技术的广阔商业前景。
豆包视频生成模型Seedance 1.0 lite发布：“迅速生成影视级的视频”

火山引擎在FORCE LINK AI创新巡展上发布多款AI模型升级产品：1）Seedance 1.0 lite视频生成模型，支持5-10秒480P/720P视频生成，具备影视级画质和生成速度优势，适用于电商广告、影视创作等场景；2）豆包1.5视觉深度思考模型，仅20B参数但具备多模态理解能力，在60项基准测试中38项达SOTA水平；3）升级版豆包音乐模型，新增英文歌曲创作功能，并能根据视频内容自动适配BGM。目前这些模型已在火山方舟平台和豆包APP上线。

AI模型升级视频生成技术火山引擎发布
视频生成模型Vidu Q1怎么用？Vidu Q1官网是什么？

国产视频生成大模型Vidu Q1在性能、价格和功能上实现重大突破。该模型由生数科技推出，在VBench评测中超越Sora等国内外顶尖模型，支持1080p高清视频生成，每秒价格低至3毛钱。其首尾帧功能仅需两张图即可实现电影级运镜效果，支持多元风格生成和48kHz高采样率混音功能。Vidu Q1已深度赋能影视、广告、动漫等行业，大幅降低创作门槛。

国产视频生成 Vidu Q1
腾讯混元视频生成工具全新开源：人物不会“变脸” 物体不会“漂移”

腾讯混元5月9日宣布推出开源的多模态定制化视频生成工具HunyuanCustom。该工具基于混元视频生成大模型打造，支持文本、图像、音频等多模态输入，能生成高质量定制视频。主要功能包括：单/多主体视频生成、视频配音、局部编辑等，在保持主体一致性的同时可灵活调整场景和动作。适用于广告、电商、影视等场景，如快速更换商品背景、制作数字人视频等。目前单主体生成功能已开源，其他功能将于5月陆续开放。用户只需上传图片和文字描述即可生成连贯自然的视频内容。

多模态视频生成腾讯混元 HunyuanCustom
荐AI日报：扣子空间开放测试；腾讯混元开源视频生成工具HunyuanCustom；阿里开源大模型搜索引擎ZeroSearch

本文汇总了近期AI领域多项重要进展：1)扣子空间开放测试，无需邀请码即可体验AI协作平台；2)腾讯推出HunyuanCustom视频生成工具，实现音视频同步编辑；3)阿里巴巴ZeroSearch技术降低AI训练成本88%；4)OpenAI新增GitHub连接器，强化代码分析功能；5)联想发布天禧个人超级智能体，具备感知交互能力；6)OpenAI在亚洲推出数据驻留计划；7)Multiverse发布全球首款AI生成多人游戏；8)秘塔AI上线"讲题"功能辅助家长辅导；9)Genspark推出智能电子表格工具AI Sheets；10)Google Gemini API新增缓存功能可节省75%成本；11)PixVerse v4视频生成速度质量双提升；12)快手推出内容净化器KuaiMod；13)英伟达开源新一代OCR代码推理模型。这些创新覆盖AI应用、开发工具、成本优化等多个维度，展现了AI技术的快速发展和广泛应用。

AI产品人工智能技术趋势
荐AI日报：GPT-4.1正式上线ChatGPT；阿里通义万相Wan2.1-VACE开源；可灵大模型视频生成量约占30%份额

本文报道了AI领域最新动态：1)阿里通义万相开源视频编辑统一模型VACE；2)OpenAI发布GPT-4.1增强编码能力；3)Stability AI推出超轻量341M文字转语音模型；4)快手可灵视频生成模型占据30%市场份额；5)微软WizardLM团队整体加入腾讯混元大模型研发体系；6)腾讯宣布混元图像2.0将于5月16日发布；7)上海成立人工智能标识生态联盟；8)Lightricks发布13B参数视频生成模型LTX-Video；9)谷歌DeepMind推出AlphaEvolve优化AI训练速度；10)腾讯元宝浏览器插件上线Chrome平台。这些进展展示了AI技术在视频处理、大模型、语音合成等领域的快速发展。

人工智能视频编辑开源项目
阿里开源通义新模型：指定首尾图片生成视频

快科技4月18日消息，据报道，阿里巴巴旗下通义万相宣布开源其创新视频生成技术首尾帧生视频14B模型。这项突破性AI技术能够根据用户提供的起始和结束画面，智能生成720p高清过渡视频，为视频创作带来全新可能。该模型通过先进的深度学习算法，能够精准理解输入画面的内容、风格及主题特征。当用户提供首尾两帧图像后，模型会智能分析画面中的视觉元素，包括物体形�

阿里巴巴通义万相视频生成技术
合合信息发布“大模型加速器 2.0”，助力大模型跨越“幻觉”障碍

近日，上海合合信息科技股份有限公司（简称“合合信息”）TextIn“大模型加速器 2.0”版本正式上线，凭借其多维度升级，为降低大模型“幻觉”风险、推动大模型精准应用提供了强大助力。训练数据是影响大模型“认知能力”的关键，合合信息“大模型加速器 2.0”基于领先的智能文档处理技术，从数据源头入手，对复杂文档的版式、布局和元素进行精准解析及结构化处理，

大模型加速器合合信息智能文档处理
奔驰新款CLA接入豆包大模型

4月22日，奔驰与火山引擎合作的首款国产纯电车型CLA全球首发亮相。该车搭载奔驰自研MB.OS架构，接入火山引擎大模型，支持个性化智能交互体验。智能系统可识别4种情绪并给予反馈，交互效率提升50%，唤醒仅需0.2秒。虚拟助手能解答百科问题并协助车辆功能设置。这是双方继2024年8月达成AI战略合作后落地的首款量产车型，结合生成式AI和大数据技术，为中国用户打造更智能的用车体验。

梅赛德斯-奔驰全新纯电长轴距 CLA
荐大模型时代的智能营销，从“玩具”到“工具箱”

百度在Create大会上强调AI应用创造真正价值，发布智能营销一体化应用"客悦·ONE"。李彦宏指出，没有应用场景的芯片和模型毫无价值。百度智能云升级后整合文心、DeepSeek等大模型能力，实现从数据洞察到智慧触达的闭环营销体系。该产品在金融等行业已落地见效，自助解决率达93%以上，支持多模态交互和全渠道管理。百度通过全栈自研AI架构降低开发成本，推动行业智能化转型。

AI技术智能营销应用场景

热文

3 天
7天

视频生成大模型红毯结束，正戏开锣

持续霸榜！可灵2.0模型登顶全球视频生成大模型榜单

豆包视频生成模型Seedance 1.0 lite发布：“迅速生成影视级的视频”

视频生成模型Vidu Q1怎么用？Vidu Q1官网是什么？

腾讯混元视频生成工具全新开源：人物不会“变脸” 物体不会“漂移”

荐AI日报：扣子空间开放测试；腾讯混元开源视频生成工具HunyuanCustom；阿里开源大模型搜索引擎ZeroSearch

荐AI日报：GPT-4.1正式上线ChatGPT；阿里通义万相Wan2.1-VACE开源；可灵大模型视频生成量约占30%份额

阿里开源通义新模型：指定首尾图片生成视频

合合信息发布“大模型加速器 2.0”，助力大模型跨越“幻觉”障碍

奔驰新款CLA接入豆包大模型

荐大模型时代的智能营销，从“玩具”到“工具箱”

热文

42岁程序员因AI被裁，失业一年，现蜗居房车，靠跑腿维生

日产 N7 电动车在中国创下新纪录，18 天订单突破 1 万台

苹果 AI 太落伍？他们需要从对手那里“复制”这三个功能

谷歌刚修复了一个高危 Chrome 漏洞，可被用于劫持账户

报告显示：苹果仍是全球最有价值的品牌！

Noyb指控Meta再次违反GDPR，或面临2000亿欧元赔偿

Anthropic 的律师因 Claude 编造法律引文被迫道歉

仅用三张图像即可生成 3D 场景，苹果新 AI 模型“很惊人”

奥特曼：使用 ChatGPT 的方式，暴露了你的年龄！

42岁程序员因AI被裁，失业一年，现蜗居房车，靠跑腿维生

日产 N7 电动车在中国创下新纪录，18 天订单突破 1 万台

苹果 AI 太落伍？他们需要从对手那里“复制”这三个功能

四年来，软银集团首次实现年度盈利，重振投资者信心

2026年苹果产品迎来革命性升级：折叠屏iPhone/全新MacBook Pro

不丹率先为游客提供国家级加密支付

微软宣布全球裁员超 6000 人，占比约 3%

谷歌刚修复了一个高危 Chrome 漏洞，可被用于劫持账户

站长商机