Midjourney 计划未来几个月推出“文本转视频”模型

2024-01-03 13:55 · 稿源：站长之家

**划重点:**
1. 🎥 Midjourney计划在未来几个月推出“文本转视频”模型，将其AI形象生成器扩展到视频创作领域。
2. 🤖 公司将于1月开始培训视频模型，CEO David Holz表示这是平台的自然发展，将竞争动态引入生成视频行业。
3. 🌐 与竞争对手相比，MidJourney的最新v6更新着重于提高画质和用户体验，预示着AI视频生成领域的激烈竞争。

站长之家(ChinaZ.com) 1月3日消息:Midjourney公司在周二宣布，他们计划在未来几个月推出“文本转视频”模型。

据CEO David Holz在“Office Hour” Discord会议中表示，公司将于1月开始培训视频模型。这一举措代表了该平台的自然发展，基于成熟的图像模型，激发了生成视频行业的竞争动态。

Midjourney的Discord会议记录包括对V6Niji的计划调整，这是Midjourney的漫画/动画生成模型，并且对即将发布的MidJourney V6进行了一致性修复。公司还表示其待办事项清单中包括“开始培训新的视频模型”，这可能在“几个月内”准备就绪。

机器人画画 AI生成图片

图源备注：图片由AI生成，图片授权服务商Midjourney

截至目前，Holz或MidJourney团队尚未分享有关模型的进一步信息。

MidJourney以强调质量和用户体验而著称，即使这意味着落后于竞争对手。在其他平台如Stable Diffusion等的功能成为事实标准数月后，公司才推出了inpainting和outpainting等增强功能。而其最近尝试的文本生成则在其他模型如Dall-E3、SDXL以及一些不那么流行的生成器（如Ideogram或IF）已经成为共同功能之后才推出。

这次进入视频领域也是在竞争对手发布相关产品之后。Stability AI最近宣布Stable Video Diffusion;Meta刚刚展示了其EMU视频生成器，而像Pika和Runway ML等现有模型正在留下他们的痕迹，使MidJourney的进入成为竞争激烈的领域。此外，像Leonardo AI等其他图像生成器已经实现了视频生成功能，进一步加剧了竞争。

Midjourney的最新v6更新，宣称提高了提示跟随和更真实的图像，是公司为保持相关性和竞争力而做出的最新努力。如果其模型显示出一定的凝聚力，它们在这个新兴领域甚至在模型仍然不够完美的情况下也可能获得坚实的地位。

这些发展的影响远远超出了企业争霸的范畴。随着MidJourney和其他公司不断创新和完善其产品，创意和媒体行业正站在变革的边缘。通过AI生成、操控和与视频内容互动的能力为我们打开了许多可能性，从使娱乐者和广告商更轻松地进行创作，到潜在地重塑我们对现实的感知。

（举报）

相关推荐

关键词：

小米开源首个原生端到端语音大模型支持音频重建任务和音频转文本任务

小米发布首款开源端到端语音大模型Xiaomi-MiMo-Audio，拥有12亿参数，在智能性、情感表达和交互适配方面接近人类水平。该模型最大技术突破在于少样本学习能力，通过创新预训练架构和超一亿小时训练数据，成功突破传统语音模型依赖大规模标注数据的技术瓶颈。基于Transformer架构，支持音频重建和音频转文本等多任务处理。小米已在Huggingface平台发布预训练和指令微调版本，并在Github开源Tokenizer模型，为研究者和开发者提供完整工具链。

AI语音开源模型少样本学习
荐转人工率下降20%，成交转化率提升35%：淘宝重塑AI客服

AI客服正在完成从“问答机”向“智能体”的转变。 2025年9月4日，淘宝发布“店小蜜5.0”，标志着AI客服正式从基于知识库配置的“工具”，进化为能思考、会决策、可行动的“智能体（Agent）”——一种能自主理解、规划并执行任务以达成目标的人工智能系统。这不仅是技术的拐点，更是对消费者体验和商家效率的重塑。淘天集团客户运营部技术负责人腾渊揭示了这场变�

AI客服智能体淘宝
腾讯云联合IDC发布AI Infra报告:定义Gen Al时代智算新范式

2025年腾讯全球数字生态大会于9月16-17日在深圳召开。在Infra+Agent专场，腾讯云与IDC联合发布《AI+Infra：加速智能体落地的基础架构、发展趋势与产业实践》报告。报告指出，随着AI应用规模化落地，AI云基础设施正向核心智算设施演进，涵盖分布式底座、异构硬件、高性能软件和场景化方案四大维度。报告还提出六大演进趋势：架构重构、行业垂直化、算力智能化、安全能力提升、研发范式创新和服务化转型，并解析了腾讯云在交通、制造、医疗等领域的落地案例，为企业智能化转型提供实践指南。

AI Infra 生成式AI
在胡同与北海间流转的光影佳能EOS R50 V秋日氛围感体验

文章分享了作者使用佳能EOS R50V微单相机在北京胡同咖啡厅和北海公园拍摄秋日景色的体验。相机配备2420万像素APS-C画幅传感器和DIGIC X处理器，支持4K视频和多种专业视频规格，画质细腻、色彩还原精准。其轻巧机身仅373克，便于携带，适合户外拍摄。内置多种创意滤镜和肤色优化功能，提升人像拍摄效果。操作界面简洁，配备翻转触摸屏，支持自拍和竖屏拍摄。整体而言，EOS R50V是一款适合视频创作和摄影爱好者的便携设备。

秋日摄影佳能EOS R50V
推荐2025年必种草的AI一键ppt转视频创作工具

文章介绍了三款AI工具（课件帮、Visionstory、Fliki），可将静态PPT快速转换为动态视频微课。这些工具操作简便，支持自动生成口播稿、多语言配音、智能字幕及动画效果，适用于教育、企业培训等多种场景，无需专业技能即可上手，大幅提升视频制作效率。

PPT转视频视频创作工具 AI视频制作
男子转情人1340万 66岁原配起诉返还：法院称赠与行为无效

近日，一起涉及巨额财产纠纷的案件引发社会广泛关注。一名66岁的女性杜女士，在发现结婚39年的丈夫与一名小35岁的女性陈某存在不正当关系，并在婚外生育双胞胎后，毅然选择通过法律途径维护自身权益。更令人震惊的是，杜女士的丈夫在2021年至2022年间，擅自将夫妻共同财产1340万元转账给陈某。据相关报道，杜女士与丈夫于1986年结婚，共同育有一女。在丈夫创业初�

财产纠纷婚姻背叛法律维权
女子下车在高架桥网状线转呼啦圈交警回应：将批评教育

9月9日，一段网友拍摄的视频在网络上引发热议。视频中，在重庆一座高架桥上，一名女子竟将车停在白色的网状线上，随后下车悠然自得地转起了呼啦圈。这一异常举动迅速吸引了过往司机的目光，也引发了网友们的广泛讨论。针对这一事件，交警方面表示，他们已经注意到了这段视频，并注意到视频中女子的车辆似乎有一个轮胎坏掉了，猜测她可能是在等待救援过程中，�

交通安全高架桥停车危险行为
荐B站想用「视频播客」吸引更多优质创作者

近两个月，「视频播客」作为一种新的内容形态火了起来。不止一个平台入局，不止一个创作者参与。鲁豫与易立竞的对谈，罗永浩与李想、何小鹏的对谈，不仅在B站获得百万播放，切片内容还在全网传播。最近，甚至有人建议罗永浩邀请贾国龙录一期《罗永浩的十字路口》。但「视频播客」与音频播客的区别是什么、与其他视频内容有何不同、市场空间和商业化前景如何�

视频播客内容形态平台入局
初中生偷转父母37万元充值游戏法院判双方担责退还12万

近日，广州互联网法院审结一起引发社会关注的未成年人网络游戏充值纠纷案。14岁初中生小李在一年半时间内，利用家长实名认证的支付账户，向某网络游戏完成552笔充值交易，累计金额达37万余元。家长发现资金异常后，以未成年人非理性消费为由起诉游戏公司，要求全额退还充值款项。庭审中，游戏公司抗辩称涉案账号及支付账户均通过成年人实名认证，充值行为符�
三登MIT“50家聪明公司”榜单，科大讯飞给出AI的“中国式解法”

科大讯飞第三次入选MIT“50家聪明公司”榜单，其星火X1大模型以更少参数实现顶尖效果，显著领先行业同行。讯飞不仅技术实力过硬，更注重AI落地应用，赋能教育、医疗、办公等领域，服务超5万所学校、7.5万家基层机构。其全栈自主可控技术打通“任督二脉”，产品出海日韩市场受青睐，推动中文学习覆盖全球194个国家和地区。讯飞证明，真正的“聪明”在于让技术解决具体问题，而不仅是追求参数竞赛。

AI技术聪明公司全球普惠

今日大家都在搜的词：

热文

3 天
7天

Midjourney 计划未来几个月推出“文本转视频”模型

小米开源首个原生端到端语音大模型支持音频重建任务和音频转文本任务

荐转人工率下降20%，成交转化率提升35%：淘宝重塑AI客服

腾讯云联合IDC发布AI Infra报告:定义Gen Al时代智算新范式

在胡同与北海间流转的光影佳能EOS R50 V秋日氛围感体验

推荐2025年必种草的AI一键ppt转视频创作工具

男子转情人1340万 66岁原配起诉返还：法院称赠与行为无效

女子下车在高架桥网状线转呼啦圈交警回应：将批评教育

荐B站想用「视频播客」吸引更多优质创作者

初中生偷转父母37万元充值游戏法院判双方担责退还12万

三登MIT“50家聪明公司”榜单，科大讯飞给出AI的“中国式解法”

今日大家都在搜的词：

热文

雷军演讲主题《改变》官宣：聊玄戒芯片和小米汽车背后的故事

微信员工回应新iPhone提示空间不足：代码Bug所致

折叠屏iPhone细节曝光采用超薄钛合金：预计售价2000美元起

ColorOS 16将于10月15日发布 Find X9系列全球首发搭载

小米汽车：苹果授权Apple Music安卓版将陆续推送

比亚迪李云飞回应巴菲特清仓：股票投资有买就有卖

AI日报：可灵AI发布数字人新功能；腾讯混元新技术给大模型 “去

小米召回116887辆SU7电动汽车：将OTA升级消除安全隐患

雷军回应小米召回11.7万辆SU7：将为用户带来更多期待功能

AI日报：小米开源首个原生端到端语音大模型；通义万相Wan2.2-A

iPhone17 Pro Max续航实测夺冠 iPhone Air表现不俗

AI日报：阿里云开源通义DeepResearch；夸克推医师考试大模型

小米发布REDMI 15R 5G手机：售价1099元起搭载6000mAh电池

苹果 iPhone 17/Pro 系列今日发售多维度升级

京东：iPhone 17开卖4小时全国超3万人签收

卢伟冰：9月19日将直播在线解答小米17系列17个问题

站长商机