Midjourney团队公布进展：视频模型进展较慢 3D模型和实时生成效果显著

2024-05-16 15:09 · 稿源：站长之家

站长之家(ChinaZ.com) 5月16日消息:Midjourney团队在最近的工作时间透露了他们在视频模型、3D模型、实时生成效果以及网站和模型开发方面的最新进展。以下是他们透露的关键信息:

AI画画机器人作画绘画

图源备注：图片由AI生成，图片授权服务商Midjourney

视频模型进展

视频模型的开发进度并不如预期那样迅速。尽管3D模型和实时生成的效果令人满意，但团队表示，即便是Sora级别的模型，也未能达到他们心目中的理想效果。

产品理念

Midjourney追求的不是随机性强、不可控的“老虎机”式产品。相反，他们致力于开发出既能够精准控制，又能提供高图像质量的技术产品。此外，他们希望这些产品的价格合理，使得普通消费者也能负担得起。

网站更新

Midjourney的网站即将进行一系列更新，包括:

私人房间功能:即将上线，为用户提供更个性化的服务。

用户开放:网站将对更多用户开放，以满足日益增长的需求。

新功能上线:包括数据统计在内的更多功能即将推出，以增强用户体验。

模型开发

在模型开发方面，Midjourney也取得了显著进展:

V6.1版本:即将发布的新版本将带来显著的图像质量、纹理和细节上的改进。
个人定制模型:由于测试难度较大，个人定制模型的发布可能会稍晚一些。
V7版本:目前处于早期开发阶段，团队正在积极推进。

Midjourney团队对AI技术的持续追求和创新，展现了他们对产品质量和用户体验的重视。通过不断的技术迭代和功能更新，他们致力于为用户提供更加精准、高质量的AI技术产品。

（举报）

相关推荐

关键词：

荐AI日报：Midjourney重磅推出视频生成模型V1；OpenAI将在今年夏季发布GPT-5；谷歌推Search Live语音搜索功能

本期AI日报聚焦多项AI领域重要进展：1) Midjourney推出首款视频生成模型V1，支持21秒视频生成；2) OpenAI CEO确认GPT-5将于今夏发布；3) Google上线语音对话搜索功能Search Live；4) OpenAI开源客户服务代理框架；5) MiniMax发布智能代理Agent；6) 恶意工具WormGPT出现新变种；7) OpenAI推出企业版ChatGPT折扣；8) DeepSite V2支持3D网页动画生成；9) AI工具可秒变PPT；10) 比亚迪与字节跳动合作开发动力电池技术；11) 马斯克否认xAI巨额亏损传闻。

AI日报 Midjourney 视频生成模型
荐A日报：B站升级动漫视频生成模型AniSora V3；字节开源4D视频生成框架EX-4D；DeepSWE开源AI Agent系统强势登顶

AI日报栏目汇总了近期AI领域的重要进展：1)字节跳动开源EX-4D框架，可将单目视频转换为多视角4D视频；2)B站开源动漫视频生成模型AniSora V3，支持多种风格；3)DeepSWE+开源基于Qwen3-32B的AI Agent系统；4)字节开源3亿参数图像编辑模型VINCIE-3B；5)Stability AI推出移动端音频生成模型Stable Audio Open Small；6)谷歌发布免费教育AI工具套件Gemini for Education；7)Topview推出革命性AI数字人带货技术Avatar

人工智能 AI技术趋势 4D视频生成
荐AI日报：ChatGPT支持MCP和会议记录功能；Cursor 1.0 版本重磅发布；Midjourney视频功能将在本月上线

本期AI日报聚焦多项AI领域突破：1）OpenAI为ChatGPT新增企业数据连接和会议记录功能；2）Cursor 1.0发布集成BugBot等开发工具；3）Midjourney即将推出视频生成功能；4）秘塔AI搜索新增PPT导出功能；5）Manus推出文本生成视频工具挑战Sora；6）法国Mistral发布企业级编程助手；7）英伟达推出文档处理专用AI模型；8）腾讯公益引入大模型提升互动体验；9）Firecrawl推出网页抓取API工具；10）Bland AI实现超真实语音克隆；11）报告显示AI训练成本逼近百亿美元；12）开源设计工具Jaaz支持批量图像生成；13）《逆水寒》手游接入AI实现图片动效玩法。

OpenAI ChatGPT 人工智能
荐模型能力卷不过Google、快手，但这家视频生成创企却可能最先赚到钱？

去年4月，我们曾经在《这个 AI 赛道，一个月内融资4笔，一大半的创始人是华人》选题中观察过 AI 视频赛道，彼时赛道 Top 级玩家还是 Pika、Pixverse、Haiper 等华人创企。

AI视频赛道融资创业公司
可灵AI全系模型上线“视频音效”功能可同步生成高质量立体声音效

可灵AI宣布全系列视频模型上线“视频音效”功能，用户在使用可灵AI进行视频创作时，不仅能获得高质量的视频画面，更能体验到与视频精准匹配、富有空间感的立体声音效……

可灵AI 可灵可灵AI新功能
荐AI日报：MiniMax推视频生成模型Hailuo 02；Cursor Pro取消500次请求限制；谷歌发布AI模型 Gemini 2.5 Flash-Lite

本文汇总了AI领域最新动态：1)Cursor Pro取消500次请求限制；2)稀宇科技推出视频生成模型Hailuo02；3)谷歌发布轻量级AI模型Gemini2.5Flash-Lite；4)科大讯飞星火X1升级版7月上线；5)腾讯元宝推出AI编程模式；6)OpenAI将下架GPT-4.5 API；7)苹果Speech API转录速度超Whisper 55%；8)百度推出数字人互动直播间；9)Meta曾试图高薪挖角OpenAI人才；10)Krea1公测开放，解决"AI感"问题；11)特斯拉Grok车载AI助手即将上线；12)谷歌Gemini新增视频分析功能。

人工智能开发者技术趋势
2025最新全球AI大模型排名，国内外模型动态洗牌（实时更新平台推荐）

2025年全球AI大模型竞争进入白热化阶段，OpenAI、Google等国际巨头与中国企业激烈交锋。技术迭代远超预期，仅半年内排名就经历多次洗牌。当前全球AI大模型综合排名Top10显示：1)GPT-4.5综合80.4分领跑；2)Claude3.7编程领域领先；3)Gemini2.0多模态标杆；4)国产DeepSeek R1推理速度提升3倍；5)阿里Qwen2.5数学编程单项第一。中国模型通过开源策略、垂直优化和成本革命实现弯道超车，如DeepSeek R1仅耗资600万美元达到GPT-4水平，字节豆包采用稀疏MoE架构成本大幅降低。中文场景深度优化表现突出，如文心一言4.0方言交互准确率92%。开源生态爆发，通义千问全尺寸开源(7B~110B参数)在Hugging Face排名第一。权威评估需结合标准化测试、人类盲测和场景适配性。

全球AI大模型 OpenAI 技术迭代
LiblibAI 重磅发布「星流 Agent」：中文语义 + 图片视频3D全能生成，中国最强设计 Agent

LiblibAI推出Lovart中文版"星流Agent"，这是一款专为中国市场深度优化的AI设计工具。该产品在保留Lovart全球版"生成-编辑-排版-交付"全链路能力基础上，针对中文语义、国风审美和本土使用场景进行了全面重构。星流Agent支持从创意构思到设计交付的全流程自动化，可处理平面设计、视频生成和3D建模等跨模态创作，内置符合中国文化的视觉风格库。该产品的推出标�

Lovart AI设计中文优化
豆包大模型1.6发布：全球第一梯队！可生成1080p高品质视频

字节跳动旗下豆包大模型正式升级为1.6版，在推理、数学、指令遵循、Agent等方面的能力均有较大提升，同时豆包视频生成模型Seedance 1.0 pro、豆包语音播客模型也正式发布。豆包大模型1.6包括三部分，分别是豆包1.6、豆包1.6-thinking、豆包1.6-flash。其中，豆包1.6支持on/off/auto三种思考模式，豆包1.6-thinking强化了思考能力，支持多模态，在多个权威测评集上达到了全球第一梯队�

豆包大模型字节跳动视频生成模型
从心脏、到血管……3D打印开启“器官替换”时代

为了确保3D打印的人工器官能正常运行，必须让血管充分发挥功能。若无法稳定供血，人工器官的广泛使用根本无从谈起……

3D打印 3D打印心脏 3D打印血管

热文

3 天
7天

Midjourney团队公布进展：视频模型进展较慢 3D模型和实时生成效果显著

荐AI日报：Midjourney重磅推出视频生成模型V1；OpenAI将在今年夏季发布GPT-5；谷歌推Search Live语音搜索功能

荐A日报：B站升级动漫视频生成模型AniSora V3；字节开源4D视频生成框架EX-4D；DeepSWE开源AI Agent系统强势登顶

荐AI日报：ChatGPT支持MCP和会议记录功能；Cursor 1.0 版本重磅发布；Midjourney视频功能将在本月上线

荐模型能力卷不过Google、快手，但这家视频生成创企却可能最先赚到钱？

可灵AI全系模型上线“视频音效”功能可同步生成高质量立体声音效

荐AI日报：MiniMax推视频生成模型Hailuo 02；Cursor Pro取消500次请求限制；谷歌发布AI模型 Gemini 2.5 Flash-Lite

2025最新全球AI大模型排名，国内外模型动态洗牌（实时更新平台推荐）

LiblibAI 重磅发布「星流 Agent」：中文语义 + 图片视频3D全能生成，中国最强设计 Agent

豆包大模型1.6发布：全球第一梯队！可生成1080p高品质视频

从心脏、到血管……3D打印开启“器官替换”时代

热文

小米汽车回应YU7是否难破窗：无需担心随车赠送破窗锤

特斯拉中国宣布Model 3/Y长续航版续航提升

小鹏G7官宣7月3日发布全球首款L3级算力车型

董明珠说自己尽量少说话让年轻管理团队走向台前

安克修改召回方案充电宝泡盐水处理后可获赔

小米YU7将开启限时改配非准现车锁单用户可参与

站长商机