首页 > 业界 > 关键词  > Midjourney最新资讯  > 正文

Midjourney V6版本预计今年发布 将实现质量飞跃

2023-09-21 17:30 · 稿源:站长之家

文章概要:

1. Midjourney CEO David Holz承诺V6版本将带来更好的文本理解和图像生成,预计今年内发布。

2. Midjourney计划分两个阶段推出Web版本,首先是更新的网站,然后是带有图像生成和社交功能的版本。

3. Midjourney的路线图还包括3D和视频生成,Holz对3D生成特别乐观,认为它可以改善视频游戏图形。

站长之家(ChinaZ.com)9月21日 消息:Midjourney公司的CEO David Holz表示,他们的下一个版本也就是V6版本将带来一次质量飞跃。与之前的版本升级相比,Holz强调,从V5到V6的跨越将更为显著。虽然他没有透露确切的发布日期,但他表示肯定会在今年内发布。

V6版本的亮点之一是更好的文本理解和图像生成能力。Holz承诺,图像生成将更贴近提示内容,并更加注重措辞中的细节。

机器人画画

图源备注:图片由AI生成,图片授权服务商Midjourney

他还提到了文本渲染的可能性,尽管他表示这并不难,但团队迄今为止还没有将其视为重要功能。不过,他也指出,他尚未看到过出色的文本渲染示例,并且是否以及在何种程度上实现这一功能尚未确定。

在被问及OpenAI的DALL-E3时,Holz表示“非常乐观”,认为Midjourney将继续提供最高的图像质量。尽管初步显示DALL-E3在图像质量方面略有优势,但Midjourney更好地遵循提示并能够渲染文本。

除了图像生成,Midjourney还计划推出Web版本。这将分两个阶段进行,首先是现有网站的重新设计,然后是具备图像生成功能和社交功能的版本。Holz没有提供具体的时间表,直到最终版本的网站上线。

此外,Midjourney的路线图还包括3D和视频生成。Holz对3D生成特别表示乐观,认为它可以帮助改善视频游戏图形。他曾表示,他预计未来视频游戏将由生成而非渲染产生。然而,Midjourney并不计划在今年发布关于3D生成的具体信息或演示,对于视频生成也是如此。虽然团队正在研究这些功能,但Holz表示它们可能离3D生成市场成熟还有写距离。

Midjourney的版本6将成为一次令人期待的升级,带来更好的图像生成和文本理解能力。他们还计划推出Web版本,并在未来加强3D和视频生成。

举报

  • 相关推荐
  • AI日报:生数科技推出Vidu Q2;火山引擎推出炉米Lumi;通义千问开源300+模型

    本文汇总了近期AI领域多项重要进展:生数科技推出Vidu Q2模型,显著提升视频生成中细微表情的真实感;火山引擎发布炉米Lumi平台,支持视觉模型LoRA微调以定制独特风格;阿里云通义千问开源超300个模型,下载量突破6亿次;百度开源多模态视觉理解模型Qianfan-VL,适配不同场景需求;微软在Copilot中引入Anthropic模型,拓展AI助手功能;OpenAI计划在美国新建五个数据中心以加速Stargate项目;英伟达开源Audio2Face模型,提升实时面部动画生成效果;Meta发布具备沙箱推演能力的32B代码世界模型CWM,优化代码调试效率。这些动态展示了AI技术在视觉、多模态、开源生态及硬件支持等方面的快速迭代与创新突破。

  • DeepSeek更新至V3.1 Terminus版本:两大升级

    9月22日,深度求索宣布DeepSeek V3.1已更新至Terminus版本,官方App、网页端、小程序与API模型同步升级。本次更新在保持模型原有能力基础上,针对用户反馈进行改进:优化语言一致性,缓解中英文混杂、异常字符等问题;提升Code Agent与Search Agent表现。官方表示新版本输出效果更稳定,各领域评测表现优异。开源版本已在Hugging Face和ModelScope平台发布。

  • 中国数智财政市场第一!太极华青持续登顶IDC榜单

    IDC报告显示,太极华青凭借预算管理一体化建设优势及AI、数据要素创新应用,连续四年蝉联中国数智财政市场第一。公司通过业务整合、流程再造与数据赋能,构建覆盖预算全周期管理体系,并推出行业垂类大模型,提供智能问答、报销、数据分析等服务,推动财政管理智能化升级。未来将持续强化数据与AI能力,助力数智财政建设。

  • 腾讯云联合IDC发布AI Infra报告:定义Gen Al时代智算新范式

    2025年腾讯全球数字生态大会于9月16-17日在深圳召开。在Infra+Agent专场,腾讯云与IDC联合发布《AI+Infra:加速智能体落地的基础架构、发展趋势与产业实践》报告。报告指出,随着AI应用规模化落地,AI云基础设施正向核心智算设施演进,涵盖分布式底座、异构硬件、高性能软件和场景化方案四大维度。报告还提出六大演进趋势:架构重构、行业垂直化、算力智能化、安全能力提升、研发范式创新和服务化转型,并解析了腾讯云在交通、制造、医疗等领域的落地案例,为企业智能化转型提供实践指南。

  • 国内首家AI回答监测判断系统“玄鸟AI监测1.0版本”正式发布

    9月21日,“玄鸟AI监测系统”正式上线,这是国内首个专注于用户端AI交互数据采集与分析的企业级解决方案。该系统通过“数据采集-智能分析-闭环反馈”三层架构,能有效识别行业“AI幻觉”监控难题,实现跨平台实时数据抓取与智能分析。系统依托自然语言处理与机器学习技术,建立双重验证机制,精准识别AI生成内容中的事实偏差,并通过自动化报告生成功能帮助企业快速定位风险。该系统的上线标志着国内在AI内容监测领域实现关键技术突破,为构建可信AI生态提供重要支撑。

  • REDMI K90跑分出炉:骁龙8至尊版起步 配2K直屏

    近日,型号为2510DRK44C的小米手机跑分现身GeekBench,单核3080分、多核9382分,搭载骁龙8 Elite处理器和16GB内存,基本确定为Redmi K90。该系列预计10月发布,包含K90和K90 Pro两款机型,均配备2K直屏、超7000mAh大电池,Pro版首次搭载潜望长焦镜头,影像将大幅升级。这可能是王腾在职期间打造的最后一部手机。

  • 浙江省博物馆开启“智览”新篇章:Rokid AR眼镜助力“浙江一万年”沉浸式体验

    浙江省博物馆联合科技企业Rokid推出“浙江一万年”AR眼镜导览服务,以“守文明之正,创传世之新”为核心理念。通过空间感知、SLAM定位、6DoF交互等技术,实现历史场景在实体展厅的精准复原与互动再现。观众可“走进”良渚古城、春秋铸剑场等虚拟场景,从多角度观察文物与虚拟元素的融合互动。该服务基于严谨考古研究成果,系统梳理浙江万年文明史,让抽象概念转化为可视可感的叙事,推动文博展览从“静态陈列”迈向“动态融合”新阶段。

  • GMIF2025:慧荣科技展示从云端到边缘的AI存储主控技术

    9月25日,第四届GMIF2025创新峰会在深圳湾万丽酒店召开,聚焦“AI应用,创新赋能”主题。慧荣科技总经理苟嘉章发表演讲,指出AI推动存储架构从“分层存储”向“存算融合”演进,存储成为AI计算关键环节。峰会展示了慧荣在数据中心、边缘与AI PC、车载嵌入式等领域的最新存储解决方案,并呼吁产业链协同创新,应对2026年可能出现的存储芯片紧缺局面。慧荣凭借主控芯片技术优势荣获“杰出主控技术创新奖”。

  • 突破 Mini LED!三星 Micro RGB 引航显示进入 Micro 时代

    三星在京东方MALL举办“AI的呵护”家电线下体验展,展出全球首款Micro RGB电视115MR95F。该电视采用Micro RGB技术,实现100% BT.2020色域覆盖,色彩精准度与对比度达到新高度。搭载AI芯片优化画质,支持144Hz刷新率与杜比全景声,定价199,999元。三星借此布局超高端市场,展示Micro RGB+QD-OLED+Micro LED三大技术矩阵,重塑显示行业格局。

  • ChatExcel重磅发布:基于AMD锐龙AI MAX+ 395处理器的数据分析Mini AI 工作站

    ChatExcel发布搭载AMD锐龙AI MAX+395处理器的Mini AI工作站,重构数据全链路,打造“找数-做数-分析数-看数-用数”的商业闭环平台。依托处理器96GB超大显存和统一内存架构,实现本地流畅运行GPT-oss-120B等大型模型,保障数据安全的同时显著提升分析效率。该方案以财务场景为例,支持多任务并行处理,将原本需1天完成的月度报表压缩至2小时,解决“数据不外发”与“高效处理”的核心矛盾。

今日大家都在搜的词: