首页 > 业界 > 关键词  > 正文

美图自研AI视觉大模型MiracleVision发布4.0版本

2023-12-05 15:44 · 稿源:站长之家

站长之家(ChinaZ.com)12月5日 消息:今日,美图自研AI视觉大模型MiracleVision(奇想智能)发布4.0版本最新版本带来了两大新能力:AI 设计和 AI 视频。

AI 设计包括四大功能:矢量图形、文字特效、智能分层和智能排版。用户可以通过 AI 设计快速生成匹配设计风格的矢量图形,自定义文字特效,将对象快速识别并转换成独立的图层,并通过自然语言交互对文字和图像进行排版设计。

MiracleVision4.0还推出了全新的视觉模型商店,用户可以根据需要选择不同的视觉模型,创造出各种前所未有的视觉效果。

微信截图_20231205154629.png

而AI 视频能力包括文生视频、图生视频、视频运镜和视频生视频四大功能。用户可以通过输入提示词,生成自然流畅的视频,让图片动起来,模拟专业的镜头运动,甚至将现有的视频加入不同的艺术风格。

MiracleVision4.0的视频生成能力已融入行业工作流,特别适用于电商和广告行业。在电商中,MiracleVision 可以快速制作大量商品视频,使商品展示更加生动;在广告中,MiracleVision 可以制作符合产品特性的创意视频,突破套路,让品牌理念深入人心。

微信截图_20231205154659.png

据悉,MiracleVision4.0将于2024年1月陆续应用于美图旗下产品,同时开放商业 API,并提供多个套餐供用户选择。

举报

  • 相关推荐
  • 颠覆Diffusion局限!Utopai双模型耦合架构,攻克AI影视长叙事核心难题

    Utopai Studios推出专为影视制作设计的AI模型与工作流,区别于主流视频生成模型,其核心能力在于理解剧本、规划镜头及生成场景,通过自回归模型负责叙事规划与一致性约束,扩散模型专注高质量画面渲染。该系统能解决跨镜头元素漂移难题,提升制作效率与作品品质。目前工作流仅用于公司自有项目,强调AI作为创作者协作者的角色,并遵循行业道德与版权规范。

  • 新Siri或明年春季发布 苹果公司或引入谷歌Gemini大模型 AI技术

    苹果因自研大模型项目遇瓶颈,决定引入谷歌Gemini大模型升级Siri,计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数,将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能,支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送,后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

  • 2998元起!大疆Osmo Action 6运动相机发布:首次支持可变光圈

    今日,大疆Osmo Action 6全能旗舰级运动相机正式发布,售价2998元起。 据了解,Osmo Action 6是大疆首款可变光圈运动相机,可变光圈范围覆盖f/2.0至f/4.0,在自动模式下,可根据拍摄环境与需求选择不同的光圈挡位,支持星芒模式。 Osmo Action 6搭载全新1/1.1英寸方形传感器,2.4m等效像素,最高支持4K/120fps 4:3超清视频录制,在1080p录制规格下,可智能生成32倍超级慢动作片段。 同时�

  • 易鑫正式发布汽车金融行业首个Agentic大模型

    易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿,响应延迟低于200毫秒,支持语音实时交互,单卡吞吐达370 tokens/秒,可提升获客、风控与运营效率,解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台,研发投入超20亿元,率先实现AI全场景应用,将持续推动智能汽车金融生态建设。

  • 华为Mate 70 Air今日开售:处理器双版本可选 售价4199元起

    华为Mate70 Air于11月11日首发,售价4199元。该机创新地推出麒麟9020A和9020B两个处理器版本,提供不同存储配置选择,但具体性能差异未公开。机身仅6.6mm厚、约208g重,为Mate系列最薄直板机。配备7英寸OLED临境大屏,支持120Hz刷新率与2160Hz PWM调光,峰值亮度达4000尼特。后置四摄系统包括5000万主摄、1200万长焦、800万超广角及红枫原色镜头。内置6500mAh电池,支持66W快充,并具备双向北斗卫星消息功能,确保偏远地区通讯畅通。

  • AI日报:昆仑万维SkyReels V3模型上线;月之暗面推Kimi Linear模型;MiniMax Music 2.0 发布

    本期AI日报聚焦多领域创新:昆仑万维推出SkyReels V3模型,整合顶尖视频生成能力;月之暗面Kimi Linear模型处理长文本速度提升2.9倍;MiniMax Music 2.0实现专业级音乐创作;字节跳动启动豆包股权激励计划吸引AI人才;苹果iOS 27将迎AI重大升级,Siri更个性化;Dia浏览器融合Arc设计理念与AI技术;文心魔法漫画工具实现一键生成连载作品;谷歌Gemini Canvas新增PPT自动生成功能,由Gemini 2.5 Pro驱动,提升职场效率。

  • 何小鹏首次披露物理AI巨大进展 发布第二代VLA大模型

    小鹏汽车在2025科技日发布第二代VLA大模型,颠覆传统“视觉-语言-动作”架构,实现端到端直接输出动作指令,开创物理模型新范式。该模型具备动作生成与物理世界理解能力,参数规模达数十亿级,训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载,推动智驾技术显著进化,同步发布“小径NGP”功能,复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示,大模型将成为物理AI世界的操作系统,并宣布与大众汽车达成战略合作,共同推进智能出行发展。

  • AI视觉重塑质检“智慧之眼”,聚焦四大核心应用场景

    AI视觉质检技术正以精准化、场景化、智能化为核心驱动力,推动测试测量领域从传统人工/2D检测向“3D全维度+AI深度赋能”跨越升级。2026年慕尼黑上海电子生产设备展将汇聚超千家电子制造企业,集中展示焊接工艺缺陷检测、元件贴装质量排查等核心应用场景的解决方案。头部企业将通过3D成像+AI识别、X射线智能检测等技术,实现微米级缺陷精准捕捉与全流程数据闭环管理,

  • AI日报:广电整治AI动画乱象;360发布大模型安全白皮书;百度推出小度AI眼镜Pro

    国家广电总局宣布自2026年3月起全面整治AI生成内容,要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》,提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro,集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX,实现文本化语音编辑。Grok新增纯文本生成视频功能,17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠,并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型,优化开发者体验。

  • 视觉暴击!海信RGB-Mini LED电视乌镇实测《黑神话》,拉满沉浸感

    在2025世界互联网大会乌镇峰会上,海信与《黑神话:悟空》合作展示RGB-Mini LED电视技术,精准还原游戏画面细节,如武器光泽、服饰纹理,引发玩家排队体验。该技术突破传统显示方案,通过RGB三原色发光芯片实现100% BT.2020色域和108bits控光精度,消除色彩失真,呈现“真、纯、透”视觉效果。海信E8S Pro作为代表机型,凭借12项影音优化功能,成为体验3A大作的理想设备,彰显“好游戏+好设备”的双重魅力。

今日大家都在搜的词: