首页 > AI头条  > 正文

美图发布 MiracleVision 4.0:AI 设计和 AI 视频功能引领视觉领域创新

2023-12-05 15:49 · 来源: AIbase基地
美图自研 AI 视觉大模型 MiracleVision 发布 4.0 版本,最新版本带来了两大新能力:AI 设计和 AI 视频。AI 设计包括四大功能:矢量图形、文字特效、智能分层和智能排版。用户可以通过 AI 设计快速生成匹配设计风格的矢量图形,自定义文字特效,将对象识别并转换成独立的图层,并通过自然语言交互对文字和图像进行排版设计。MiracleVision 4.0 还推出了全新的视觉模型商店,用户可以选择不同的视觉模型,创造出各种前所未有的效果。AI 视频能力包括文生视频、图生视频、视频运镜和视频生视频四大功能。用户可以通过输入提示词,生成自然流畅的视频,让图片动起来,模拟专业的镜头运动,甚至将现有的视频加入不同的艺术风格。MiracleVision 4.0 的视频生成能力已融入电商和广告行业工作流,特别适用于制作商品展示和品牌广告,提升视觉效果。
  • 相关推荐
  • 400亿美图,靠AI重生了

    今年以来股价暴涨超255%,市值重回400多亿,美图(1357.HK)这家老牌影像工具公司,在被资本市场遗忘多年后,正以一种极为凶猛的姿态重返牌桌。 在AIGC(生成式人工智能)千帆竞发、百模大战仍在烧钱换未来的混沌格局中,美图是将滚烫的AI概念,真正熬成了一碗利润浓汤的企业。半年净赚近4个亿、付费用户突破1500万的业绩,无疑证明它饮到了这波AI应用大爆发的“头啖汤

  • 都是做AI应用,为什么「美图」能持续让用户付费

    这是《窄播Weekly》的第65期,本期我们关注的商业动态是:美图抓住AI带来的战略机遇,让付费订阅收入实现了连续增长,超过广告业务成为主要营收支柱。 美团在8月18日发布的最新一份财报显示,其2025年上半年总收入为18亿元,经调整归母净利润为4.7亿元,同比增长71.3%。其中,以付费订阅为主的影像与设计产品业务收入达到13.5亿元,同比增长45.2%,占总收入的74%。 这背后是

  • AI日报:B站测试AI视频工具花生AI;腾讯发布多模态模型Large-Vision;昆仑万维开源Skywork UniPic 2.0

    【AI日报】主要内容: 1. B站测试"花生AI"视频工具,3分钟可成片,同时推进自研大模型和多语言翻译功能 2. 昆仑万维开源多模态模型Skywork UniPic 2.0,实现高效统一的多模态生成能力 3. 马斯克指责苹果偏袒OpenAI,苹果回应称平台设计公平公正 4. 腾讯混元发布52B参数多模态理解模型Large-Vision,支持任意分辨率输入 5. DeepSeek官方否认8月发布R2模型的传闻 6. OpenAI推出超值ChatGPT Go套餐,仅399卢比降低使用门槛 7. AI新贵Perplexity豪掷345亿美元收购谷歌Chrome 8. Anthropic的Claude Sonnet 4模型支持100万token上下文 9. ChatGPT重大更新:恢复GPT-4o默认模式,为GPT-5引入多模式选择,优化交互体验

  • vivo Vision官宣8月21日发布:佩戴舒适 设计超前

    就在刚刚,vivo正式官宣了自家新产品的发布时间。根据vivo官方公告,8月21日下午14点30分,备受期待的Vision将正式与大众见面。 vivo Vision被看作是类苹果Vision Pro的MR头显设备,从目前透露的信息来看,它在交互体验方面有着超前的设计。vivo产品经理韩伯啸提前剧透了不少关键细节,引发了众多科技爱好者的关注。 韩伯啸着重强调了vivo Vision的佩戴舒适性,他表示这款设备非�

  • AI日报:阿里开源Qwen-Image-Edit;淘宝“AI万能搜”功能灰度测试;小红书发布DynamicFace人脸生成技术

    本期AI日报聚焦多项AI领域创新:1)阿里开源Qwen-Image-Edit图像编辑模型,支持中文渲染与精准文本编辑;2)淘宝测试"AI万能搜"功能,重构电商搜索体验;3)小红书发布DynamicFace人脸生成技术,实现高质量图像视频换脸;4)Gemini API新增URL Context功能,简化网页内容获取流程;5)Nvidia推出小型开放模型Nemotron-Nano-9B-v2,支持智能推理开关;6)马斯克发布Grok Imagine 0.1测试版,进军AI图像生成领域;7)Vercel推出iOS版AI开发工具v0;8)理想汽车发布MindGPT 3.1模型,处理速度提升5倍;9)ToonComposer工具简化动画制作流程;10)ElevenLabs推出视频到音乐生成流程。

  • vivo Vision探索版发布 将于明日开放线下体验

    今日下午,vivo正式发布了备受瞩目的vivo Vision探索版MR头显,尽管该设备暂未确定上市销售时间,但已引发市场广泛关注。从8月22日起,北京、深圳等10余座城市的12家vivo官方授权体验店将率先开启抢先预约体验活动,后续还将有第二批线下体验门店加入,让更多消费者有机会亲身感受这款创新产品的魅力。

  • 豆包1.5 Vision Lite 对比 GPT-5-min,谁更适合你?实测AI模型选型利器|AIBase

    文章探讨了企业选择AI大模型时面临的实际决策难题,指出单纯比较学术参数无法满足业务需求。AIBase模型对比平台(https://model.aibase.cn/compare)通过三大核心价值解决痛点:1)聚焦业务场景而非参数堆砌,突出价格、语言支持、上下文长度等实用维度;2)透明化成本计算,标注长文本溢价规则和多模态附加费;3)一键生成对比报告。平台特别强调中文场景的特殊性(如豆包1.5在中文处理成本的优势),并揭示厂商宣传中容易忽略的隐藏成本(如GPT-5-min超5000字符的30%溢价)。典型电商客服案例显示,需综合中文理解、多模态、性价比等维度决策,最终选择取决于具体业务需求而非绝对性能排名。

  • 微软发布AI截图工具,截图一键转PPT

    微软电脑管家推出全新“智能圈选”功能,通过AI技术实现截图内容的智能识别与重构。用户只需圈选截图区域,即可一键完成文字提取、多语言翻译及PPT转换等操作,大幅提升办公和学习效率。该功能支持100多种语言,保留原始格式,并能智能修复遮挡内容,彻底改变了传统截图处理方式。

  • 微云全息(NASDAQ:HOLO)打造区块链创新型金融协同设计方案,引领行业变革

    金融行业协同工作面临效率与安全挑战。微云全息开发的金融智链协同方案融合区块链技术,通过智能合约、分布式账本和先进加密技术,实现数据安全、透明同步与自动化处理。该方案提升协同效率,保障数据完整性,支持跨机构无缝协作,有望推动金融行业建立更高效、安全的协同标准,促进金融科技发展。

  • AI日报:智谱AI发布AutoGLM 2.0;腾讯元宝接入腾讯视频;字节发布开源大语言模型 Seed-OSS

    本期AI日报聚焦多项AI技术突破:智谱发布革命性语音代理AutoGLM 2.0,实现全平台语音操控;腾讯元宝接入视频平台提升观影便捷性;字节跳动开源大模型Seed-OSS专注长文本处理;速卖通AI代理助力新品推广效率翻倍;微软测试Copilot智能文件搜索功能;Liquid AI推出低延迟视觉语言模型LFM2-VL;OpenAI月收入首破10亿美元;谷歌Pixel 10系列全面升级AI功能,包括情感识别和实时翻译;Pixel Buds Pro 2引入AI手势控制;ElevenLabs发布支持70+语言的文本转语音API。

今日大家都在搜的词: