首页 > AI头条  > 正文

阿里云通义万相发布全新图像编辑模型ACE 实现一键图片修改

2024-12-02 09:54 · 来源: AIbase基地

本周,阿里云通义万相团队推出了全新的图像编辑模型ACE,旨在为用户提供更加便捷、智能的图片生成与编辑服务。用户仅需通过简单的口语化指令,就能生成或修改图片,极大简化了图像编辑的复杂度。该工具支持广泛应用场景,包括风格化写真、分镜制作、室内设计等。

QQ20241202-095122.png

ACE模型不仅支持文本生成图像(文生图),还具备强大的图像编辑功能。用户可以通过对话的方式进行可控视觉编辑、元素修改、区域重绘、分层编辑等任务。

例如,用户只需输入“修改证件照背景”或“一键去除水印”等指令,即可轻松实现类似于Photoshop的功能。值得注意的是,ACE的局部风格化功能已经在通义App上线,进一步提升了用户体验。

据官方介绍,ACE模型的核心创新在于其独特的Long-context Condition Unit(LCU)模块。LCU能够支持多模态条件输入,满足各种通用编辑任务的需求,并且搭建了完整的编辑数据构造链路和指令集生成链路,从而保证了图像编辑效果的精准性与高质量。

QQ20241202-095154.png

ACE的推出,不仅让AI在图像编辑领域的应用更加广泛,也为全球开发者提供了开源支持,标志着阿里云在智能图像处理技术领域的进一步突破。这一新工具将极大地提升图片处理的效率和便捷性,为用户带来更具创意和个性化的编辑体验。

开源地址:

https://github.com/ali-vilab/ACE

体验地址:

https://huggingface.co/spaces/scepter-studio/ACE-Chat

魔搭社区:

https://www.modelscope.cn/models/iic/ACE-0.6B-1024px

  • 相关推荐
  • AI日报:通义千问开源Qwen3向量模型;字节跳动图像编辑模型SeedEdit 3.0;ElevenLabs推v3语音模型

    本文汇总了近期AI领域的重要动态:1)通义千问发布Qwen3-Embedding系列模型,在多语言文本处理表现优异;2)字节跳动推出图像编辑模型SeedEdit3.0,提升细节保持能力;3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha;4)Anthropic推出面向国家安全的Claude Gov模型;5)可灵AI月收入连续两月超1亿元;6)Meta公布智能眼镜Aria Gen2技术细节;7)爱诗科技上线AI视频工具"拍我AI";8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

  • 鸿蒙微信1.0.7.16开启邀测升级:支持管理黑名单、图片发送前编辑

    鸿蒙微信1.0.7.16(1050384)版本开启邀测升级,测试时间为2025/5/26-2025/6/25,需收到短信通知后点击链接跳转安装,无法主动下载安装。 这次升级功能更加完善,新增了包括管理通讯录黑名单、图片发送前支持编辑、置顶聊天支持折叠等实用功能。

  • AI日报:阿里云通义灵码AI IDE上线;小米多模态大模型Xiaomi MiMo-VL开源;黑森林实验室推出FLUX.1Kontext

    【AI日报】今日AI领域重要动态:1)阿里云推出通义灵码AI IDE,集成千问3模型,显著提升编程效率;2)小米开源多模态大模型MiMo-VL-7B,性能超越更大规模闭源模型;3)黑森林实验室发布FLUX.1Kontext图像生成模型,支持文本和参考图像多次编辑;4)Midjourney V7渲染速度提升40%,新增用户投票功能;5)DeepSeek R1-0528大模型在AGI领域取得突破,性能超越xAI等公司;6)Hugging Face进军机器人市场,推出开源人形机器人HopeJR;7)字节跳动火山方舟接入DeepSeek最新大模型;8)Anthropic开源"电路追踪"工具,揭示大模型决策过程;9)阿里巴巴开源自主搜索AI智能体WebAgent;10)Hume发布低延迟语音语言模型EVI3;11)Manus Slides支持一键生成专业幻灯片;12)Runway Gen-4 References支持手机照片艺术化处理。

  • AI日报:通义千问3大模型全球爆火;即梦图片3.0智能参考全量上线;智谱AI企业级超级助手Agent CoCo上线

    【AI日报】今日AI领域重要动态:1.通义千问3大模型全球下载量超1250万,衍生模型13万+;2.即梦图片3.0上线,AI设计进入"零门槛"时代;3.智谱AI发布企业级超级助手Agent CoCo;4.百度推出金融行业大模型"千帆慧金";5.小红书开源首个大模型dots.llm1,含1420亿参数;6.Hugging Face开源LeRobot项目,降低机器人研发门槛;7.ChatGPT语音功能升级,支持更自然对话翻译;8.Google Gemini应用下载量超ChatGPT但活跃度不足;9.轻量级文档解析模型MonkeyOCR表现优异;10.Google Veo3推出高速视频生成模式;11.Google调整AI Studio政策,限制Gemini2.5Pro免费访问。

  • 剑星修改器+热门mod大全推荐!皮肤+武器+语音mod一键安装!

    《剑星》PC版于6月12日正式发售,游戏Demo上线后已引发热潮。文章重点介绍了XMOD软件提供的丰富MOD合集,包含40多款热门外观MOD(如蒂法、猫女郎等角色造型)和实用功能MOD(武器一键切换、视角优化等)。该工具还附带修改器功能,可调节贝塔能量等参数。目前正逐步上线技能解锁、全服装解锁等新功能,玩家输入口令【剑星】即可免费体验。MOD内容持续更新中,为玩家提供更丰富的游戏体验。

  • 月访问量超千万的AI图片产品,如何炼成

    作为与 AI 最容易产生化学反应的图片行业,在 AIGC 来临后最早起势,但同样面临竞争激烈、产品同质化等挑战,而在如今图片编辑细分方向几乎处于横盘的状态下,这类产品前路如何、团队如何维系用户基础、又怎样探索新的增长机会?在上个月的 GTC 全球流量大会上,我

  • 如何辨别AI生成的图片文字声音?分享一些小技巧

    在人工智能生成内容日益普及的今天,辨别AI生成的图片、文字和声音变得尤为重要。以下是一些实用的技巧,希望能帮到你……

  • 即梦图片3.0又重磅更新,这可能是对普通人最有用的一次。

    MD,这次连设计师的参考图也一键干碎了。。。 我测了整整一夜,现在是凌晨4点21,我还在写这篇文章。 我人真的傻了,我真的不愿意用一些什么很夸张的词语,但是即梦的绘图,每一次,带给我的震撼,都会觉得,我这么多年的设计师生涯,在AI的进化速度面前,不值一提。 什么样的言语,都无法比拟直接看图来的直接,直接给你们看效果。 这是一张,很好看的北京的�

  • 份额增速双领跑,阿里云引领中国金融云进入全面智能化新阶段

    IDC最新报告显示,2024年中国金融云市场规模达692亿元,同比增长11%。阿里云以18.4%的份额稳居第一,增速16%远超行业均值,实现份额与增速"双领跑"。自2019年起,阿里云已连续6年蝉联中国金融云市场冠军,覆盖6大核心子领域。当前金融云市场呈现多元化发展趋势,主要受金融机构IT支出增长驱动,特别是在智算基础设施、大模型应用创新及核心系统改造等方面。阿里云凭借全栈AI云实力构建技术壁垒,推动金融行业从技术升级走向智能服务能力竞争。报告指出,阿里云在公有云基础设施市场以41%份额领先,平台解决方案市场份额攀升至33%,基于AI大模型和核心云原生方案实现纵深突破,形成覆盖IaaS、PaaS、MaaS全技术栈的服务闭环。未来,阿里云将通过三大能力矩阵重塑行业格局:全面一体化云技术架构升级、金融大模型开放生态矩阵及全球化服务护航金融科技出海。

  • 阿里云”618创新加速季“开启:先进、领先的大模型限免 超7000万 token,加速多场景 AI 应用落地

    阿里云启动"618创新加速季"活动,聚焦AI创新与云端智能,推出多项优惠:1)提供7000万+免费大模型token体验及最高1728元优惠券;2)通义大模型限免超7000万token,推出10-100元多档资源包,GPU服务0.9折起;3)PAI平台推出通用节省计划,最低3折;4)针对中小企业推出AI火花会主题活动,提供场景化定制服务;5)基础云产品全线优惠,包括轻量服务器38元/年、RDS MySQL 88元/年等。活动还包含5亿算力补贴计划、10万元出海满减券等专项支持,助力企业智能化升级。

今日大家都在搜的词: