2月10日,阿里巴巴集团正式推出其图像生成与编辑模型的最新版本。
据悉,该模型在近期一项国际性的图像生成技术评估中表现优异,综合得分位居前列,超越了多个同类型知名模型。
新版模型在技术能力上实现显著提升。它能够处理超长文本指令,并生成高分辨率图像,在准确还原复杂描述细节方面能力突出。尤其值得一提的是,该模型在中文文本,包括古典文学段落的图像化呈现上,展现了出色的精准度和适应性,能够满足从专业信息图表、演示文稿到艺术海报等多种场景的创作需求。
此次发布的新版本是对此前技术方案的整合与升级。通过统一的模型架构,该版本同时涵盖了图像生成与编辑两大核心功能,在保证输出质量的同时,提升了处理效率。
从生成的图像效果来看,无论是人物肖像的细微纹理、自然风光的宏大场景,还是建筑结构的精确线条,其输出结果在质感与真实感上均达到了较高水准。
根据公开的评测数据,该模型在图像生成与图像编辑两个细分领域的测试中均获得了高分,综合排名处于全球领先梯队。
在针对中文的专项测试中,该模型能够准确、清晰地以多种字体样式渲染大量汉字,在这一特定技术指标上展现了竞争优势。
得益于其强大的文本理解与渲染能力,用户可通过输入详细的描述,来生成符合专业要求的复杂视觉内容,例如完整呈现长篇古文书法效果的配图,或结构严谨、格式规范的论文示意图等。
在实际应用层面,该技术可协助用户快速创建各类实用图像,例如烹饪步骤流程图、旅游攻略示意图、多格漫画、儿童插画以及风格写实的宣传海报等。
此外,该模型也支持对用户上传的现有图片进行智能编辑与再创作,实现诸如生成系列化主题照片、制作个性化表情包、合成双人合影或为图片添加艺术化文字注解等功能。
(举报)
