首页 > 业界 > 关键词  > Omost最新资讯  > 正文

ControlNet作者推新项目Omost 一句话变构图小作文 再也不用为写提示词头疼了

2024-06-03 09:46 · 稿源:站长之家

站长之家(ChinaZ.com)6月3日 消息:近日,ControlNet的作者推出了一个全新的项目——Omost。这个项目对现有图像模型的提示词理解有着巨大的帮助。通过很短的提示词,就可以生成非常详细并且空间表现很准确的图片。

Omost通过预定义的位置、偏移量和区域三大参数来简化图像元素的描述。这使得用户能够更直观地指定图像中各个元素的位置和大小,从而生成高质量、符合预期的图像。

使用Omost,你只需要输入简单的提示词,LLM就可以生成图像每个区域的简单提示和位置信息。然后针对图像九宫格的简单提示词继续扩展,保证了每一部分都有非常详细的描述。

比如,我输入创建一个梦幻的空中城堡,然后它给我返回了一段非常详细的图像描述:

这张照片展示了一座漂浮在高空的梦幻空中城堡,

“城堡完全由玻璃和闪闪发光的金属制成,反射出耀眼的阳光。”,

“精致的桥梁连接着各种塔,每座塔都装饰着复杂的雕刻和发光的符文。”,

“城堡周围的天空是柔和柔和色调的渐变,从黎明的粉红色过渡到黄昏的蓝色。”,

“下面是郁郁葱葱的森林、波光粼粼的河流和连绵起伏的山丘。”,

“整个场景笼罩在一种神奇的氛围中,柔和空灵的光束照亮了城堡,营造出一种奇妙和迷人的感觉。”

然后点击生成图像,它就会将上面的提示转化为图像返给你:

image.png

效果还不错。我们也可以将提示词复制到MJ中生成。效果如下:

image.png

更牛逼的是,Omost已经完成的图像整体布局可以保留,如果你想修改画面中的某个元素,也只需要一句提示词即可。比如你原来的画面主体是龙,你可以直接把龙变成恐龙。

image.png

项目亮点:

  1. 自动扩展提示词:Omost能够将简单的提示词拆解成详细的描述,从图像整体到局部元素的位置和大小均能详细说明。例如输入“a funny cartoon batman fights joker”,系统会生成蝙蝠侠与小丑战斗的完整图像。

  2. 高灵活性:生成的图像布局可以保留,用户可以通过简单的提示词对图像中的某个元素进行修改。比如,将龙变成恐龙,系统会根据新提示生成修改后的图像。

  3. 图像位置编码:Omost通过将图像划分为729个不同的位置来简化图像元素的描述。每个位置包括预定义的参数,如位置、偏移量和区域,确保图像生成的准确性和细致度。

  4. 子提示系统:所有Omost LLM都经过训练,可以提供严格定义的“子提示”,这些子提示可以独立描述事物,并任意组合形成完整的提示。这种设计提高了提示词的灵活性和准确性。

  5. 注意力操纵:Omost使用注意力分数调整技术来控制图像生成过程中的区域关注度,实现更精细的图像生成。通过调整注意力分数,Omost能够生成符合提示词描述的图像元素。

  6. 提示前缀树:Omost引入提示前缀树技术,通过合并子提示来改进提示理解和描述。例如,可以将路径“a cat and a dog. the cat on the sofa”作为提示,从而生成相应图像。

Omost的实现和使用

Omost项目基于Llama3和Phi3变体模型,用户可以通过提供简单的提示词来生成复杂的图像。以下是该项目的几个关键组件:

  1. 位置和偏移量:将图像划分为9个位置,每个位置进一步划分为81个偏移量,共有729个边界框,用于描述图像元素的位置。

  2. distance_to_viewer和HTML_web_color_name:用于调整图像元素的视觉表现,通过组合这些参数可以生成粗略的图像构图。

  3. 注意力操纵:基于注意力分数操作的baseline渲染器,通过调整注意力分数来控制不同区域的模型关注度。

应用和前景

Omost技术的推出,不仅简化了提示词的编写,还提高了图像生成的精确度和灵活性。其应用场景包括但不限于AI绘画、图像设计、广告创意、教育等领域。用户可以通过简单的提示词生成复杂的图像,为创意设计提供了强大的工具支持。

项目页:https://top.aibase.com/tool/omost

试玩地址:https://huggingface.co/spaces/lllyasviel/Omost

举报

  • 相关推荐
  • 千部难有一部破亿,AI短剧停止“狂飙”?

    ​AI短剧正在经历一次行业大洗牌。 去年11月,红果豪掷60的分成系数,扶持仿真人短剧。今年2月,Seedance2.0上线,无数团队涌向这片蓝海,期待复制真人短剧的造富神话。 4月,抖音集团短剧版权中心发布通知,AI仿真人剧分成系数从60砍至40,动画漫剧系数从50降至40。多名行业人士表示,红果还部分取消了AI短剧的保底政策。

  • 一张表看懂:AI for security vs Security for AI

    企业布局AI安全需同时推进“AI赋能安全”与“安全保护AI”两大方向,而非二选一。前者通过智能系统主动防御,后者确保AI模型本身不被攻击。正确策略是先给AI上保险(锁好门),再让AI当保安(守好院)。青藤云安全提出五步闭环方案:盘点AI资产、加密数据与管道、接入SOC、纳入云安全态势管理、持续监控模型漂移。作为AI原生安全领军者,其产品体系覆盖全栈领域,已服务超千家客户。

  • 当AI努力了解万物,骁龙让AI全新了解你

    520当天,上海北外滩江畔绽放由万朵玫瑰构成的“骁龙·AI的告白”装置,伴随《I Will Follow You》的旋律,这场科技告白不仅是浪漫仪式,更体现了骁龙对AI时代的深层思考。当行业努力让AI认知万物时,骁龙选择让AI全新了解你,聚焦以人为本、专属个体的智能内核,推动AI从认知世界走向读懂人心,实现从冰冷工具到温情陪伴的跨越,让“懂你”成为科技进化的核心密码。

  • 当AI努力追求算力,骁龙让AI释放你的潜力

    520上海北外滩,蛟龙以一场“AI的告白”城市艺术装置,将科技浪漫具象化。万朵红玫瑰临江而立,呼应主题曲《I Will Follow You》。当行业沉迷算力竞赛时,蛟龙跳出技术内卷,主张AI回归人本——算力不是冰冷堆砌,而是释放人的潜能。通过覆盖全球35亿终端的全场景生态,蛟龙将算力优势转化为赋能价值,让每个人被看见、被激发。最好的科技不是自我强大,而是让你更强大。

  • 你还在靠感觉和AI“聊天”? 这个工具让你精准驱动 AI 深度产出

    AIBase推出「AI对话问题挖掘」工具,解决用户面对AI不知如何提问的困境。只需输入核心关键词,系统自动挖掘用户真实高频提问,提供带热度指数的问题推荐。该工具帮助内容创作者、SEO运营者、品牌营销团队和AI重度用户精准锁定内容方向,驱动AI输出深度内容。它构建了从关键词到问题挖掘、Prompt驱动再到理想内容产出的完整AI内容生产链,让内容创作从“碰运气”变为“有依据”,助力掌握GEO时代流量红利。

  • 圆满收官|睿晰AI亮相中欧2026年度营销论坛以体系化AI构筑品牌增长新壁垒

    2026年6月6日,中欧国际工商学院举办以“AI平权时代的品牌与商业增长”为主题的营销论坛,汇聚数百位学界、产业界与投资圈嘉宾,探讨AI时代品牌增长的核心逻辑与实践路径。论坛指出,在AI能力逐渐“平权”的背景下,品牌竞争转向体系化、效率化与专业化。波司登、九牧、Peet’s Coffee等企业分享了AI赋能品牌管理的案例。作为官方合作伙伴,睿晰AI提出“企业的AI品牌部”理念,通过Multi-Agent体系实现品牌洞察、舆情管理、内容生成等核心能力的智能化与自动化,助力企业以极低成本构建可持续增长壁垒。

  • 快鹭科技亮相AI+ Power 2026,一站式AI智能办公赋能全球企业数字化

    快启科技参加香港AI+ Power 2026展会,展示AI智能办公解决方案。展会汇聚微软、字节跳动、科大讯飞等全球AI产业链头部企业,近万名政企嘉宾参与。快启科技推出AI-CRM、AI+HR等7大办公场景方案,以及Claw智能体平台和AI领域专家产品,实现财务、人事、行政等场景的智能化。公司已在深圳、北京、上海、香港、新加坡等十余个地区设立总部,服务全球超1000家企业,落地200余个智能体数字化项目,推动AI从概念走向规模化产业落地。

  • 当AI努力快速发展,骁龙让AI快速回应你

    520上海北外滩,黄浦江畔的玫瑰花香中,一场科技告白引人深思。当AI以指数级速度狂奔,行业陷入“速度崇拜”,却忽略了人的节奏。文章指出,真正的AI价值不在于跑得多快,而在于是否读懂人的等待、焦虑与期待。我们习惯了适应技术、等待加载,却忘了当下的一次及时回应胜过宏大的未来。技术可以无限向前,但人的生活永远活在当下,真正的科技温度是无数瞬间里的及时响应与默契理解。

  • 当AI努力拓展边界,骁龙让AI懂得尊重你的边界

    520上海北外滩,蛟龙以“AI的告白”创意装置将科技浪漫融入城市烟火。万朵红花铺展成诗意景致,《I Will Follow You》的旋律温柔回响,这场面向大众的温情表达不止于节日仪式感,更抛出智能时代的深层命题——当全行业AI疯狂拓展能力边界、不断向外探索时,蛟龙始终坚守底线,让AI真正懂得尊重你的边界。这份“向外拓界、向内守界”的清醒,正是蛟龙赋予AI的人文底色,也是科技最动人的克制与温柔。

  • AI叙事拐点,中国AI公司要押上更多筹码

    这是《窄播Weekly》的第90期,本期我们关注的商业动态是:中国AI公司在继续扩大资本投入。 5月13日下午,腾讯召开股东大会。被问及AI业务进展时,马化腾说了这样一番话:「一年前我们以为上了船,后来发现那个船漏水了,现在感觉站上去了,还坐不下去,还是希望船速能快一点。」 同一天,腾讯和阿里巴巴发布最新季度财报,AI业务进展成为两家财报电话会的核心议题。 �

今日大家都在搜的词: