首页 > 业界 > 关键词  > StableDiffusion最新资讯  > 正文

Stable Diffusion怎么自定义AI人物图像动作姿势

2023-03-29 15:48 · 稿源:站长之家用户

ControlNet出来后成为Stable Diffusion界的热门话题,人们终于可以控制 AI 绘图中的很多元素,如:背景结构、人物姿势等,而前阵子推出的OpenPose Editor能在 Web UI 上直接建立用于指定姿势的骨架图,非常方便!(本文中使用的角色图全部由AI生产)

不过近期释出的这个 Posex 更厉害!可以直接在生图界面进行操作不用切换页签,且支持3D 旋转的功能!记得要先安装好ControlNet再来看这篇图文。另外如果要解决手部的问题,可以再搭配Depth map library and poser一同使用!

Posex:https://github.com/hnmr293/posex

1.jpg

打开 Stable Diffusion web UI 切到「扩充功能」页面,选「从网址安装」,将扩充功能完整的 git 网址(即https://github.com/hnmr293/posex.git)输入进去再点「安装」按钮,安装完毕可以在stable-diffusion-webui\extensions\ 路径下看到名为 posex 的资料夹。

剩余65%的图文内容打赏作者后可查看

举报

  • 相关推荐
  • Trae重磅升级:全面开放自定义AI能力,用户可打造个人专属“AI 工程师”

    Trae新版本通过整合AI技术,提供更智能、高效的开发体验,支持多语言文件输入与多种功能扩展。它突破传统IDE模式,强调人机协作与个性化定制,实现需求快速转化和技术方案优化。同时,其开放的插件系统和自定义能力,满足不同场景的专业开发需求,推动AI在编程领域的深度融合与创新应用。

  • AI日报:ChatGPT重磅上线图像库功能;白嫖!Veo2登陆谷歌AI Studio;蚂蚁百宝箱推“MCP专区”

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、报道称字节跳动整合 AI 研发团队,AI Lab 即将并入 Seed字节跳动正在进行AI研发团队的整合,将独立的字节AI Lab并入Seed团队。这一举措体现了字节在AI领域战略布局的调整,旨在进�

  • AI日报:Kimi全新音频基础模型Kimi-Audio;阶跃星辰开源图像编辑模型Step1X-Edit;​夸克AI超级框上线 “拍照问夸克”

    本期AI日报聚焦多项AI技术突破与应用:1)Moonshot AI推出开源音频模型Kimi-Audio,基于13亿小时训练数据,支持语音识别等任务;2)阶跃星辰开源图像编辑模型Step1X-Edit,展现强大生成能力;3)夸克AI上线"拍照问夸克"功能,实现视觉问答;4)苹果iOS18.5将在中国推送,带来智能功能;5)谷歌发布601个生成式AI应用案例,覆盖多行业;6)微软推出深度整合Windows的UFO²自动化系统;7)OpenAI升级ChatGPT至GPT-4o版本,提升STEM领域能力;8)Ema公司推出高性价比语言模型EmaFusion;9)Liquid AI发布面向边缘设备的Hyena Edge模型;10)LemonAI推出实时音视频数字人产品Slice Live。此外,国内方面,智谱与生数科技达成战略合作推动大模型发展,宝马中国宣布新车将接入DeepSeek技术。

  • UniToken:多模态AI的“全能选手”,一次编码搞定文理解与图像生成

    复旦大学与美团研究者提出UniToken框架,首次在统一模型中实现图文理解与生成任务的"双优表现"。该方案融合连续和离散视觉编码,有效解决了传统多模态建模中的"任务干扰"和"表示割裂"问题。通过三阶段训练策略(视觉语义对齐、多任务联合训练、指令强化微调),UniToken在多个基准测试中性能超越专用模型。其创新性体现在:1)统一的双边视觉编码

  • 苹果Vision Air曝光:采用钛金属 设备更轻

    快科技4月17日消息,当前Vision Pro 256G版本售价为29999元起,设备重量为600克至650克,根据遮光罩和头带配置不同可能有所差异,其单独的电池重量为353克,不少线下体验者表示,该头显的重量影响其体验舒适度。苹果也意识到了这个问题,其下一代头显的研发重点是减重”,有博主在社交平台上爆料称,苹果正在研发全新头显Vision Air,其特点是采用轻量化设计,同时带来午夜�

  • 勾勒AI产业“新高地”蓝,首届酒仙桥论坛定义AI发展四大趋势

    4 月15日,为期 6 天的 2025 酒仙桥论坛在北京数字经济算力中心正式启幕。论坛汇聚产学研各界领袖及头部企业代表,聚焦人工智能产业“未来前景、创新应用、生态发展”三大核心领域,探索加快培育新质生产力的实践路径。AI已进入黄金发展期,如何推动AI从技术转化为生产力,是行业内备受重视的议题。在这场以“开启AI生产力元年”为主题的论坛上,与会嘉宾纷纷从模型�

  • 苹果Siri团队大换血!Vision Pro班底全面上马

    苹果正对Siri团队进行大规模重组,由新任工程主管Mike Rockwell主导改革。Rockwell从Vision Pro项目调来核心成员,重组了语音、理解、性能等关键团队。Vision Pro项目副手Ranjit Desai将负责Siri主要工程事务,Olivier Gutknecht接手用户体验设计。此次重组旨在简化开发流程,提升Siri功能。苹果AI/ML团队此前因管理混乱被员工戏称为"AI/less"。业内建议苹果应考虑重塑Siri品牌形象,推出全新数字助手以摆脱负面评价。

  • 苹果要 all in 智能眼镜?Vision Pro 2 也已准备就绪

    苹果已着手开发轻便且低价的 AR 智能眼镜,同时也在开发第二代头显设备 Vision Pro。

  • vivo Vision混合现实头显宣布下半年发布

    vivo宣布其MR设备vivo Vision将于今年下半年正式发布,引发市场广泛关注。该设备可能与vivo X300系列手机同步上市,形成产品矩阵效应。Vision头显设计借鉴夏普Vision Pro风格,采用曲面抛光镜片,集成了多颗摄像头,但具体技术参数尚未公开。此布局被视为vivo战略转型的关键一步,旨在通过MR技术强化实时空间计算能力,为基础的未来机器人物联网应用奠定基础。vivo计划打造一套视觉感知系统,重点提升机器人的视觉捕捉、处理、理解、空间建模及边缘计算等五大维度的智能化水平。这一战略定位依赖于依图科技在AI大模型与混合现实技术领域的积累,vivo加速布局机器人赛道的相关落地措施已进入实质推进阶段。伴随Vision头显的发布,行业或将迎来新一轮技术竞争。这被寄予厚望的设备能否在空间计算领域实现突破,仍需等待市场验证。

  • Arm携手AWS助力实现AI定义汽车

    文章探讨了人工智能(AI)与软件定义车辆(SDV)结合对汽车行业的影响,通过AI生成模型优化驾驶体验及人机交互能力。AWS和Arm合作开发的解决方案展示了如何利用边缘计算、物联网(IoT)和量化技术提升汽车智能化水平。重点介绍了基于Arm CPU优化的AI指令集(如SDOT和i8mm),以及KleidiAI在模型压缩和推理加速上的贡献,使AI应用更高效且资源友好,为未来智能汽车发展提供了新方向和技术支持。