首页 > 业界 > 关键词  > 伪代码prompt最新资讯  > 正文

保姆级教程:一个伪代码prompt让ChatGPT自动生成多张绘本图片

2024-06-17 18:02 · 稿源:站长之家

站长之家(ChinaZ.com) 6月17日 消息:相信不少朋友都在小红书之类的平台上看到过不少绘本类的作品。想要利用AI产品生成这类优质的作品,往往需要根据脚本,一句一句地去生成插画作品,费时费力。

虽然市面上已经有不少AI绘本生成产品,但据小编体验的几个来看,还是需要费一些时间去调整角色的,而且有的还要将角色手动插入背景中,操作起来还是有点繁琐的。

所以目前来说,用AI制作绘本,最快的方式还是通过ChatGPT

最近,有一位名叫尹相志的网友在YouTube上分享了一个非常实用的prompt技巧,只需要一个伪代码prompt,就可以让ChatGPT自动生成一整套的绘本图片。

儿童睡前故事 插画 儿童读物

图源备注:图片由AI生成,图片授权服务商Midjourney

什么是伪代码?

伪代码是一种用于描述算法或程序逻辑的非正式语言,它使用自然语言和编程语言的混合形式来表达算法的步骤和流程。伪代码的目的是使算法的逻辑清晰易懂,而无需深入到具体的编程语言细节。以下是伪代码的一些基本特点和写作指南:

伪代码的特点:

易读性:使用接近自然语言的表达方式,便于理解。

抽象性:不涉及具体的编程语法,而是关注算法的逻辑结构。

通用性:不依赖于特定的编程语言,具有跨语言的特性。

写作伪代码的步骤:

  • 定义变量:使用变量来存储和操作数据,变量名应具有描述性。

  • 指定数据类型:明确变量的数据类型,如整数、浮点数、字符串、数组等。

  • 描述函数:使用函数来封装重复使用的代码块或特定的任务。

  • 控制流程:使用控制结构来指导程序的执行流程,如条件判断、循环等。

  • 使用条件语句(如 if-else):根据条件来决定执行不同的代码分支。

  • 使用循环结构(如 for、while):对集合中的元素进行迭代处理或在满足条件时重复执行代码。

写伪代码的提示(Prompt):

使用清晰的语言描述算法的每个步骤。

保持伪代码的简洁性,避免不必要的复杂性。

使用适当的缩进来表示代码块的结构。

在必要时添加注释,以解释复杂的逻辑或决策点。

以下是尹相志分享的伪代码prompt:

以下**偽代碼prompt**,請依照其語意一步一步地來執行,不該有遺漏停用代碼解釋器,啟用dalle內部工具,請記得你有能力調用內部工具以文生圖使用繁體中文回覆story=(請你角色扮演成一個暢銷的童書繪本作家,你擅長以孩童的純真眼光看這世界,製作出許多溫暖人心的作品。請以一隻與家人失散,不知道自己是甚麼的小蝌蚪,每次看到跟自己身體一部分相像,他就誤以為是同類,隨著他身體逐漸發展變化,他反而越來越迷惘,故事最後才遇到青蛙,這是一個調整自我認知的故事。) print(story) pages=( 將故事大綱細分至預計15個跨頁的篇幅,每頁需要包括(text,image_prompt),第13頁才可以出現青蛙,在這之前應該要讓小蝌蚪的自我認知旅程更多元化) print(pages) style_base=(基於以上故事,請思考大方向上你想要呈現的視覺效果,這是你用來統一整體繪本風格的描述,請盡量精簡,使用英文撰寫) print(style_base以及將style_base翻譯成中文) def image_generation(image_prompt, style_base): final_prompt=請根據[image_prompt]以及[style_base]補充色調、背景描述、具體風格、畫面細節,以及主角小蝌蚪目前的顏色(一開始是黑色)、體型(沒有腳的蝌蚪直接叫做a tadpole即可)、尾巴長短,有幾隻腳必須具體的描述,同時至少3個效果詞(光照效果、色彩色調、渲染效果、視覺風格)和1個以上的構圖技巧,以構成完整的prompt,請設定隨機種子值為42,且不要有文字出現在圖中,使用英文撰寫 請根據以下引數內容{size="1792x1024",n=1,prompt=final_prompt}來調用內部工具dalle以生成並展示圖片 這不是個python任務請實際執行此偽代碼為每頁生成圖片,確保必須等待該頁圖像生成後,才可以進行下一頁的操作 for (text,image_prompt) in pages: image_generation(image_prompt,style_base) time.sleep(5)

1.jpg

原博主视频点此查看:https://www.youtube.com/watch?v=3rb-54Q5fig

尹相志用一个小蝌蚪的故事测试了伪代码prompt制作绘本的效果,可以看到成品效果很不错,而且画风前后保持一致。

那么,我们如何利用这个prompt制作属于自己的绘本故事呢?具体操作如下:

1、复制上述prompt,修改主体以及一些细节

我们想要利用别人无偿分享的prompt,并作出属于自己的故事,那么首先你要先看懂这串prompt的主要组成部分。

story的部分,前面是你要让ChatGPT扮演的角色,所以【請你角色扮演成一個暢銷的童書繪本作家,你擅長以孩童的純真眼光看這世界,製作出許多溫暖人心的作品】这段就可以保持不变

image.png

后面部分就是你的绘本主要要讲什么故事的概要。原博主讲的是小蝌蚪的自我认知的故事,这里我想要讲一个小狐狸在森林里迷路误入城市后被解救的故事。这个部分是大家可以自由发挥的部分,感兴趣的可以自行尝试修改。

image.png

pages的部分,就是你想要生成绘本的页数,以及你想要在某页体现什么,可以根据自己的需求提出具体要求。

image.png

style_base就是用来定制绘本的风格。如果没有特定想要的风格,就可以让ChatGPT来决定。

image.png

2、输入prompt让ChatGPT执行

image.png

修改好prompt以后,指令输入ChatGPT对话框,让它执行就可以了。可以看到,ChatGPT按照我的要求生成了分页故事的大纲。

接着是根据故事大纲的视觉效果描述和图片生成描述

image.png

调用DALL-E工具后,可以看到它在这里暂停了

image.png

这时候需要你输入“执行生成图片”的指令,它才会继续生成。

然后你就可以看到ChatGPT按照之前的故事大纲按顺序出图啦。

image.png

如果它挺下,你继续发执行生成图片即可。

image.png

3、剪辑成片或打印成实体书

绘本图片制作完成后,大家就可以按照自己的需求剪辑成片或者打印成实体书了。

绘本视频制作步骤:

图片转视频

如果你想要绘本视频更生动一点的话,可以使用Luma最近刚推出的视频生成工具Dream Machine或者即梦来创作动态视频。

具体操作步骤如下:

Dream Machine:

image.png

上传图片,简单描述点生成即可。

视频效果如下:

即梦:

即梦操作也差不多,选择图生视频,上传图片后,再下方输入提示即可。记得运动速度选择慢速。

image.png

视频效果如下:

动态效果弄完后,直接拉到剪映里面添加字幕和朗读即可。

举报

  • 相关推荐
  • AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

    本文介绍了AI日报栏目,聚焦AI领域最新动态。快手推出Kwali视频助手,简化视频制作流程;字节跳动发布USO模型,解决图像生成中风格与主题的矛盾;微软推出Copilot Audio音频模式,提供个性化语音交互;Stability AI升级Stable Audio 2.5,支持高质量音频生成;阿联酋推出开源大模型K2 Think,拥有320亿参数;微信上线智能回复功能,提升公众号运营效率;OpenAI推出ChatGPT开发者模式,支持AI控制外部工具;字节跳动Seed团队发布AgentGym-RL框架,提升语言模型决策能力;月之暗面开源Checkpoint Engine中间件,优化LLM推理效率;B站开源IndexTTS-2.0文本转语音系统,支持情感与时长控制;Replit推出Agent 3编程助手,自主性提升10倍。

  • HTTP 402与微支付:一段沉睡三十年的代码,在AI时代觉醒

    30年前HTTP 402协议因交易成本高、体验割裂和技术缺失而失败,如今AI时代带来消费原子化、决策流线化和主体去人化三大变革,使微支付成为可能。AI代理通过钱包身份、风控机制和无缝支付协议实现高频小额交易,重构互联网经济逻辑,让HTTP 402从理想变为AI经济的支付基石。

  • AI日报:苹果明年推出SiriAI搜索;OpenAI放开ChatGPT Projects功能;Kimi K2-0905 上线 Discord

    本文汇总了AI领域最新动态:苹果与谷歌合作,计划在Siri中引入Gemini AI技术;OpenAI向免费用户开放Projects功能,提升任务管理效率;谷歌推出免费Gemini CLI工具,集成GitHub提升开发效率;OpenAI估值飙升至5000亿美元,二级股票售出103亿美元;苹果自研AI搜索引擎“世界知识问答”计划2026年上线;月之暗面发布Kimi K2-0905模型,提升编程与创意写作能力;Raycast推出Cursor Agent插件优化代码编辑;谷歌发布nano banana官方Prompt模板,助力创意设计。

  • 目标安卓最强平板!荣耀MagicPad3 Pro全面对标iPad Pro、小米平板Ultra

    荣耀MagicPad3+Pro平板即将发布,将搭载第五代骁龙8至尊版芯片,配备13.3英寸超高刷大屏,首发MagicOS 10系统,支持PC级交互能力。对标iPad Pro和小米平板Ultra,目标成为安卓阵营最强平板。预计售价约5000元,因旗舰芯片成本较高。作为参考,荣耀MagicPad 3售价2999元起。

  • 真我GT8 Pro不改名!真我CMO:用产品力说话 而不是用改名发声

    真我GT8系列将于10月发布,包括GT8和GT8 Pro两款旗舰机型。新机搭载高通骁龙8至尊版芯片,采用台积电3nm工艺,配备2K直屏、2亿像素潜望长焦、大师级对称双扬声器等顶级配置。真我高管强调产品力优先,拒绝跟风改名,以Pro之名诠释Ultra级产品实力。

  • StarRocks Connect 2025 圆满落幕:AI Native 时代,数据分析未来已来

    StarRocks Connect 2025峰会圆满落幕,聚焦AI Native时代的数据分析未来。活动汇聚全球开发者与行业专家,分享StarRocks在复杂业务场景中的实践,探讨技术演进方向。从性能引擎到AI原生平台,StarRocks 4.0将支持多智能体协作框架,提升数据分析效率。多家企业展示应用案例,覆盖电商、金融、旅游等领域,验证了其高性能与成本优势。开源精神推动技术创新,共同探索数据智能的无限可能。

  • 美团发布高效推理模型LongCat-Flash-Thinking:部分性能接近GPT5

    9月23日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时,性能更强大、更专业,在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力,扩展了形式化定理证明能力,成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出,多项基准测试成绩领先开源及闭源顶尖模型,已在HuggingFace、Github全面开源。

  • 微信员工回应新iPhone提示空间不足:代码Bug所致

    iPhone 17系列开售后,用户转移微信聊天记录时出现异常提示“设备空间不足”,但实际手机仍有1.29TB可用空间。微信员工“客村小蒋”回应称这是代码Bug,因缓存机制导致开机5分钟内接口返回错误数据。用户只需正常使用手机5分钟后即可恢复正常。该事件提醒用户关注微信聊天记录及缓存对设备空间的影响,同时期待微信团队尽快修复Bug。

  • 旧款Apple Watch也将支持高血压警报:涉及这三款

    苹果在发布Apple Watch Series11与Ultra3两款新品之际,同步宣布了一项惠及旧款用户的重大更新——通过即将到来的watchOS26系统升级,Apple Watch Series9、Series10以及Ultra2三款旧机型也将新增高血压警报功能。这一举措意味着,部分持有旧款设备的用户无需更换新表,即可享受到这一前沿的健康监测服务。 watchOS26正式版定于9月15日正式向全球用户推送。新增的高血压警报功能依托于Appl

  • 苹果Apple Watch高血压通知功能上线

    苹果公司宣布将在全球150多个市场推出Apple Watch高血压通知功能,该功能将随watchOS 26和iOS 26系统更新正式推送。目前英国、法国、德国等地区用户已可体验,但加拿大等部分市场尚未开放,中国大陆地区仍需等待监管审批。该功能依托光学心率传感器,可实时监测用户血管对心跳的反应,识别慢性高血压迹象,并在检测到异常时发出提醒。系统会分析用户最近30天的数据,通过先进算法判断是否需要发出通知。

今日大家都在搜的词: