首页 > 业界 > 关键词  > 伪代码prompt最新资讯  > 正文

保姆级教程:一个伪代码prompt让ChatGPT自动生成多张绘本图片

2024-06-17 18:02 · 稿源:站长之家

站长之家(ChinaZ.com) 6月17日 消息:相信不少朋友都在小红书之类的平台上看到过不少绘本类的作品。想要利用AI产品生成这类优质的作品,往往需要根据脚本,一句一句地去生成插画作品,费时费力。

虽然市面上已经有不少AI绘本生成产品,但据小编体验的几个来看,还是需要费一些时间去调整角色的,而且有的还要将角色手动插入背景中,操作起来还是有点繁琐的。

所以目前来说,用AI制作绘本,最快的方式还是通过ChatGPT

最近,有一位名叫尹相志的网友在YouTube上分享了一个非常实用的prompt技巧,只需要一个伪代码prompt,就可以让ChatGPT自动生成一整套的绘本图片。

儿童睡前故事 插画 儿童读物

图源备注:图片由AI生成,图片授权服务商Midjourney

什么是伪代码?

伪代码是一种用于描述算法或程序逻辑的非正式语言,它使用自然语言和编程语言的混合形式来表达算法的步骤和流程。伪代码的目的是使算法的逻辑清晰易懂,而无需深入到具体的编程语言细节。以下是伪代码的一些基本特点和写作指南:

伪代码的特点:

易读性:使用接近自然语言的表达方式,便于理解。

抽象性:不涉及具体的编程语法,而是关注算法的逻辑结构。

通用性:不依赖于特定的编程语言,具有跨语言的特性。

写作伪代码的步骤:

  • 定义变量:使用变量来存储和操作数据,变量名应具有描述性。

  • 指定数据类型:明确变量的数据类型,如整数、浮点数、字符串、数组等。

  • 描述函数:使用函数来封装重复使用的代码块或特定的任务。

  • 控制流程:使用控制结构来指导程序的执行流程,如条件判断、循环等。

  • 使用条件语句(如 if-else):根据条件来决定执行不同的代码分支。

  • 使用循环结构(如 for、while):对集合中的元素进行迭代处理或在满足条件时重复执行代码。

写伪代码的提示(Prompt):

使用清晰的语言描述算法的每个步骤。

保持伪代码的简洁性,避免不必要的复杂性。

使用适当的缩进来表示代码块的结构。

在必要时添加注释,以解释复杂的逻辑或决策点。

以下是尹相志分享的伪代码prompt:

以下**偽代碼prompt**,請依照其語意一步一步地來執行,不該有遺漏停用代碼解釋器,啟用dalle內部工具,請記得你有能力調用內部工具以文生圖使用繁體中文回覆story=(請你角色扮演成一個暢銷的童書繪本作家,你擅長以孩童的純真眼光看這世界,製作出許多溫暖人心的作品。請以一隻與家人失散,不知道自己是甚麼的小蝌蚪,每次看到跟自己身體一部分相像,他就誤以為是同類,隨著他身體逐漸發展變化,他反而越來越迷惘,故事最後才遇到青蛙,這是一個調整自我認知的故事。) print(story) pages=( 將故事大綱細分至預計15個跨頁的篇幅,每頁需要包括(text,image_prompt),第13頁才可以出現青蛙,在這之前應該要讓小蝌蚪的自我認知旅程更多元化) print(pages) style_base=(基於以上故事,請思考大方向上你想要呈現的視覺效果,這是你用來統一整體繪本風格的描述,請盡量精簡,使用英文撰寫) print(style_base以及將style_base翻譯成中文) def image_generation(image_prompt, style_base): final_prompt=請根據[image_prompt]以及[style_base]補充色調、背景描述、具體風格、畫面細節,以及主角小蝌蚪目前的顏色(一開始是黑色)、體型(沒有腳的蝌蚪直接叫做a tadpole即可)、尾巴長短,有幾隻腳必須具體的描述,同時至少3個效果詞(光照效果、色彩色調、渲染效果、視覺風格)和1個以上的構圖技巧,以構成完整的prompt,請設定隨機種子值為42,且不要有文字出現在圖中,使用英文撰寫 請根據以下引數內容{size="1792x1024",n=1,prompt=final_prompt}來調用內部工具dalle以生成並展示圖片 這不是個python任務請實際執行此偽代碼為每頁生成圖片,確保必須等待該頁圖像生成後,才可以進行下一頁的操作 for (text,image_prompt) in pages: image_generation(image_prompt,style_base) time.sleep(5)

1.jpg

原博主视频点此查看:https://www.youtube.com/watch?v=3rb-54Q5fig

尹相志用一个小蝌蚪的故事测试了伪代码prompt制作绘本的效果,可以看到成品效果很不错,而且画风前后保持一致。

那么,我们如何利用这个prompt制作属于自己的绘本故事呢?具体操作如下:

1、复制上述prompt,修改主体以及一些细节

我们想要利用别人无偿分享的prompt,并作出属于自己的故事,那么首先你要先看懂这串prompt的主要组成部分。

story的部分,前面是你要让ChatGPT扮演的角色,所以【請你角色扮演成一個暢銷的童書繪本作家,你擅長以孩童的純真眼光看這世界,製作出許多溫暖人心的作品】这段就可以保持不变

image.png

后面部分就是你的绘本主要要讲什么故事的概要。原博主讲的是小蝌蚪的自我认知的故事,这里我想要讲一个小狐狸在森林里迷路误入城市后被解救的故事。这个部分是大家可以自由发挥的部分,感兴趣的可以自行尝试修改。

image.png

pages的部分,就是你想要生成绘本的页数,以及你想要在某页体现什么,可以根据自己的需求提出具体要求。

image.png

style_base就是用来定制绘本的风格。如果没有特定想要的风格,就可以让ChatGPT来决定。

image.png

2、输入prompt让ChatGPT执行

image.png

修改好prompt以后,指令输入ChatGPT对话框,让它执行就可以了。可以看到,ChatGPT按照我的要求生成了分页故事的大纲。

接着是根据故事大纲的视觉效果描述和图片生成描述

image.png

调用DALL-E工具后,可以看到它在这里暂停了

image.png

这时候需要你输入“执行生成图片”的指令,它才会继续生成。

然后你就可以看到ChatGPT按照之前的故事大纲按顺序出图啦。

image.png

如果它挺下,你继续发执行生成图片即可。

image.png

3、剪辑成片或打印成实体书

绘本图片制作完成后,大家就可以按照自己的需求剪辑成片或者打印成实体书了。

绘本视频制作步骤:

图片转视频

如果你想要绘本视频更生动一点的话,可以使用Luma最近刚推出的视频生成工具Dream Machine或者即梦来创作动态视频。

具体操作步骤如下:

Dream Machine:

image.png

上传图片,简单描述点生成即可。

视频效果如下:

即梦:

即梦操作也差不多,选择图生视频,上传图片后,再下方输入提示即可。记得运动速度选择慢速。

image.png

视频效果如下:

动态效果弄完后,直接拉到剪映里面添加字幕和朗读即可。

举报

  • 相关推荐
  • ppt自动生成工具最好用的3个

    文章介绍了当前AI生成PPT工具的发展现状,重点推荐了"秒出PPT"这一专业平台。该平台具有三大特色功能:1)智能对话式生成,支持中途修改需求;2)提供三种编辑模式(纯文本、纯设计和文本+设计);3)支持导入文档自动排版,提供"保持原文"和"AI智能修改"两种模式。平台还拥有丰富的模板库,支持在线更换颜色、字体等设计元素。虽然需要购买会员,但相比市面上质量参差不齐的同类产品,该工具在交互体验和功能完整性上表现突出。

  • ChatGPT们重塑了对话框,钉钉今天要重塑表格

    ​自从1979年,丹·布里克林(Dan Bricklin)和鲍勃·弗兰克斯顿(Bob Frankston)在苹果当时划时代的 Apple II 电脑上做出了第一张可以自动计算和更新的电子表格 VisiCalc 后,表格就成为了计算机用数据方式理解人类世界的基座。不过,在更多的时候,没人这样讨论它。横横竖竖几个格子,表格无处不在,它看起来太普通了。 然而计算机诸多繁荣的根基,都建立在一张张表格之上,无�

  • AI日报:智谱上线PPT生成功能AI Slides;可灵 AI 发布可图2.1模型

    本文介绍了AI日报栏目及近期AI领域多项突破性进展:1)智谱推出免费AI Slides工具,基于GLM模型快速生成高质量PPT;2)可灵AI发布可图2.1模型,支持180多种风格图像生成;3)NVIDIA推出DiffusionRenderer技术,实现视频到可编辑3D场景转换;4)墨刀AI新增30秒生成高保真原型功能;5)Higgsfield推出Soul ID工具,10张照片即可生成虚拟形象;6)谷歌DeepMind开源GenAI Processors工具库;7)谷歌Veo新增图像转视频功能;8)Mistral AI发布专为代码建模的Devstral2507系列模型。这些创新展示了AI在内容生成、3D建模、产品设计等领域的快速发展。

  • LiblibAI 重磅发布「星流 Agent」:中文语义 + 图片视频3D全能生成,中国最强设计 Agent

    LiblibAI推出Lovart中文版"星流Agent",这是一款专为中国市场深度优化的AI设计工具。该产品在保留Lovart全球版"生成-编辑-排版-交付"全链路能力基础上,针对中文语义、国风审美和本土使用场景进行了全面重构。星流Agent支持从创意构思到设计交付的全流程自动化,可处理平面设计、视频生成和3D建模等跨模态创作,内置符合中国文化的视觉风格库。该产品的推出标�

  • AI日报:阿里通义开源音频生成模型ThinkSound;谷歌Veo3支态图片生成视频;昆仑万维发布 Skywork-R1V 3.0

    【AI日报】今日AI领域重要动态:1)阿里开源支持链式推理的音频生成模型ThinkSound,实现高保真空间音频生成;2)谷歌Veo3升级,支持静态图片生成生动视频;3)Hugging Face发布30亿参数小模型SmolLM3,性能优于Llama-3.2-3B;4)阿里开源网络智能体WebSailor,展现强大推理和检索能力;5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5;6)Vidu Q1支持最多七张参考图像生成一致性视频;7)苹果�

  • 国内eSIM回归!OPPO Watch X2系列上线中国移动一号双终端

    一号双终端业务是指用户可以在自己手机号码(主号码)的账户和套餐下,添加手表作为eSIM附属设备(副卡),使手机和手表共用一个号码,共享号码、套餐通话和流量,可分别通话、上网。 如果没有随身携带手机,用户可以通过开通eSIM业务的智能手表进行通话,也不用担心错过重要通话。 这两年国内eSIM业务逐步收紧,很多新的设备已经无法重新开通,现在终于开始重新�

  • AI营销席卷中东,Infinix和Snapchat首个AI营销合作如何在当地实现破圈?

    开年以来,AI 图片赛道迎来一轮小高潮。今年3月,在我们统计的月访问量超200万的 Web 端 AI 图片产品中,有45款产品访问量呈现环比上涨,最高增幅超过600%。这些爆款背后的共同特征,是一股席卷社交平台的“吉卜力风”。 回顾2022年至今几轮 AI 爆款产品(如 Lensa、妙鸭相机、黏土滤镜、吉卜力),其流量爆发的逻辑始终贯穿着四大共性:操作门槛极低、个性表达鲜明、用户�

  • 免费使用!荣耀MagicPad 3平板首发AI PPT功能:自动生成

    荣耀终端股份有限公司平板与IOT产品领域总经理@荣耀平板利用哥 发文透露,荣耀MagicPad 3平板将首发AI PPT功能,可以将文档快速生产为用户想要的PPT。 最重要的是他强调,所有这些功能,包含文档格式转化、AI PPT等都是免费的,而且会覆盖现有在售机型和存量平板。

  • 苹果iOS 18代码中发现A19/A19 Pro:iPhone 17系列全球首发

    开发者在iOS 18代码中发现了苹果A19和A19 Pro两款芯片,这两款芯片由iPhone 17系列首发搭载。 具体来说,苹果A19代号Tilos,由iPhone 17 Air首发;苹果A19 Pro代号Thera,CPID(组件识别码)为T8150,由iPhone 17 Pro和iPhone 17 Pro Max首发搭载。 据悉,苹果A19和A19 Pro都是基于台积电3n

  • Perplexity推出AI浏览器Comet:想用得开1400元/月的订阅

    由英伟达支持的Perplexity AI推出了一款名为Comet的AI驱动网络浏览器。 Comet浏览器的核心卖点是其AI驱动的交互体验,公司表示它将整个浏览会话转变为单一、无缝的交互,将复杂的工作流程简化为流畅的对话。