首页 > 业界 > 关键词  > 伪代码prompt最新资讯  > 正文

保姆级教程:一个伪代码prompt让ChatGPT自动生成多张绘本图片

2024-06-17 18:02 · 稿源:站长之家

站长之家(ChinaZ.com) 6月17日 消息:相信不少朋友都在小红书之类的平台上看到过不少绘本类的作品。想要利用AI产品生成这类优质的作品,往往需要根据脚本,一句一句地去生成插画作品,费时费力。

虽然市面上已经有不少AI绘本生成产品,但据小编体验的几个来看,还是需要费一些时间去调整角色的,而且有的还要将角色手动插入背景中,操作起来还是有点繁琐的。

所以目前来说,用AI制作绘本,最快的方式还是通过ChatGPT

最近,有一位名叫尹相志的网友在YouTube上分享了一个非常实用的prompt技巧,只需要一个伪代码prompt,就可以让ChatGPT自动生成一整套的绘本图片。

儿童睡前故事 插画 儿童读物

图源备注:图片由AI生成,图片授权服务商Midjourney

什么是伪代码?

伪代码是一种用于描述算法或程序逻辑的非正式语言,它使用自然语言和编程语言的混合形式来表达算法的步骤和流程。伪代码的目的是使算法的逻辑清晰易懂,而无需深入到具体的编程语言细节。以下是伪代码的一些基本特点和写作指南:

伪代码的特点:

易读性:使用接近自然语言的表达方式,便于理解。

抽象性:不涉及具体的编程语法,而是关注算法的逻辑结构。

通用性:不依赖于特定的编程语言,具有跨语言的特性。

写作伪代码的步骤:

  • 定义变量:使用变量来存储和操作数据,变量名应具有描述性。

  • 指定数据类型:明确变量的数据类型,如整数、浮点数、字符串、数组等。

  • 描述函数:使用函数来封装重复使用的代码块或特定的任务。

  • 控制流程:使用控制结构来指导程序的执行流程,如条件判断、循环等。

  • 使用条件语句(如 if-else):根据条件来决定执行不同的代码分支。

  • 使用循环结构(如 for、while):对集合中的元素进行迭代处理或在满足条件时重复执行代码。

写伪代码的提示(Prompt):

使用清晰的语言描述算法的每个步骤。

保持伪代码的简洁性,避免不必要的复杂性。

使用适当的缩进来表示代码块的结构。

在必要时添加注释,以解释复杂的逻辑或决策点。

以下是尹相志分享的伪代码prompt:

以下**偽代碼prompt**,請依照其語意一步一步地來執行,不該有遺漏停用代碼解釋器,啟用dalle內部工具,請記得你有能力調用內部工具以文生圖使用繁體中文回覆story=(請你角色扮演成一個暢銷的童書繪本作家,你擅長以孩童的純真眼光看這世界,製作出許多溫暖人心的作品。請以一隻與家人失散,不知道自己是甚麼的小蝌蚪,每次看到跟自己身體一部分相像,他就誤以為是同類,隨著他身體逐漸發展變化,他反而越來越迷惘,故事最後才遇到青蛙,這是一個調整自我認知的故事。) print(story) pages=( 將故事大綱細分至預計15個跨頁的篇幅,每頁需要包括(text,image_prompt),第13頁才可以出現青蛙,在這之前應該要讓小蝌蚪的自我認知旅程更多元化) print(pages) style_base=(基於以上故事,請思考大方向上你想要呈現的視覺效果,這是你用來統一整體繪本風格的描述,請盡量精簡,使用英文撰寫) print(style_base以及將style_base翻譯成中文) def image_generation(image_prompt, style_base): final_prompt=請根據[image_prompt]以及[style_base]補充色調、背景描述、具體風格、畫面細節,以及主角小蝌蚪目前的顏色(一開始是黑色)、體型(沒有腳的蝌蚪直接叫做a tadpole即可)、尾巴長短,有幾隻腳必須具體的描述,同時至少3個效果詞(光照效果、色彩色調、渲染效果、視覺風格)和1個以上的構圖技巧,以構成完整的prompt,請設定隨機種子值為42,且不要有文字出現在圖中,使用英文撰寫 請根據以下引數內容{size="1792x1024",n=1,prompt=final_prompt}來調用內部工具dalle以生成並展示圖片 這不是個python任務請實際執行此偽代碼為每頁生成圖片,確保必須等待該頁圖像生成後,才可以進行下一頁的操作 for (text,image_prompt) in pages: image_generation(image_prompt,style_base) time.sleep(5)

1.jpg

原博主视频点此查看:https://www.youtube.com/watch?v=3rb-54Q5fig

尹相志用一个小蝌蚪的故事测试了伪代码prompt制作绘本的效果,可以看到成品效果很不错,而且画风前后保持一致。

那么,我们如何利用这个prompt制作属于自己的绘本故事呢?具体操作如下:

1、复制上述prompt,修改主体以及一些细节

我们想要利用别人无偿分享的prompt,并作出属于自己的故事,那么首先你要先看懂这串prompt的主要组成部分。

story的部分,前面是你要让ChatGPT扮演的角色,所以【請你角色扮演成一個暢銷的童書繪本作家,你擅長以孩童的純真眼光看這世界,製作出許多溫暖人心的作品】这段就可以保持不变

image.png

后面部分就是你的绘本主要要讲什么故事的概要。原博主讲的是小蝌蚪的自我认知的故事,这里我想要讲一个小狐狸在森林里迷路误入城市后被解救的故事。这个部分是大家可以自由发挥的部分,感兴趣的可以自行尝试修改。

image.png

pages的部分,就是你想要生成绘本的页数,以及你想要在某页体现什么,可以根据自己的需求提出具体要求。

image.png

style_base就是用来定制绘本的风格。如果没有特定想要的风格,就可以让ChatGPT来决定。

image.png

2、输入prompt让ChatGPT执行

image.png

修改好prompt以后,指令输入ChatGPT对话框,让它执行就可以了。可以看到,ChatGPT按照我的要求生成了分页故事的大纲。

接着是根据故事大纲的视觉效果描述和图片生成描述

image.png

调用DALL-E工具后,可以看到它在这里暂停了

image.png

这时候需要你输入“执行生成图片”的指令,它才会继续生成。

然后你就可以看到ChatGPT按照之前的故事大纲按顺序出图啦。

image.png

如果它挺下,你继续发执行生成图片即可。

image.png

3、剪辑成片或打印成实体书

绘本图片制作完成后,大家就可以按照自己的需求剪辑成片或者打印成实体书了。

绘本视频制作步骤:

图片转视频

如果你想要绘本视频更生动一点的话,可以使用Luma最近刚推出的视频生成工具Dream Machine或者即梦来创作动态视频。

具体操作步骤如下:

Dream Machine:

image.png

上传图片,简单描述点生成即可。

视频效果如下:

即梦:

即梦操作也差不多,选择图生视频,上传图片后,再下方输入提示即可。记得运动速度选择慢速。

image.png

视频效果如下:

动态效果弄完后,直接拉到剪映里面添加字幕和朗读即可。

举报

  • 相关推荐
  • 大家在看
  • Animate Old Photos:用AI技术让老照片动起来

    Animate Old Photos是一个利用Kling AI技术将老照片转化为生动视频的网站。它通过AI技术使旧时记忆重新焕发活力,为用户带来更加生动和动态的体验。该产品目前处于beta测试阶段,免费提供服务,但随着高级功能的增加,未来可能会推出付费计划。

  • Discovery Outcomes:AI驱动的产品管理操作系统

    Discovery Outcomes是一个AI驱动的产品管理操作系统,旨在简化和增强产品管理流程。它通过集成工具、促进协作,并利用AI提高工作效率。该平台通过统一平台覆盖从设定目标到功能交付的所有内容,解决工具跳跃、数据冗余和信息孤岛等常见挑战。Discovery Outcomes通过AI驱动的效率提升,旨在提高上市时间、生产力、创新率、交付物质量、适应性、灵活性、跨功能协作和投资回报率。

  • Revent.ai:使用AI快速创建专业演示文稿

    Revent.ai 是一个专注于利用人工智能技术帮助用户快速创建专业演示文稿的平台。其核心功能包括演示文稿自动化和设计服务,旨在通过简化设计流程,让用户能够专注于内容的传达,从而提升演示文稿的质量和效率。Revent.ai 的使命是让技术更好地服务于人,强调以人为本,确保质量和价值始终贯穿于产品之中。

  • AI Memory:智能记忆助手,随时随地回忆重要信息

    Flot.ai的AI Memory是一个基于人工智能的个人知识库管理工具,通过AI Memory功能,帮助用户轻松构建和回忆个人知识库。它允许用户通过简单的点击操作,从任何应用程序或网站保存文本到AI记忆中,并随时通过与AI对话来回忆这些信息。产品强调了其无需组织、易于访问和使用的特点,以及对隐私的高度重视,符合GDPR标准。

  • AI数学解题器:智能解决数学问题,提升学习效率

    AI数学解题器是由数学AI和数学GPT模型(如GPT-4o)驱动的在线工具,旨在提供广泛的数学问题解决方案。它利用先进的人工智能技术,为学生和教师提供详尽的分步解答,增强了对数学概念的理解和解题能力。该产品背景是数学学习中对高效解题工具的需求,定位于免费提供高质量的教育支持。

  • CohesiveAI:AI驱动的数据采集与分析工具

    Cohesive是一款集成在Google Sheets中的AI工具,它允许用户通过AI技术进行数据的批量分析、个性化生成以及网页抓取,特别适用于需要大规模数据采集和分析的商业场景。它支持在Google Sheets内直接进行操作,无需学习新平台,简化了数据导入和导出的流程。Cohesive还提供了与ZeroBounce的集成,帮助用户找到或验证电子邮件地址。

  • AI Renamer:智能文件重命名工具

    ai-renamer 是一个基于 Node.js 的命令行工具,利用 Ollama 和 LM Studio 模型(如 Llava, Gemma, Llama 等)智能地根据文件内容重命名文件。它支持视频、图片等多种文件类型,并且可以通过自定义参数来优化重命名过程。该工具使用户能够自动化文件管理,提高效率,尤其适合需要批量处理文件名的开发者和内容创作者。

  • EasyMedia:AI驱动,快速将YouTube视频转化为社交媒体内容。

    EasyMedia是一个利用人工智能技术,帮助用户将YouTube视频内容快速转化为适合不同社交媒体平台的帖子、推文等。它支持Facebook、Instagram、Twitter、LinkedIn等多个平台,能够根据平台特点自动调整内容格式,提高内容的吸引力和传播力。产品背景在于帮助用户节省内容创作时间,同时增加其在数字世界中的影响力。

  • Kuluko:将想法变成有声书

    Kuluko是一款AI驱动的有声书生成器,它允许用户通过简单的提示或个性化的设置来创作属于自己的有声书。它提供了两种模式:简易模式和高级模式,以满足不同用户的需求。简易模式下,用户只需输入一个提示,AI即可生成完整的小说。高级模式则允许用户自定义故事的各个方面,包括角色、类型、背景、故事时间、叙述者声音等。Kuluko将故事转化为长达4小时的有声书,用户可以立即开始收听。此外,Kuluko还具有个人和公共图书馆功能,用户可以选择私密享受或与他人分享。

  • fastn:无代码AI驱动的集成平台

    fastn是一个无代码、AI驱动的集成平台,旨在帮助开发者通过单一、统一的API连接和编排多个数据源。它通过AI代理创建API,支持即时API组合,无需编码即可实现数据流的连接。fastn的主要优点包括降低成本、加速开发和上市时间、提高可靠性和安全性。它通过实时数据编排、统一数据访问和监控与故障排除等功能,帮助企业构建互联生态系统。

  • Wasps:AI代码审查工具,快速理解代码库并修复问题。

    Wasps是一个集成在VSCode中的AI代码审查插件,通过深度分析和理解代码库,能够快速识别并修复代码中的错误和漏洞。它为开发者提供即时反馈,推荐潜在问题和改进建议,帮助提高代码质量和开发效率。

  • LLM Optimize:专业网站审计,提升AI推荐排名

    LLM Optimize 是一套工具,旨在帮助用户优化网站,使其在AI聊天机器人和生成引擎(如ChatGPT和Google的AI Overview)中排名更高。该工具通过专业的网站审计,提供可操作的建议,帮助用户在这些生成引擎中获得更好的展示效果。其重要性在于,随着AI技术的不断发展,传统的SEO策略正在逐渐被LLM(Large Language Models,大型语言模型)优化所取代。LLM Optimize通过分析网站内容和竞争对手的策略,提供定制化的优化方案,帮助用户在AI驱动的搜索结果中获得更高的曝光率。

  • Meme Search:通过文本搜索快速找到完美表情包

    Meme Search是一款通过视觉内容和文本索引表情包的应用程序,它能够让用户通过文本搜索快速找到所需的表情包。该应用使用自然语言处理技术,将图片中的文本描述自动生成并作为向量索引存储,从而实现快速检索。Meme Search的开源特性和创新的搜索方式,使其成为提升表情包搜索效率的有力工具。

  • PDFJourney:快速且经济的PDF创建方式

    PDFJourney 是一个旨在为用户提供快速且经济的PDF创建服务的网站。它通过简化用户界面和操作流程,使得用户能够轻松地创建PDF文件。该产品的主要优点在于其高效的渲染速度和低廉的成本,这对于需要频繁处理文档的用户来说是一个巨大的优势。PDFJourney 是 GPT4 的微调版本,它致力于通过技术手段降低文档处理的复杂性和成本,从而提升用户的工作效率。

  • AnyParser:准确、私密且可配置的文档检索LLM

    AnyParser Playground 是一个基于网页的解决方案,旨在帮助用户从PDF和图像文件中提取信息。它通过使用机器学习技术,能够处理文件的前10页,为用户提供数据的全面洞察。该平台不存储用户数据,保证了数据的隐私和安全性。

  • Reimagic.ai:将照片转化为非凡肖像的革命性应用

    Reimagic.ai是一款革命性的移动应用程序,可以将您的照片转化为非凡的肖像。它具备即时背景转换、无缝融合、多样化使用场景、用户友好界面等功能,适用于人像、宠物和产品摄影,使每张快照都成为杰作。

  • Xspiral:新一代3D可视化设计平台,让创意触手可及。

    Xspiral是一个结合了2D和3D设计的混合平台,通过AI技术增强,提供实时渲染、无需下载、协作功能。它允许用户快速创建、设计、管理、预览、分享和发布3D作品。Xspiral支持使用智能写作功能,如一键重写、总结、扩展和快速思维导图,以及创建和管理交互式3D工作流应用,包括文档、思维导图、流程图等。它还支持在3D空间中进行UI/UX设计,为初学者和专业人士提供了轻松创建3D设计的可能。

  • 如果相机:用AI帮你看见各种「如果」背后自己可能的样子

    如果相机是一款利用人工智能技术,帮助用户探索不同生活选择下自己可能的样子的网站。通过AI技术,用户可以体验到不同的生活方式、外貌变化等,从而发现更多的可能性。该产品的主要优点在于其创新性和趣味性,能够激发用户的想象力和探索欲。

  • Relingo:智能双语翻译,助力词汇记忆

    Relingo是一款专注于提升用户英语词汇记忆能力的教育类APP。它通过在用户阅读和观看视频时自动高亮生词并提供翻译,帮助用户在感兴趣的内容中轻松积累单词。产品支持多种语言,包括中文、英文、日文等,覆盖了全文翻译、视频双语字幕、PDF阅读等多种场景,使用户在沉浸式翻译中提升语言能力。

  • AI Photo Filter:AI滤镜,一键转换照片风格

    AI Photo Filter是一个在线服务,使用人工智能技术将用户上传的照片转换成多种艺术风格,如动漫、粘土、3D、像素艺术等。它适用于初学者和专业人士,只需简单点击即可使用。该技术的主要优点包括操作简便、风格多样、效果生动,能够满足不同用户对照片美化和创意表达的需求。

今日大家都在搜的词:

热文

  • 3 天
  • 7天