
转载自网络
我选用了一个常见的教程/概念配图场景去绘制多个图像,首先看看一次性绘制能够达到什么样的效果,然后再将细节丰富重新生成,查看画风,画面描述的遵循程度,中文文字的绘制效果,最后以风格化批量制作类似风格的图像。
提示词:
我是一个人工智能领域的小白,对深度学习,强化学习,LLM,Agent 智能体,向量数据库,MCP, ReAct 框架都不熟悉。我希望你分别绘制这些知识点的细节,以最浅显易懂的方式。效果就像教材插图一样。
Gemini:
你好!欢迎来到人工智能的奇妙世界。作为一个 AI“小白”,面对这些充满科技感的名词感到极其困惑是非常正常的。别担心,它们其实没有那么高深莫测。
我们把这看作是一本轻松的科普画册。我会用最生活化的比喻,为你“绘制”每一张知识点的插图。你只需要发挥一点想象力,跟着我的描述去脑补画面。
AI 思考,搜索和汇总了我需要的内容,并且将绘制的图片做了合并,但细节缺失,某些内容比较简单。

会话中他一次生成了多个常见的图像,略显粗糙:




我将AI 生成的每个项的画面细节单独给他重新生成,这样生成的图片细节很丰富了,我把 AI 描述的细节和重新生成的图片内容放到了一起,大部分是比较遵循画面描述的,另外我把解读文字也放了进去,他的中文文字绘制也很强。
【插图标题】:制作千层蛋糕的流水线
【画面描述】: 想象一个巨大的、透明的千层蛋糕制作工厂。

【小白解说】: 深度学习就是模仿人脑神经元,搞了很多很多的“层”。它不靠死记硬背,而是通过一层层地过滤和提炼特征,把复杂的问题(原材料)一点点拆解,最后得出答案(蛋糕)。
【插图标题】:训练小狗握手
【画面描述】: 画面中心是一只可爱的小机器狗(Agent),它的面前是一位人类训练师(环境)。

【小白解说】: 强化学习就是“从试错中学习”。AI 没有老师告诉它标准答案,它只能在环境里瞎折腾。做对了给糖吃(奖励),做错了打手心(惩罚)。为了多吃糖,它会拼命寻找最优策略。
【插图标题】:读过全人类图书馆的超级“鹦鹉”
【画面描述】: 画面的背景是一座巨大无比的图书馆,书架高耸入云,里面塞满了古今中外所有的文字资料。

【小白解说】: LLM 本质上是一个超级强大的“文字接龙高手”。它读了海量的书,知道了字与字之间出现的概率关系。你给它上文,它就靠概率猜出最可能的下文。因为它读得太多了,所以它猜得特别准,看起来就像懂了你的意思一样。
【插图标题】:按“感觉”分类的神奇超市
【画面描述】: 想象一个漂浮在太空中的奇异超市,这里没有货架。所有的商品都像星星一样悬浮在空中。

【小白解说】: 传统的数据库是按死板的表格存数据。向量数据库是把万事万物(文字、图片)都变成数学坐标(向量)。意思相近的东西,在空间里的距离就近;意思相反的,距离就远。这样AI就能通过计算“距离”来理解事物之间的关系,而不是傻傻地对关键词。
【插图标题】:全能AI管家
【画面描述】: 画面是一个家庭场景。一个长着手脚的小机器人(Agent)正在忙碌。它被分成了三个明显的步骤模块:

【小白解说】: 之前的 AI 主要是“回答问题”。Agent 不一样,它是能“干活”的。它能感知环境,自己动脑子做决定,然后动手去改变环境,是一个有自主行动能力的小帮手。
注:MCP 在 AI 领域不是一个非常标准的通用教材术语,它有时指特定的协议,有时指一种概念。为了小白理解,我们把它解读为“如何管理 AI 的短期记忆”。
【插图标题】:AI 的记事贴和文件夹
【画面描述】: 一个正在考试的学生(代表 LLM 模型)坐在课桌前。

【小白解说】: LLM 的记性其实很差。MCP 就像是给 AI 配备了一套高效的秘书系统,负责把最重要的信息(上下文)整理好,贴在它眼前,让它知道现在在干嘛,之前说过啥,确保它说话做事连贯、不出错。
【插图标题】:大厨做菜的内心独白
【画面描述】: 一个大厨(Agent)正在厨房里面对一个复杂的点单:“做一份宫保鸡丁”。画面用一个循环的流程图来表示他的工作方式:
整个过程是一个“想一步 -> 做一步 -> 看一眼结果 -> 再想下一步”的死循环,直到菜做好了。

【小白解说】: ReAct 就是让 AI 不要脑子一热就瞎干。它要求 AI Agent 必须像个严谨的大厨一样:先思考(Reason)要干啥,再采取行动(Act),然后观察行动的结果,根据结果再进行下一轮思考。这样 AI 处理复杂任务时就不会乱套了。
最近看到很多发这种识字小报的,我尝试在不看答案的情况下,按图描述了一下提示词,用于复刻,效果还行,下面是我编写的提示词,可以放到 System 中生成。

我现在要为我 3 岁的小孩制作用于学习识字的海报素材彩色插画,素材应该保持儿童友好,简单易懂。
我们生活中会有很多场景可以去为孩子创造插画,比如上学,游乐园游玩,去公园,超市购物,在家里看电视,打扫卫生等常见的生活场景。
我理想中的插画应当是尽量多的列出某个场景下涉及的实物,包括但不限于人物,动物,植物,娱乐设施等。这些东西都为小孩提供了学习的素材。所以在我提出一个场景的时候,你需要列出每个场景中任何内容并且为每一项标记拼音和名称(中文),注意:文字不要挡住实物主体。
图像的顶部是对场景的描述标题,字体应该大一点,随后是对场景的绘制,合理的将事物放在画面的合理位置,然后对每个实物进行文字标记便于后续学习。
人物应当保持中国卡通的风格,其他实物保持形态的同时尽量保持与环境一致的画风。
后续的对话中我会提供场景,你返回一张绘制完成的图片即可。
下面是几个生成效果:

精心选择的AI工具来改善您的工作,学习和生活效率。
2025年11月14日,OpenAI正式开启ChatGPT群聊功能试点,标志着AI从个人助手迈向团队协作伙伴的重大转折
Cursor正式迈入2.0时代!其首个自研编程智能体模型Composer将响应速度提升4倍,更颠覆性地支持最多8个AI智能体并行协作。从此,你不再是代码的“打字员”,而是项目的“总指挥”。
Sponsored bySAM TTS