Day23——晚课提示词作画：描述你想要的画面

系列教程说明

这是「AI专家养成计划」系列教程的第46篇，共140篇。从AI零基础出发，每天进步一点点。晚课以实操为主，手把手带你用提示词生成AI图片——读完这篇，你就能独立写出高质量提示词，完成属于自己的第一幅AI画作。

上篇回顾

今天早课我们学习了提示词作画的理论基础。三个核心要点：

五大要素公式：主体+风格+构图+光影+技术参数——掌握这个框架，就能写出80分以上的提示词
六大进阶技巧：权重控制、负面提示词、图生图、种子值固定、分步描述、学习优秀案例——从80分提升到95分
常见误区：提示词不是越长越好、用英文效果更好、批量生成从中挑选、别忽略背景——避开这些坑，少走弯路

晚课不讲理论，直接上手。接下来我会用4个完整的实战案例，带你从零开始写出提示词、生成图片、分析结果、迭代优化。

实战准备：选择你的工具

在开始之前，你需要一个AI图像生成工具。根据不同情况，推荐以下方案：

方案一：Midjourney（推荐，效果最好）

需要Discord账号
访问 midjourney.com，加入Discord服务器
在对话框输入 /imagine + 你的提示词
基础版每月10美元，可生成约200张图

方案二：Stable Diffusion（免费，需要技术基础）

完全开源免费
可以本地部署（需要显卡）或使用在线平台
在线推荐：Google Colab 免费GPU、Civitai.com 在线生图

方案三：国内工具（无需科学上网）

通义万相（阿里）：tongyi.aliyun.com
文心一格（百度）：yige.baidu.com
智谱清言（智谱AI）：chatglm.cn

建议：如果你是纯新手，先用国内工具练手，零门槛。等熟悉了提示词逻辑，再切换到Midjourney或Stable Diffusion获取更高质量。

案例一：从零开始——画一只猫

第一步：写出最简单的提示词

我们从最基础的开始。打开你的AI工具，输入：

a cat

生成几张图，看看AI会给你什么。大概率是各种各样的猫——不同品种、不同场景、不同风格，完全随机。

这就是”裸奔”提示词的效果。 AI有太多自由发挥的空间，结果不可控。

第二步：逐步添加要素

现在，按照早课的五大要素，一步步丰富你的提示词。

添加主体细节：

a fluffy orange tabby cat with green eyes

——一只毛茸茸的橘色虎斑猫，绿色眼睛。

添加动作和场景：

a fluffy orange tabby cat with green eyes, sitting on a windowsill, looking outside at the rain

——坐在窗台上，看着窗外的雨。

添加风格：

a fluffy orange tabby cat with green eyes, sitting on a windowsill, looking outside at the rain, Studio Ghibli style

——宫崎骏风格。

添加构图和光影：

a fluffy orange tabby cat with green eyes, sitting on a windowsill, looking outside at the rain, Studio Ghibli style, close-up shot, soft warm indoor lighting, cozy and peaceful atmosphere

——特写构图，柔和的室内暖光，温馨宁静的氛围。

添加技术参数：

a fluffy orange tabby cat with green eyes, sitting on a windowsill, looking outside at the rain, Studio Ghibli style, close-up shot, soft warm indoor lighting, cozy and peaceful atmosphere, highly detailed, masterpiece, 8K

第三步：对比结果

用”裸奔版”和”完整版”分别生成3-5张图，对比效果。你会发现：

裸奔版：猫的品种随机、场景随机、风格随机，可能好看也可能很丑
完整版：画面统一、风格明确、构图讲究，几乎每张都不错

关键认知：提示词不是”写作文”，而是”给画家下brief”。你给的brief越详细，画家画出来越接近你想要的。

案例二：风格实验——同一主体，五种画风

这个练习帮你理解”风格”要素的威力。

实验设计

固定主体为”一座古老的石桥，横跨在溪流上，周围是秋天的红叶”，然后只改变风格描述，生成5种不同风格的图片。

提示词模板：

an ancient stone bridge over a stream, surrounded by autumn red leaves, [STYLE], landscape composition, golden hour lighting, masterpiece, 8K

把 [STYLE] 替换成以下5种风格，分别生成：

序号	风格描述	预期效果

|——|———|———|

1	Chinese ink painting style（中国水墨画）	意境深远、留白简约
2	Oil painting, impressionist style（印象派油画）	色彩丰富、笔触粗犷
3	Japanese anime style（日系动漫）	线条清晰、色彩明快
4	Cyberpunk neon style（赛博朋克霓虹）	科幻感、霓虹灯映照
5	Vintage film photography（复古胶片摄影）	颗粒感、褪色调

分析与思考

生成完5组图片后，思考：

同一个场景，不同风格给人的感觉差异有多大？
哪种风格最吸引你？为什么？
如果你要把这张图用在什么地方（头像、壁纸、公众号配图），你会选哪种风格？

实用技巧：找到你喜欢的风格后，记住这个风格的英文描述，以后可以直接复用。比如你特别喜欢”Studio Ghibli style”的效果，以后画任何主体都可以加上这个风格。

案例三：迭代优化——从”能看”到”惊艳”

AI图像生成很少一次出完美作品。真正的高手，是通过反复迭代来逼近理想效果。

实战流程

第一轮：基础版本

假设我们要画”一个在雨中撑伞的女孩”：

a girl holding an umbrella in the rain, anime style

生成4张图，选出最好的一张。假设你选中了第3张。

第二轮：添加细节

基于第一轮的结果，补充更多描述：

a young woman with long black hair, wearing a white dress, holding a transparent umbrella in heavy rain, anime style, medium shot, blue hour lighting, melancholic mood, highly detailed

再生成4张，选最好的一张。

第三轮：微调优化

根据第二轮的结果，你发现女孩的表情不太对，想要更忧郁的感觉：

a young woman with long black hair, wearing a white dress, holding a transparent umbrella in heavy rain, looking down with a sad expression, anime style, medium shot, blue hour lighting, melancholic and dreamy mood, rain drops visible, puddle reflections, highly detailed, masterpiece

再生成4张，选最好的一张。

迭代的核心逻辑

初始版本 → 观察结果 → 发现问题 → 调整提示词 → 再次生成 → 重复

每一轮迭代，你都在做三件事：

观察：这张图哪里好？哪里不好？
归因：不好的地方，是提示词描述不够准确，还是AI理解偏差？
调整：针对问题修改提示词——不够具体的加细节，理解偏差的换表达方式

重要提醒：如果同一个提示词改了3轮还是不满意，试试换一个风格描述。有时候不是你的提示词有问题，而是这个风格不适合这个主体。

案例四：创意组合——画出你脑中的奇想

最后一个练习，释放你的想象力。

创意混搭公式

[不相关的物体A] + [不相关的物体B] + [统一的场景/风格]

把两个本来不搭的东西放在一起，用风格和场景把它们统一起来。这是AI绘画最有趣的部分——你可以创造出世界上不存在的画面。

5个创意模板（直接可用）

模板1：动物×职业

a sophisticated raccoon wearing a detective coat, sitting in a vintage office, reading a magnifying glass, film noir style, dramatic shadows, 35mm film photography

——一只穿着侦探大衣的浣熊，在复古办公室里用放大镜看东西，黑色电影风格。

模板2：食物×场景

a giant floating ramen bowl in the sky, with noodles falling like rain, tiny people on the ground looking up in amazement, surrealist style, warm golden lighting, Dali-inspired

——巨大的拉面碗漂浮在天空，面条像雨一样落下，超现实主义风格。

模板3：自然×科技

a bonsai tree growing inside a transparent glass computer case, with circuits and wires as roots, RGB lighting, cyberpunk aesthetic, macro photography, highly detailed

——盆栽长在透明电脑机箱里，电路板当根系，RGB灯效，赛博朋克美学。

模板4：历史×未来

ancient Egyptian pharaoh riding a hoverboard through a futuristic city, hieroglyphic holograms floating in the air, retro-futurism style, epic wide angle shot

——古埃及法老踩着悬浮滑板穿越未来城市，象形文字全息投影漂浮在空中，复古未来主义风格。

模板5：情绪×具象

a visual representation of loneliness, a single glowing lightbulb in an endless dark ocean, minimalist style, dramatic contrast, cinematic photography

——孤独的视觉化表达，一盏发光的灯泡漂浮在无尽的黑暗海洋中，极简风格。

练习任务

现在轮到你了。从下面选一个组合，或者自己创造一个：

会飞的鲸鱼 × 水下城市
钢铁做的花 × 暴风雪中的温室
老式收音机 × 外星球表面
穿宇航服的猫 × 梵高的星空

用五大要素公式写出完整提示词，生成3-5张图，选出最好的一张保存下来。

提示词模板库：随时可用的10个模板

把下面这些模板保存到你的笔记里，以后需要画什么类型的图，直接套用修改。

人物类

模板1：人物肖像

[性别] [年龄描述] [发型发色] [穿着], [表情动作], [场景], [风格] portrait, [构图], [光线], [氛围], highly detailed, masterpiece

模板2：动漫角色

[角色描述], [动作姿态], [服装细节], anime style, [构图], [光线], [氛围], high quality anime art, detailed

风景类

模板3：自然风光

[地点类型] with [具体特征], [季节/天气], [风格], landscape photography, [构图], [光线], [氛围], 8K, ultra HD

模板4：城市街景

[城市类型] street scene, [时间段], [天气], [风格], [构图], [光线], urban photography, highly detailed

物品类

模板5：产品展示

[物品描述], [材质质感], [摆放方式], [背景], product photography, studio lighting, clean composition, 8K, commercial quality

创意类

模板6：超现实场景

[不搭的元素A] and [不搭的元素B], [统一场景], surrealist style, [光线], dreamlike atmosphere, masterpiece

模板7：复古海报

[主题] vintage poster design, [年代风格] aesthetic, bold typography, limited color palette, retro illustration, clean lines

场景类

模板8：室内空间

[房间类型], [装修风格], [家具摆设], [光线来源], interior design photography, wide angle, [氛围], highly detailed

模板9：科幻场景

[科幻元素描述], [环境设定], sci-fi concept art, [光线], epic scale, cinematic, highly detailed, 8K

模板10：美食摄影

[食物描述], [摆盘方式], [餐具], [背景], food photography, [光线], [氛围], appetizing, highly detailed, 8K

今日总结

今天晚课的核心收获：

逐步添加法：从最简单的提示词开始，逐步添加五大要素，观察每一步的变化——这是理解提示词最直观的方式
风格实验法：同一主体换5种风格，快速建立对”风格”要素的直觉——找到你的审美偏好
迭代优化法：初始版本→观察→归因→调整→再生成，3轮迭代逼近理想效果——AI出图很少一步到位

今日行动项

今晚花15分钟完成以下练习：

练习一：用”逐步添加法”画一只你想象中的动物，从”裸奔版”到”完整版”至少迭代3次，保存最终版本
练习二：用”风格实验法”选一个场景，换3种不同风格生成，选出你最喜欢的风格并记录下来
练习三：从10个模板库中选一个，填入你自己的内容，生成一张图

完成这3个练习，你就真正掌握了”提示词作画”这个技能。

📖 地铁深读：从Prompt到Prompt Engineering——一个新职业的诞生

这个板块专为地铁通勤设计，每篇5-10分钟。不想深读可以跳过，不影响主线学习。

提示词工程师：年薪30万的新职业？

2023年，一个全新的职业岗位出现在招聘市场上——Prompt Engineer（提示词工程师）。一些公司开出了15万到30万美元的年薪，招聘”会写提示词”的人。

这个岗位听起来很荒谬：会打字就能拿高薪？

事实没那么简单。一个优秀的提示词工程师，需要具备以下能力：

深度理解AI模型的行为模式——知道什么词会触发什么效果，什么表达会导致什么偏差
跨领域的知识储备——要画建筑图需要懂建筑风格，要画医学图需要懂解剖学
系统化的测试方法——不是随便试，而是有计划地测试不同变量的影响
审美能力——能判断AI输出的质量，知道什么是”好”什么是”差”

一个真实案例：用AI生成产品图

某电商公司以前拍一组产品图需要：

摄影师：2000元/天
模特：1500元/天
场地租用：3000元/天
后期修图：500元/张
总计：一次拍摄约1-2万元，出图20-30张

现在，一个提示词工程师用Midjourney：

设备成本：0元（只需要电脑和网络）
时间成本：2-3小时
出图数量：50-100张可用品
质量：满足电商展示需求

这就是为什么提示词工程师值钱——他们不是在”打字”，而是在用语言指挥一个超级画师，替代了一整条传统生产链。

提示词的未来：会消失吗？

一个值得思考的问题：随着AI越来越聪明，提示词会不会变得不再重要？

两种观点：

会消失派：AI会越来越理解自然语言。未来你可能只需要说”给我画一个好看的头像”，AI就能完美理解你想要什么——不需要精心构造提示词。

不会消失派：即使AI理解能力提升，精确控制仍然需要精确表达。就像你不需要学会开车也能出门（可以打车），但赛车手永远不会失业——对速度和精度的追求没有上限。

我的判断：提示词的”形式”会变（从英文关键词到自然语言对话），但”精确描述需求”的能力不会过时。能清晰表达自己想要什么的人，在AI时代永远有价值。

下篇预告

明天早上8点：Day24——早课风格迁移：照片变油画。我们将学习如何把一张普通照片变成梵高风格、宫崎骏风格、或者任何你想要的艺术风格——不需要会画画，只需要会写提示词。

明晚5点：Day24——晚课风格迁移实战。用真实照片练习风格转换，掌握图生图的核心技巧。

Day23——晚课 提示词作画：描述你想要的画面