Day23——晚课 提示词作画:描述你想要的画面

作者:

系列教程说明

这是「AI专家养成计划」系列教程的第46篇,共140篇。从AI零基础出发,每天进步一点点。晚课以实操为主,手把手带你用提示词生成AI图片——读完这篇,你就能独立写出高质量提示词,完成属于自己的第一幅AI画作。

上篇回顾

今天早课我们学习了提示词作画的理论基础。三个核心要点:

  • 五大要素公式:主体+风格+构图+光影+技术参数——掌握这个框架,就能写出80分以上的提示词
  • 六大进阶技巧:权重控制、负面提示词、图生图、种子值固定、分步描述、学习优秀案例——从80分提升到95分
  • 常见误区:提示词不是越长越好、用英文效果更好、批量生成从中挑选、别忽略背景——避开这些坑,少走弯路

晚课不讲理论,直接上手。接下来我会用4个完整的实战案例,带你从零开始写出提示词、生成图片、分析结果、迭代优化。


实战准备:选择你的工具

在开始之前,你需要一个AI图像生成工具。根据不同情况,推荐以下方案:

方案一:Midjourney(推荐,效果最好)

  • 需要Discord账号
  • 访问 midjourney.com,加入Discord服务器
  • 在对话框输入 /imagine + 你的提示词
  • 基础版每月10美元,可生成约200张图

方案二:Stable Diffusion(免费,需要技术基础)

  • 完全开源免费
  • 可以本地部署(需要显卡)或使用在线平台
  • 在线推荐:Google Colab 免费GPU、Civitai.com 在线生图

方案三:国内工具(无需科学上网)

  • 通义万相(阿里):tongyi.aliyun.com
  • 文心一格(百度):yige.baidu.com
  • 智谱清言(智谱AI):chatglm.cn

建议:如果你是纯新手,先用国内工具练手,零门槛。等熟悉了提示词逻辑,再切换到Midjourney或Stable Diffusion获取更高质量。


案例一:从零开始——画一只猫

第一步:写出最简单的提示词

我们从最基础的开始。打开你的AI工具,输入:

`

a cat

`

生成几张图,看看AI会给你什么。大概率是各种各样的猫——不同品种、不同场景、不同风格,完全随机。

这就是”裸奔”提示词的效果。 AI有太多自由发挥的空间,结果不可控。

第二步:逐步添加要素

现在,按照早课的五大要素,一步步丰富你的提示词。

添加主体细节:

`

a fluffy orange tabby cat with green eyes

`

——一只毛茸茸的橘色虎斑猫,绿色眼睛。

添加动作和场景:

`

a fluffy orange tabby cat with green eyes, sitting on a windowsill, looking outside at the rain

`

——坐在窗台上,看着窗外的雨。

添加风格:

`

a fluffy orange tabby cat with green eyes, sitting on a windowsill, looking outside at the rain, Studio Ghibli style

`

——宫崎骏风格。

添加构图和光影:

`

a fluffy orange tabby cat with green eyes, sitting on a windowsill, looking outside at the rain, Studio Ghibli style, close-up shot, soft warm indoor lighting, cozy and peaceful atmosphere

`

——特写构图,柔和的室内暖光,温馨宁静的氛围。

添加技术参数:

`

a fluffy orange tabby cat with green eyes, sitting on a windowsill, looking outside at the rain, Studio Ghibli style, close-up shot, soft warm indoor lighting, cozy and peaceful atmosphere, highly detailed, masterpiece, 8K

`

第三步:对比结果

用”裸奔版”和”完整版”分别生成3-5张图,对比效果。你会发现:

  • 裸奔版:猫的品种随机、场景随机、风格随机,可能好看也可能很丑
  • 完整版:画面统一、风格明确、构图讲究,几乎每张都不错

关键认知:提示词不是”写作文”,而是”给画家下brief”。你给的brief越详细,画家画出来越接近你想要的。


案例二:风格实验——同一主体,五种画风

这个练习帮你理解”风格”要素的威力。

实验设计

固定主体为”一座古老的石桥,横跨在溪流上,周围是秋天的红叶”,然后只改变风格描述,生成5种不同风格的图片。

提示词模板:

`

an ancient stone bridge over a stream, surrounded by autumn red leaves, [STYLE], landscape composition, golden hour lighting, masterpiece, 8K

`

[STYLE] 替换成以下5种风格,分别生成:

序号 风格描述 预期效果

|——|———|———|

1 Chinese ink painting style(中国水墨画) 意境深远、留白简约
2 Oil painting, impressionist style(印象派油画) 色彩丰富、笔触粗犷
3 Japanese anime style(日系动漫) 线条清晰、色彩明快
4 Cyberpunk neon style(赛博朋克霓虹) 科幻感、霓虹灯映照
5 Vintage film photography(复古胶片摄影) 颗粒感、褪色调

分析与思考

生成完5组图片后,思考:

  • 同一个场景,不同风格给人的感觉差异有多大?
  • 哪种风格最吸引你?为什么?
  • 如果你要把这张图用在什么地方(头像、壁纸、公众号配图),你会选哪种风格?

实用技巧:找到你喜欢的风格后,记住这个风格的英文描述,以后可以直接复用。比如你特别喜欢”Studio Ghibli style”的效果,以后画任何主体都可以加上这个风格。


案例三:迭代优化——从”能看”到”惊艳”

AI图像生成很少一次出完美作品。真正的高手,是通过反复迭代来逼近理想效果。

实战流程

第一轮:基础版本

假设我们要画”一个在雨中撑伞的女孩”:

`

a girl holding an umbrella in the rain, anime style

`

生成4张图,选出最好的一张。假设你选中了第3张。

第二轮:添加细节

基于第一轮的结果,补充更多描述:

`

a young woman with long black hair, wearing a white dress, holding a transparent umbrella in heavy rain, anime style, medium shot, blue hour lighting, melancholic mood, highly detailed

`

再生成4张,选最好的一张。

第三轮:微调优化

根据第二轮的结果,你发现女孩的表情不太对,想要更忧郁的感觉:

`

a young woman with long black hair, wearing a white dress, holding a transparent umbrella in heavy rain, looking down with a sad expression, anime style, medium shot, blue hour lighting, melancholic and dreamy mood, rain drops visible, puddle reflections, highly detailed, masterpiece

`

再生成4张,选最好的一张。

迭代的核心逻辑

`

初始版本 → 观察结果 → 发现问题 → 调整提示词 → 再次生成 → 重复

`

每一轮迭代,你都在做三件事:

  1. 观察:这张图哪里好?哪里不好?
  2. 归因:不好的地方,是提示词描述不够准确,还是AI理解偏差?
  3. 调整:针对问题修改提示词——不够具体的加细节,理解偏差的换表达方式

重要提醒:如果同一个提示词改了3轮还是不满意,试试换一个风格描述。有时候不是你的提示词有问题,而是这个风格不适合这个主体。


案例四:创意组合——画出你脑中的奇想

最后一个练习,释放你的想象力。

创意混搭公式

`

[不相关的物体A] + [不相关的物体B] + [统一的场景/风格]

`

把两个本来不搭的东西放在一起,用风格和场景把它们统一起来。这是AI绘画最有趣的部分——你可以创造出世界上不存在的画面。

5个创意模板(直接可用)

模板1:动物×职业

`

a sophisticated raccoon wearing a detective coat, sitting in a vintage office, reading a magnifying glass, film noir style, dramatic shadows, 35mm film photography

`

——一只穿着侦探大衣的浣熊,在复古办公室里用放大镜看东西,黑色电影风格。

模板2:食物×场景

`

a giant floating ramen bowl in the sky, with noodles falling like rain, tiny people on the ground looking up in amazement, surrealist style, warm golden lighting, Dali-inspired

`

——巨大的拉面碗漂浮在天空,面条像雨一样落下,超现实主义风格。

模板3:自然×科技

`

a bonsai tree growing inside a transparent glass computer case, with circuits and wires as roots, RGB lighting, cyberpunk aesthetic, macro photography, highly detailed

`

——盆栽长在透明电脑机箱里,电路板当根系,RGB灯效,赛博朋克美学。

模板4:历史×未来

`

ancient Egyptian pharaoh riding a hoverboard through a futuristic city, hieroglyphic holograms floating in the air, retro-futurism style, epic wide angle shot

`

——古埃及法老踩着悬浮滑板穿越未来城市,象形文字全息投影漂浮在空中,复古未来主义风格。

模板5:情绪×具象

`

a visual representation of loneliness, a single glowing lightbulb in an endless dark ocean, minimalist style, dramatic contrast, cinematic photography

`

——孤独的视觉化表达,一盏发光的灯泡漂浮在无尽的黑暗海洋中,极简风格。

练习任务

现在轮到你了。从下面选一个组合,或者自己创造一个:

  • 会飞的鲸鱼 × 水下城市
  • 钢铁做的花 × 暴风雪中的温室
  • 老式收音机 × 外星球表面
  • 穿宇航服的猫 × 梵高的星空

用五大要素公式写出完整提示词,生成3-5张图,选出最好的一张保存下来。


提示词模板库:随时可用的10个模板

把下面这些模板保存到你的笔记里,以后需要画什么类型的图,直接套用修改。

人物类

模板1:人物肖像

`

[性别] [年龄描述] [发型发色] [穿着], [表情动作], [场景], [风格] portrait, [构图], [光线], [氛围], highly detailed, masterpiece

`

模板2:动漫角色

`

[角色描述], [动作姿态], [服装细节], anime style, [构图], [光线], [氛围], high quality anime art, detailed

`

风景类

模板3:自然风光

`

[地点类型] with [具体特征], [季节/天气], [风格], landscape photography, [构图], [光线], [氛围], 8K, ultra HD

`

模板4:城市街景

`

[城市类型] street scene, [时间段], [天气], [风格], [构图], [光线], urban photography, highly detailed

`

物品类

模板5:产品展示

`

[物品描述], [材质质感], [摆放方式], [背景], product photography, studio lighting, clean composition, 8K, commercial quality

`

创意类

模板6:超现实场景

`

[不搭的元素A] and [不搭的元素B], [统一场景], surrealist style, [光线], dreamlike atmosphere, masterpiece

`

模板7:复古海报

`

[主题] vintage poster design, [年代风格] aesthetic, bold typography, limited color palette, retro illustration, clean lines

`

场景类

模板8:室内空间

`

[房间类型], [装修风格], [家具摆设], [光线来源], interior design photography, wide angle, [氛围], highly detailed

`

模板9:科幻场景

`

[科幻元素描述], [环境设定], sci-fi concept art, [光线], epic scale, cinematic, highly detailed, 8K

`

模板10:美食摄影

`

[食物描述], [摆盘方式], [餐具], [背景], food photography, [光线], [氛围], appetizing, highly detailed, 8K

`


今日总结

今天晚课的核心收获:

  • 逐步添加法:从最简单的提示词开始,逐步添加五大要素,观察每一步的变化——这是理解提示词最直观的方式
  • 风格实验法:同一主体换5种风格,快速建立对”风格”要素的直觉——找到你的审美偏好
  • 迭代优化法:初始版本→观察→归因→调整→再生成,3轮迭代逼近理想效果——AI出图很少一步到位

今日行动项

今晚花15分钟完成以下练习:

  • 练习一:用”逐步添加法”画一只你想象中的动物,从”裸奔版”到”完整版”至少迭代3次,保存最终版本
  • 练习二:用”风格实验法”选一个场景,换3种不同风格生成,选出你最喜欢的风格并记录下来
  • 练习三:从10个模板库中选一个,填入你自己的内容,生成一张图

完成这3个练习,你就真正掌握了”提示词作画”这个技能。


📖 地铁深读:从Prompt到Prompt Engineering——一个新职业的诞生

这个板块专为地铁通勤设计,每篇5-10分钟。不想深读可以跳过,不影响主线学习。

提示词工程师:年薪30万的新职业?

2023年,一个全新的职业岗位出现在招聘市场上——Prompt Engineer(提示词工程师)。一些公司开出了15万到30万美元的年薪,招聘”会写提示词”的人。

这个岗位听起来很荒谬:会打字就能拿高薪?

事实没那么简单。一个优秀的提示词工程师,需要具备以下能力:

  1. 深度理解AI模型的行为模式——知道什么词会触发什么效果,什么表达会导致什么偏差
  2. 跨领域的知识储备——要画建筑图需要懂建筑风格,要画医学图需要懂解剖学
  3. 系统化的测试方法——不是随便试,而是有计划地测试不同变量的影响
  4. 审美能力——能判断AI输出的质量,知道什么是”好”什么是”差”

一个真实案例:用AI生成产品图

某电商公司以前拍一组产品图需要:

  • 摄影师:2000元/天
  • 模特:1500元/天
  • 场地租用:3000元/天
  • 后期修图:500元/张
  • 总计:一次拍摄约1-2万元,出图20-30张

现在,一个提示词工程师用Midjourney:

  • 设备成本:0元(只需要电脑和网络)
  • 时间成本:2-3小时
  • 出图数量:50-100张可用品
  • 质量:满足电商展示需求

这就是为什么提示词工程师值钱——他们不是在”打字”,而是在用语言指挥一个超级画师,替代了一整条传统生产链。

提示词的未来:会消失吗?

一个值得思考的问题:随着AI越来越聪明,提示词会不会变得不再重要?

两种观点:

会消失派:AI会越来越理解自然语言。未来你可能只需要说”给我画一个好看的头像”,AI就能完美理解你想要什么——不需要精心构造提示词。

不会消失派:即使AI理解能力提升,精确控制仍然需要精确表达。就像你不需要学会开车也能出门(可以打车),但赛车手永远不会失业——对速度和精度的追求没有上限。

我的判断:提示词的”形式”会变(从英文关键词到自然语言对话),但”精确描述需求”的能力不会过时。能清晰表达自己想要什么的人,在AI时代永远有价值。

推荐学习资源

  • PromptHero.com:全球最大的提示词分享社区,按模型分类,每张图都附带完整提示词
  • Civitai.com:Stable Diffusion社区,不仅有提示词,还有模型和LoRA分享
  • r/StableDiffusion(Reddit):活跃的AI绘画讨论社区,经常有人分享实用技巧
  • Learn Prompting(learnprompting.org):系统化的提示词学习教程,从入门到精通

一句话总结:提示词不是”打字”,是”用语言画画”。掌握这项技能,你就拥有了一个24小时待命的超级画师。


下篇预告

明天早上8点:Day24——早课 风格迁移:照片变油画。我们将学习如何把一张普通照片变成梵高风格、宫崎骏风格、或者任何你想要的艺术风格——不需要会画画,只需要会写提示词。

明晚5点:Day24——晚课 风格迁移实战。用真实照片练习风格转换,掌握图生图的核心技巧。

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注