必经之路

入门：简单生图

第一步：描述你想要的画面

直接用中文或英文描述，比如：

帮我生成一张日落时分的海边风景图，有椰子树，色调温暖

A cute cat sitting on a windowsill, watercolor style

第一次生图，我分别用4个工具生成图片，你觉得那个效果好呢？

目前公认排名：1.ChatGPT-image2 > 2.Gemini Nano Banana2 > 3.国内AI

新手建议：我们先用国内的工具进行初步学习，到了进阶，我们就会教你使用最好的工具。

ChatGPT

Gemini

千问

豆包

第二步：调整与修改

生成后你可以继续对话来优化：

把背景换成城市夜景

风格改成油画

千问

豆包

第三步：保存图片

💡是不是很简单，点击图片即可下载高清图片啦。

如果你觉得太简陋，请住下看。

进阶：高质量生图

一个好的提示词通常包含这些要素：主体 + 场景 + 风格 + 光线 + 色调 + 细节描述

试一试

下面的提示词，虽然未达到商用级别，但对你了解AI能力边界很有帮助

1. 写实人像

Professional portrait photo of a young woman, 25 years old, soft studio lighting, shallow depth of field, neutral background, shot on Canon EOS R5, 85mm lens, photorealistic, high detail

中文解释：

专业人像摄影，25岁年轻女性，柔和工作室灯光，浅景深，中性背景，佳能EOS R5拍摄，85mm镜头，照片级真实感

千问

2. 产品展示

A minimalist product photography of a glass water bottle, placed on a white marble surface, soft diffused lighting, clean background, commercial style, 4K resolution

中文解释：

极简产品摄影，玻璃水瓶，白色大理石台面，柔和漫射光，干净背景，商业风格，4K分辨率

豆包

3. 风景摄影

Golden hour landscape photography of a mountain lake with reflections, dramatic clouds, pine trees silhouettes in foreground, warm tones, ultra-wide angle, National Geographic style

中文解释：

黄金时刻风景摄影，山间湖泊倒影，戏剧性云层，前景松树剪影，暖色调，超广角，国家地理风格

千问

4. 插画风格

A beautiful illustration of a magical forest with glowing mushrooms and fireflies, whimsical style, soft pastel colors, detailed line art, digital painting, Studio Ghibli inspired

中文解释：

魔法森林插画，发光蘑菇和萤火虫，奇幻风格，柔和粉彩色调，精细线条，数字绘画，吉卜力风格

豆包

5. Logo设计

A modern minimalist logo for a tech startup, geometric shapes, gradient from blue to purple, clean vector style, white background, professional branding

中文解释：

现代极简科技公司Logo，几何图形，蓝紫渐变，干净矢量风格，白色背景，专业品牌设计

Gemini

参数技巧

以后会在提示词库见到更多关于绘画的参数，现在先了解一部分

图片质量关键词

关键词	效果	适用场景
`photorealistic`	照片级真实	人像、产品、风景
`highly detailed`	高细节	所有场景
`4K / 8K resolution`	高分辨率	需要大尺寸输出
`professional photography`	专业摄影感	人像、商业摄影
`cinematic lighting`	电影感光线	场景、氛围图
`soft lighting`	柔和光线	人像、产品
`dramatic lighting`	戏剧性光线	艺术创作

风格控制关键词

关键词	风格
`watercolor painting`	水彩画
`oil painting`	油画
`digital art`	数字艺术
`pencil sketch`	铅笔素描
`anime style`	动漫风
`pixel art`	像素风
`3D render`	3D渲染
`isometric`	等轴测视角

提示词优化技巧

越具体越好：与其说"一只猫"，不如说"一只橘色波斯猫，蓝色眼睛，坐在红色丝绒沙发上"
指定光线：光线对画面氛围影响最大，务必在提示词中描述
参考相机参数：加入镜头型号、焦距等关键词，可以提升照片感
分步生成：先生成大致构图，再逐步添加细节
使用参考词：加入著名摄影师或艺术家名字可以引导风格

大成：高级技巧

点评

我们还可以利用AI解决以下问题，此时你应该自己去尝试生成和修改一张图片。

如果你使用国内AI，目前（2026年）在修改图片时不够完美，后面进阶教程会带你使用国外AI工具。

图生图（Image-to-Image）

上传一张图片后，可以基于它进行修改。常用方式：

风格转换：

把这张照片改成梵高的星空风格

局部修改：

把图中人物的衣服颜色从蓝色改成红色，保持其他部分不变

背景替换：

保留图中的人物，把背景换成海滩日落

图片扩展：

把这张图片扩展为横幅尺寸，自然延伸画面内容

多图生成技巧

当你需要生成一组风格统一的图片时：

生成4张同一系列的插画：春夏秋冬四季，同一个女孩在不同季节的场景，保持统一的插画风格和色调

关键技巧：

在提示词中明确说明"同一系列""统一风格"
指定一致的色调和风格关键词
可以先生成第一张确认风格，再让AI保持风格继续生成

局部重绘与编辑

上传图片后，可以精准修改特定元素：

选中图片中的天空部分，换成极光效果

把图片中桌上的花瓶去掉，保持桌面自然

操作要点：

上传原图后，清晰描述要修改的区域
说明期望的修改结果
可以分多轮逐步调整

常见高级场景

场景1：生成社交媒体配图

提示词：

生成一张适合小红书发布的美食照片，精致的日式便当，俯拍角度，木质桌面背景，自然光线，温暖的色调，有筷子和小碟子作为点缀，分辨率高，适合手机竖屏查看

下面场景2/3/4提示词，大家动手试一试吧！

千问

生成一张适合小红书发布的美食照片，精致的日式便当，俯拍角度，木质桌面背景，自然光线，温暖的色调，有筷子和小碟子作为点缀，分辨率高，适合手机竖屏查看

场景2：生成设计素材

生成一张现代商务PPT封面配图，抽象的几何图形组合，蓝色系配色，渐变效果，简洁大气，白色背景留有空间放标题文字

场景3：生成角色设计

设计一个游戏角色：年轻的魔法师，银色短发，穿着深蓝色长袍，手持发光的水晶法杖，站姿自信，全身像，概念艺术风格，高清细节

场景4：批量生成变体

基于当前这张图片，生成5个不同角度的版本：正面、侧面、背面、俯视、仰视，保持相同的风格和光照

排错指南

问题	原因	解决方法
文字生成错误	AI对文字处理能力有限	用图片编辑工具后期添加文字
比例不对	未指定尺寸要求	在提示词中说明"竖版""16:9"等
风格不统一	描述不够具体	固定使用相同的风格关键词组合
细节失真	描述过于复杂	简化描述，分步生成
人物变形	复杂姿态	参考真实照片，简化人物动作

常见问题

点击标题展示答案

1. 画面出现“鬼手”或肢体扭曲

问题表现：AI 画出的人手有六七根手指、双臂交叠异常，或者关节反折。
解决方法：
- 添加反向提示词（Negative Prompt）：在反向提示词框中加入 bad hands, extra fingers, deformed limbs, mutated limbs, missing fingers（残缺手、多余手指、畸形肢体）。
- 局部重绘（Inpainting）：使用 AI 工具的“局部重绘”功能，把画错的手部圈出来，让 AI 单独重新生成该区域。
- 利用插件控制（针对 Stable Diffusion）：引入 ControlNet 的 OpenPose（姿态控制）模型，强行固定骨骼架构，规范手部和肢体。

2. 生成的图片非常模糊、分辨率低

问题表现：画风和构图不错，但放大一看全是马赛克或细节糊成一片。
解决方法：
- 添加高清修饰词：在提示词中加入 8k resolution, highly detailed, sharp focus, masterpiece（8K分辨率、高细节、清晰聚焦、杰作）。
- 使用高清修复（Hi-Res Fix）：在文生图时直接勾选超分辨率放大。
- 后期放大（Upscale）：导出图片后，使用 Topaz Gigapixel AI、Upscaler 或剪映等工具进行 AI 无损放大。

3. AI “听不懂人话”，画面完全货不对板

问题表现：输入了一大堆文字，结果 AI 只抓住了其中一两个词，或者彻底偏离了预期。
解决方法：
- 优化词序结构：AI 遵循“越靠前权重越高”的原则。标准公式为：[核心主体] + [细节描述] + [环境背景] + [艺术风格/相机参数]。
- 使用权重符号：
  - 在 Stable Diffusion 中，可以用括号 (keyword:1.2) 来强调某个词。
  - 在 Midjourney 中，可以使用 --no 来排除不想要的元素，或者使用 :: 来分配权重。

4. 画面元素过多，显得杂乱无章

问题表现：想把“城堡、巨龙、少女、飞船、森林、魔法阵”全塞进去，结果画面挤成一团，没有焦点。
解决方法：
- 学会做减法：一张好照片通常只有一个核心视觉焦点。先精简提示词，只留 1-2 个主体，其余用环境词一带而过。
- 指定构图词：显式引导 AI 布局，例如加入 close-up（特写）、rule of thirds（三分法构图）、centered composition（中心构图）。

避坑指南

新手最忌讳写“小作文”式的提示词。AI 并不是人类，长篇大论的叙事只会让它抓不到重点，尽量多用短语和词组。

5. 无法保持同一个角色/物体的连续性

问题表现：想画一组连环画或绘本，但第一张图的主角长这样，第二张图就彻底换了张脸。
解决方法：
- 固定种子（Seed）：找到满意的图片后，复制它的 Seed 值，在生成下一张图时固定这个 Seed，只修改动作词。
- 角色参考（Character Reference）：
  - 在 Midjourney 中使用 --cref 参数垫图。
  - 在其他工具中上传主角的照片作为“人脸底图”来保持一致性。
- 微调模型：在 Stable Diffusion 中，可以通过训练或下载特定的 LoRA 模型来彻底锁死角色外貌。

6. 画风不稳定，一会儿写实一会儿动漫

问题表现：想要赛博朋克风，AI 却给了一张水彩画；想要二次元，出来的却是真人 3D 感。
解决方法：
- 选对大模型（Checkpoints）：选对底模是关键。写实风就选 Realistic 类的模型，动漫风就选 Anime 类的模型，不要让二次元模型去强行画真人。
- 明确指定渲染器或艺术家：加入 Unreal Engine 5 render（虚幻5渲染）、Studio Ghibli style（吉卜力风格）或具体的艺术家名字（如 by Shinkai Makoto 新海诚）。

7. 文字渲染变成“天书”

问题表现：想让画面里的路牌写着 "STOP" 或者是特定中文，AI 却生成了一堆看不懂的怪异符号。
解决方法：
- 使用最新的绘画模型：较新的模型（如 Midjourney v6、DALL-E 3、SD 3等）对文字的理解大大增强。
- 使用双引号：在输入提示词时，用双引号将需要出现的文字框起来，例如：a neon sign that says "OPEN"。
- 后期流处理（最稳妥）：让 AI 只生成无字背景，自己用 Photoshop、美图秀秀等工具手动打字加上去。

8. 陷入“版权”与“原创性”的迷茫

问题表现：不知道生成的图片能不能商用，或者觉得自己只是在拼凑提示词，没有创作的成就感。
解决方法：
- 查看平台协议：大部分主流 AI 工具（尤其是付费版本）生成的图片是允许商用的，但具体要看各平台的《服务协议》。
- 摆正心态，人机协同：把 AI 当作你的超级画笔或灵感放大器。真正拉开作品差距的是你的创意、构图审美和后期精修能力（AI 绘画 + PS 二次创作才是目前的行业常态）。

💡 进阶建议

刚开始玩 AI 绘画，最快提高的方法是“抄作业”。多去 AI提示词库或各大 AI 绘画社区看大神的优秀作品，复制他们的提示词和参数进行模仿修改，很快就能上手！

必经之路 ​

入门：简单生图 ​

第一步：描述你想要的画面 ​

第二步：调整与修改 ​

第三步：保存图片 ​

进阶：高质量生图 ​

1. 写实人像 ​

2. 产品展示 ​

3. 风景摄影 ​

4. 插画风格 ​

5. Logo设计 ​

参数技巧 ​

图片质量关键词 ​

风格控制关键词 ​

提示词优化技巧 ​

大成：高级技巧 ​

图生图（Image-to-Image） ​

多图生成技巧 ​

局部重绘与编辑 ​

常见高级场景 ​

场景1：生成社交媒体配图 ​

场景2：生成设计素材 ​

场景3：生成角色设计 ​

场景4：批量生成变体 ​

排错指南 ​

常见问题 ​

必经之路

入门：简单生图

第一步：描述你想要的画面

第二步：调整与修改

第三步：保存图片

进阶：高质量生图

1. 写实人像

2. 产品展示

3. 风景摄影

4. 插画风格

5. Logo设计

参数技巧

图片质量关键词

风格控制关键词

提示词优化技巧

大成：高级技巧

图生图（Image-to-Image）

多图生成技巧

局部重绘与编辑

常见高级场景

场景1：生成社交媒体配图

场景2：生成设计素材

场景3：生成角色设计

场景4：批量生成变体

排错指南

常见问题