外观
必经之路
入门:简单生图
第一步:描述你想要的画面
直接用中文或英文描述,比如:
帮我生成一张日落时分的海边风景图,有椰子树,色调温暖A cute cat sitting on a windowsill, watercolor style第一次生图,我分别用4个工具生成图片,你觉得那个效果好呢?
目前公认排名:1.ChatGPT-image2 > 2.Gemini Nano Banana2 > 3.国内AI
新手建议:我们先用国内的工具进行初步学习,到了进阶,我们就会教你使用最好的工具。
ChatGPT

Gemini

千问

豆包

第二步:调整与修改
生成后你可以继续对话来优化:
把背景换成城市夜景风格改成油画千问

豆包

第三步:保存图片
💡是不是很简单,点击图片即可下载高清图片啦。
如果你觉得太简陋,请住下看。
进阶:高质量生图
一个好的提示词通常包含这些要素:主体 + 场景 + 风格 + 光线 + 色调 + 细节描述
试一试
下面的提示词,虽然未达到商用级别,但对你了解AI能力边界很有帮助
1. 写实人像
Professional portrait photo of a young woman, 25 years old, soft studio lighting, shallow depth of field, neutral background, shot on Canon EOS R5, 85mm lens, photorealistic, high detail中文解释:
专业人像摄影,25岁年轻女性,柔和工作室灯光,浅景深,中性背景,佳能EOS R5拍摄,85mm镜头,照片级真实感
千问

2. 产品展示
A minimalist product photography of a glass water bottle, placed on a white marble surface, soft diffused lighting, clean background, commercial style, 4K resolution中文解释:
极简产品摄影,玻璃水瓶,白色大理石台面,柔和漫射光,干净背景,商业风格,4K分辨率
豆包

3. 风景摄影
Golden hour landscape photography of a mountain lake with reflections, dramatic clouds, pine trees silhouettes in foreground, warm tones, ultra-wide angle, National Geographic style中文解释:
黄金时刻风景摄影,山间湖泊倒影,戏剧性云层,前景松树剪影,暖色调,超广角,国家地理风格
千问

4. 插画风格
A beautiful illustration of a magical forest with glowing mushrooms and fireflies, whimsical style, soft pastel colors, detailed line art, digital painting, Studio Ghibli inspired中文解释:
魔法森林插画,发光蘑菇和萤火虫,奇幻风格,柔和粉彩色调,精细线条,数字绘画,吉卜力风格
豆包

5. Logo设计
A modern minimalist logo for a tech startup, geometric shapes, gradient from blue to purple, clean vector style, white background, professional branding中文解释:
现代极简科技公司Logo,几何图形,蓝紫渐变,干净矢量风格,白色背景,专业品牌设计
Gemini

参数技巧
以后会在提示词库见到更多关于绘画的参数,现在先了解一部分
图片质量关键词
| 关键词 | 效果 | 适用场景 |
|---|---|---|
photorealistic | 照片级真实 | 人像、产品、风景 |
highly detailed | 高细节 | 所有场景 |
4K / 8K resolution | 高分辨率 | 需要大尺寸输出 |
professional photography | 专业摄影感 | 人像、商业摄影 |
cinematic lighting | 电影感光线 | 场景、氛围图 |
soft lighting | 柔和光线 | 人像、产品 |
dramatic lighting | 戏剧性光线 | 艺术创作 |
风格控制关键词
| 关键词 | 风格 |
|---|---|
watercolor painting | 水彩画 |
oil painting | 油画 |
digital art | 数字艺术 |
pencil sketch | 铅笔素描 |
anime style | 动漫风 |
pixel art | 像素风 |
3D render | 3D渲染 |
isometric | 等轴测视角 |
提示词优化技巧
- 越具体越好:与其说"一只猫",不如说"一只橘色波斯猫,蓝色眼睛,坐在红色丝绒沙发上"
- 指定光线:光线对画面氛围影响最大,务必在提示词中描述
- 参考相机参数:加入镜头型号、焦距等关键词,可以提升照片感
- 分步生成:先生成大致构图,再逐步添加细节
- 使用参考词:加入著名摄影师或艺术家名字可以引导风格
大成:高级技巧
点评
我们还可以利用AI解决以下问题,此时你应该自己去尝试生成和修改一张图片。
如果你使用国内AI,目前(2026年)在修改图片时不够完美,后面进阶教程会带你使用国外AI工具。
图生图(Image-to-Image)
上传一张图片后,可以基于它进行修改。常用方式:
风格转换:
把这张照片改成梵高的星空风格局部修改:
把图中人物的衣服颜色从蓝色改成红色,保持其他部分不变背景替换:
保留图中的人物,把背景换成海滩日落图片扩展:
把这张图片扩展为横幅尺寸,自然延伸画面内容多图生成技巧
当你需要生成一组风格统一的图片时:
生成4张同一系列的插画:春夏秋冬四季,同一个女孩在不同季节的场景,保持统一的插画风格和色调关键技巧:
- 在提示词中明确说明"同一系列""统一风格"
- 指定一致的色调和风格关键词
- 可以先生成第一张确认风格,再让AI保持风格继续生成
局部重绘与编辑
上传图片后,可以精准修改特定元素:
选中图片中的天空部分,换成极光效果把图片中桌上的花瓶去掉,保持桌面自然操作要点:
- 上传原图后,清晰描述要修改的区域
- 说明期望的修改结果
- 可以分多轮逐步调整
常见高级场景
场景1:生成社交媒体配图
提示词:
生成一张适合小红书发布的美食照片,精致的日式便当,俯拍角度,木质桌面背景,自然光线,温暖的色调,有筷子和小碟子作为点缀,分辨率高,适合手机竖屏查看
下面场景2/3/4提示词,大家动手试一试吧!
千问

场景2:生成设计素材
生成一张现代商务PPT封面配图,抽象的几何图形组合,蓝色系配色,渐变效果,简洁大气,白色背景留有空间放标题文字场景3:生成角色设计
设计一个游戏角色:年轻的魔法师,银色短发,穿着深蓝色长袍,手持发光的水晶法杖,站姿自信,全身像,概念艺术风格,高清细节场景4:批量生成变体
基于当前这张图片,生成5个不同角度的版本:正面、侧面、背面、俯视、仰视,保持相同的风格和光照排错指南
| 问题 | 原因 | 解决方法 |
|---|---|---|
| 文字生成错误 | AI对文字处理能力有限 | 用图片编辑工具后期添加文字 |
| 比例不对 | 未指定尺寸要求 | 在提示词中说明"竖版""16:9"等 |
| 风格不统一 | 描述不够具体 | 固定使用相同的风格关键词组合 |
| 细节失真 | 描述过于复杂 | 简化描述,分步生成 |
| 人物变形 | 复杂姿态 | 参考真实照片,简化人物动作 |
常见问题
点击标题展示答案
1. 画面出现“鬼手”或肢体扭曲
- 问题表现:AI 画出的人手有六七根手指、双臂交叠异常,或者关节反折。
- 解决方法:
- 添加反向提示词(Negative Prompt):在反向提示词框中加入
bad hands, extra fingers, deformed limbs, mutated limbs, missing fingers(残缺手、多余手指、畸形肢体)。 - 局部重绘(Inpainting):使用 AI 工具的“局部重绘”功能,把画错的手部圈出来,让 AI 单独重新生成该区域。
- 利用插件控制(针对 Stable Diffusion):引入 ControlNet 的 OpenPose(姿态控制)模型,强行固定骨骼架构,规范手部和肢体。
- 添加反向提示词(Negative Prompt):在反向提示词框中加入
2. 生成的图片非常模糊、分辨率低
- 问题表现:画风和构图不错,但放大一看全是马赛克或细节糊成一片。
- 解决方法:
- 添加高清修饰词:在提示词中加入
8k resolution, highly detailed, sharp focus, masterpiece(8K分辨率、高细节、清晰聚焦、杰作)。 - 使用高清修复(Hi-Res Fix):在文生图时直接勾选超分辨率放大。
- 后期放大(Upscale):导出图片后,使用 Topaz Gigapixel AI、Upscaler 或剪映等工具进行 AI 无损放大。
- 添加高清修饰词:在提示词中加入
3. AI “听不懂人话”,画面完全货不对板
- 问题表现:输入了一大堆文字,结果 AI 只抓住了其中一两个词,或者彻底偏离了预期。
- 解决方法:
- 优化词序结构:AI 遵循“越靠前权重越高”的原则。标准公式为:
[核心主体] + [细节描述] + [环境背景] + [艺术风格/相机参数]。 - 使用权重符号:
- 在 Stable Diffusion 中,可以用括号
(keyword:1.2)来强调某个词。 - 在 Midjourney 中,可以使用
--no来排除不想要的元素,或者使用::来分配权重。
- 在 Stable Diffusion 中,可以用括号
- 优化词序结构:AI 遵循“越靠前权重越高”的原则。标准公式为:
4. 画面元素过多,显得杂乱无章
- 问题表现:想把“城堡、巨龙、少女、飞船、森林、魔法阵”全塞进去,结果画面挤成一团,没有焦点。
- 解决方法:
- 学会做减法:一张好照片通常只有一个核心视觉焦点。先精简提示词,只留 1-2 个主体,其余用环境词一带而过。
- 指定构图词:显式引导 AI 布局,例如加入
close-up(特写)、rule of thirds(三分法构图)、centered composition(中心构图)。
避坑指南
新手最忌讳写“小作文”式的提示词。AI 并不是人类,长篇大论的叙事只会让它抓不到重点,尽量多用短语和词组。
5. 无法保持同一个角色/物体的连续性
- 问题表现:想画一组连环画或绘本,但第一张图的主角长这样,第二张图就彻底换了张脸。
- 解决方法:
- 固定种子(Seed):找到满意的图片后,复制它的 Seed 值,在生成下一张图时固定这个 Seed,只修改动作词。
- 角色参考(Character Reference):
- 在 Midjourney 中使用
--cref参数垫图。 - 在其他工具中上传主角的照片作为“人脸底图”来保持一致性。
- 在 Midjourney 中使用
- 微调模型:在 Stable Diffusion 中,可以通过训练或下载特定的 LoRA 模型来彻底锁死角色外貌。
6. 画风不稳定,一会儿写实一会儿动漫
- 问题表现:想要赛博朋克风,AI 却给了一张水彩画;想要二次元,出来的却是真人 3D 感。
- 解决方法:
- 选对大模型(Checkpoints):选对底模是关键。写实风就选 Realistic 类的模型,动漫风就选 Anime 类的模型,不要让二次元模型去强行画真人。
- 明确指定渲染器或艺术家:加入
Unreal Engine 5 render(虚幻5渲染)、Studio Ghibli style(吉卜力风格)或具体的艺术家名字(如by Shinkai Makoto新海诚)。
7. 文字渲染变成“天书”
- 问题表现:想让画面里的路牌写着 "STOP" 或者是特定中文,AI 却生成了一堆看不懂的怪异符号。
- 解决方法:
- 使用最新的绘画模型:较新的模型(如 Midjourney v6、DALL-E 3、SD 3等)对文字的理解大大增强。
- 使用双引号:在输入提示词时,用双引号将需要出现的文字框起来,例如:
a neon sign that says "OPEN"。 - 后期流处理(最稳妥):让 AI 只生成无字背景,自己用 Photoshop、美图秀秀等工具手动打字加上去。
8. 陷入“版权”与“原创性”的迷茫
- 问题表现:不知道生成的图片能不能商用,或者觉得自己只是在拼凑提示词,没有创作的成就感。
- 解决方法:
- 查看平台协议:大部分主流 AI 工具(尤其是付费版本)生成的图片是允许商用的,但具体要看各平台的《服务协议》。
- 摆正心态,人机协同:把 AI 当作你的超级画笔或灵感放大器。真正拉开作品差距的是你的创意、构图审美和后期精修能力(AI 绘画 + PS 二次创作才是目前的行业常态)。
💡 进阶建议
刚开始玩 AI 绘画,最快提高的方法是“抄作业”。多去 AI提示词库 或各大 AI 绘画社区看大神的优秀作品,复制他们的提示词和参数进行模仿修改,很快就能上手!

