Skip to content

必经之路

入门:简单生图

第一步:描述你想要的画面

直接用中文或英文描述,比如:

帮我生成一张日落时分的海边风景图,有椰子树,色调温暖
A cute cat sitting on a windowsill, watercolor style

第一次生图,我分别用4个工具生成图片,你觉得那个效果好呢?

目前公认排名:1.ChatGPT-image2 > 2.Gemini Nano Banana2 > 3.国内AI

新手建议:我们先用国内的工具进行初步学习,到了进阶,我们就会教你使用最好的工具。

ChatGPT
帮我生成一张日落时分的海边风景图
Gemini
帮我生成一张日落时分的海边风景图,有椰子树
千问
帮我生成一张日落时分的海边风景图,有椰子树,色调温暖
豆包
帮我生成一张日落时分的海边风景图,有椰子树,色调温暖

第二步:调整与修改

生成后你可以继续对话来优化:

把背景换成城市夜景
风格改成油画
千问
把背景换成城市夜景
豆包
把背景换成城市夜景

第三步:保存图片

💡是不是很简单,点击图片即可下载高清图片啦。

如果你觉得太简陋,请住下看

进阶:高质量生图

一个好的提示词通常包含这些要素:主体 + 场景 + 风格 + 光线 + 色调 + 细节描述

试一试

下面的提示词,虽然未达到商用级别,但对你了解AI能力边界很有帮助

1. 写实人像

Professional portrait photo of a young woman, 25 years old, soft studio lighting, shallow depth of field, neutral background, shot on Canon EOS R5, 85mm lens, photorealistic, high detail
中文解释:
专业人像摄影,25岁年轻女性,柔和工作室灯光,浅景深,中性背景,佳能EOS R5拍摄,85mm镜头,照片级真实感
千问
专业人像摄影,25岁年轻女性,柔和工作室灯光,浅景深,中性背景,佳能EOS

2. 产品展示

A minimalist product photography of a glass water bottle, placed on a white marble surface, soft diffused lighting, clean background, commercial style, 4K resolution
中文解释:
极简产品摄影,玻璃水瓶,白色大理石台面,柔和漫射光,干净背景,商业风格,4K分辨率
豆包
极简产品摄影,玻璃水瓶,白色大理石台面,柔和漫射光,干净背景,商业风格,4K分辨率

3. 风景摄影

Golden hour landscape photography of a mountain lake with reflections, dramatic clouds, pine trees silhouettes in foreground, warm tones, ultra-wide angle, National Geographic style
中文解释:
黄金时刻风景摄影,山间湖泊倒影,戏剧性云层,前景松树剪影,暖色调,超广角,国家地理风格
千问
黄金时刻风景摄影,山间湖泊倒影,戏剧性云层,前景松树剪影,暖色调,超广角,国家地理风格

4. 插画风格

A beautiful illustration of a magical forest with glowing mushrooms and fireflies, whimsical style, soft pastel colors, detailed line art, digital painting, Studio Ghibli inspired
中文解释:
魔法森林插画,发光蘑菇和萤火虫,奇幻风格,柔和粉彩色调,精细线条,数字绘画,吉卜力风格
豆包
魔法森林插画,发光蘑菇和萤火虫,奇幻风格,柔和粉彩色调,精细线条,数字绘画,吉卜力风格

5. Logo设计

A modern minimalist logo for a tech startup, geometric shapes, gradient from blue to purple, clean vector style, white background, professional branding
中文解释:
现代极简科技公司Logo,几何图形,蓝紫渐变,干净矢量风格,白色背景,专业品牌设计
Gemini
魔法森林插画,发光蘑菇和萤火虫,奇幻风格,柔和粉彩色调,精细线条,数字绘画,吉卜力风格

参数技巧

以后会在提示词库见到更多关于绘画的参数,现在先了解一部分

图片质量关键词

关键词效果适用场景
photorealistic照片级真实人像、产品、风景
highly detailed高细节所有场景
4K / 8K resolution高分辨率需要大尺寸输出
professional photography专业摄影感人像、商业摄影
cinematic lighting电影感光线场景、氛围图
soft lighting柔和光线人像、产品
dramatic lighting戏剧性光线艺术创作

风格控制关键词

关键词风格
watercolor painting水彩画
oil painting油画
digital art数字艺术
pencil sketch铅笔素描
anime style动漫风
pixel art像素风
3D render3D渲染
isometric等轴测视角

提示词优化技巧

  1. 越具体越好:与其说"一只猫",不如说"一只橘色波斯猫,蓝色眼睛,坐在红色丝绒沙发上"
  2. 指定光线:光线对画面氛围影响最大,务必在提示词中描述
  3. 参考相机参数:加入镜头型号、焦距等关键词,可以提升照片感
  4. 分步生成:先生成大致构图,再逐步添加细节
  5. 使用参考词:加入著名摄影师或艺术家名字可以引导风格

大成:高级技巧

点评

我们还可以利用AI解决以下问题,此时你应该自己去尝试生成和修改一张图片。

如果你使用国内AI,目前(2026年)在修改图片时不够完美,后面进阶教程会带你使用国外AI工具。

图生图(Image-to-Image)

上传一张图片后,可以基于它进行修改。常用方式:

风格转换

把这张照片改成梵高的星空风格

局部修改

把图中人物的衣服颜色从蓝色改成红色,保持其他部分不变

背景替换

保留图中的人物,把背景换成海滩日落

图片扩展

把这张图片扩展为横幅尺寸,自然延伸画面内容

多图生成技巧

当你需要生成一组风格统一的图片时:

生成4张同一系列的插画:春夏秋冬四季,同一个女孩在不同季节的场景,保持统一的插画风格和色调

关键技巧:

  • 在提示词中明确说明"同一系列""统一风格"
  • 指定一致的色调和风格关键词
  • 可以先生成第一张确认风格,再让AI保持风格继续生成

局部重绘与编辑

上传图片后,可以精准修改特定元素:

选中图片中的天空部分,换成极光效果
把图片中桌上的花瓶去掉,保持桌面自然

操作要点:

  • 上传原图后,清晰描述要修改的区域
  • 说明期望的修改结果
  • 可以分多轮逐步调整

常见高级场景

场景1:生成社交媒体配图

提示词:
生成一张适合小红书发布的美食照片,精致的日式便当,俯拍角度,木质桌面背景,自然光线,温暖的色调,有筷子和小碟子作为点缀,分辨率高,适合手机竖屏查看
下面场景2/3/4提示词,大家动手试一试吧!
千问
生成一张适合小红书发布的美食照片,精致的日式便当,俯拍角度,木质桌面背景,自然光线,温暖的色调,有筷子和小碟子作为点缀,分辨率高,适合手机竖屏查看

场景2:生成设计素材

生成一张现代商务PPT封面配图,抽象的几何图形组合,蓝色系配色,渐变效果,简洁大气,白色背景留有空间放标题文字

场景3:生成角色设计

设计一个游戏角色:年轻的魔法师,银色短发,穿着深蓝色长袍,手持发光的水晶法杖,站姿自信,全身像,概念艺术风格,高清细节

场景4:批量生成变体

基于当前这张图片,生成5个不同角度的版本:正面、侧面、背面、俯视、仰视,保持相同的风格和光照

排错指南

问题原因解决方法
文字生成错误AI对文字处理能力有限用图片编辑工具后期添加文字
比例不对未指定尺寸要求在提示词中说明"竖版""16:9"等
风格不统一描述不够具体固定使用相同的风格关键词组合
细节失真描述过于复杂简化描述,分步生成
人物变形复杂姿态参考真实照片,简化人物动作

常见问题

点击标题展示答案

1. 画面出现“鬼手”或肢体扭曲
  • 问题表现:AI 画出的人手有六七根手指、双臂交叠异常,或者关节反折。
  • 解决方法
    • 添加反向提示词(Negative Prompt):在反向提示词框中加入 bad hands, extra fingers, deformed limbs, mutated limbs, missing fingers(残缺手、多余手指、畸形肢体)。
    • 局部重绘(Inpainting):使用 AI 工具的“局部重绘”功能,把画错的手部圈出来,让 AI 单独重新生成该区域。
    • 利用插件控制(针对 Stable Diffusion):引入 ControlNet 的 OpenPose(姿态控制)模型,强行固定骨骼架构,规范手部和肢体。
2. 生成的图片非常模糊、分辨率低
  • 问题表现:画风和构图不错,但放大一看全是马赛克或细节糊成一片。
  • 解决方法
    • 添加高清修饰词:在提示词中加入 8k resolution, highly detailed, sharp focus, masterpiece(8K分辨率、高细节、清晰聚焦、杰作)。
    • 使用高清修复(Hi-Res Fix):在文生图时直接勾选超分辨率放大。
    • 后期放大(Upscale):导出图片后,使用 Topaz Gigapixel AI、Upscaler 或剪映等工具进行 AI 无损放大。
3. AI “听不懂人话”,画面完全货不对板
  • 问题表现:输入了一大堆文字,结果 AI 只抓住了其中一两个词,或者彻底偏离了预期。
  • 解决方法
    • 优化词序结构:AI 遵循“越靠前权重越高”的原则。标准公式为:[核心主体] + [细节描述] + [环境背景] + [艺术风格/相机参数]
    • 使用权重符号
      • Stable Diffusion 中,可以用括号 (keyword:1.2) 来强调某个词。
      • Midjourney 中,可以使用 --no 来排除不想要的元素,或者使用 :: 来分配权重。
4. 画面元素过多,显得杂乱无章
  • 问题表现:想把“城堡、巨龙、少女、飞船、森林、魔法阵”全塞进去,结果画面挤成一团,没有焦点。
  • 解决方法
    • 学会做减法:一张好照片通常只有一个核心视觉焦点。先精简提示词,只留 1-2 个主体,其余用环境词一带而过。
    • 指定构图词:显式引导 AI 布局,例如加入 close-up(特写)、rule of thirds(三分法构图)、centered composition(中心构图)。

避坑指南

新手最忌讳写“小作文”式的提示词。AI 并不是人类,长篇大论的叙事只会让它抓不到重点,尽量多用短语和词组

5. 无法保持同一个角色/物体的连续性
  • 问题表现:想画一组连环画或绘本,但第一张图的主角长这样,第二张图就彻底换了张脸。
  • 解决方法
    • 固定种子(Seed):找到满意的图片后,复制它的 Seed 值,在生成下一张图时固定这个 Seed,只修改动作词。
    • 角色参考(Character Reference)
      • Midjourney 中使用 --cref 参数垫图。
      • 在其他工具中上传主角的照片作为“人脸底图”来保持一致性。
    • 微调模型:在 Stable Diffusion 中,可以通过训练或下载特定的 LoRA 模型来彻底锁死角色外貌。
6. 画风不稳定,一会儿写实一会儿动漫
  • 问题表现:想要赛博朋克风,AI 却给了一张水彩画;想要二次元,出来的却是真人 3D 感。
  • 解决方法
    • 选对大模型(Checkpoints):选对底模是关键。写实风就选 Realistic 类的模型,动漫风就选 Anime 类的模型,不要让二次元模型去强行画真人。
    • 明确指定渲染器或艺术家:加入 Unreal Engine 5 render(虚幻5渲染)、Studio Ghibli style(吉卜力风格)或具体的艺术家名字(如 by Shinkai Makoto 新海诚)。
7. 文字渲染变成“天书”
  • 问题表现:想让画面里的路牌写着 "STOP" 或者是特定中文,AI 却生成了一堆看不懂的怪异符号。
  • 解决方法
    • 使用最新的绘画模型:较新的模型(如 Midjourney v6、DALL-E 3、SD 3等)对文字的理解大大增强。
    • 使用双引号:在输入提示词时,用双引号将需要出现的文字框起来,例如:a neon sign that says "OPEN"
    • 后期流处理(最稳妥):让 AI 只生成无字背景,自己用 Photoshop、美图秀秀等工具手动打字加上去。
8. 陷入“版权”与“原创性”的迷茫
  • 问题表现:不知道生成的图片能不能商用,或者觉得自己只是在拼凑提示词,没有创作的成就感。
  • 解决方法
    • 查看平台协议:大部分主流 AI 工具(尤其是付费版本)生成的图片是允许商用的,但具体要看各平台的《服务协议》。
    • 摆正心态,人机协同:把 AI 当作你的超级画笔或灵感放大器。真正拉开作品差距的是你的创意、构图审美和后期精修能力(AI 绘画 + PS 二次创作才是目前的行业常态)。

💡 进阶建议

刚开始玩 AI 绘画,最快提高的方法是“抄作业”。多去 AI提示词库 或各大 AI 绘画社区看大神的优秀作品,复制他们的提示词和参数进行模仿修改,很快就能上手!