图像增强

图像增强技术可以提升图像质量、分辨率和细节表现,是AI图像处理的重要应用。从超分辨率放大到细节增强,从人脸修复到老照片复原,掌握这些技术让你的作品更加完美。

预计阅读时间:45分钟·难度:中级·更新:2024年12月

图像增强概述

AI图像增强是指利用深度学习技术提升图像质量的过程,主要包括以下几个方向:

增强类型

📐 超分辨率

提升图像分辨率,放大同时保持清晰

🔍 细节增强

增加图像细节,提升质感表现

👤 人脸修复

修复模糊、变形的面部

🖼️ 图像修复

去除瑕疵、恢复损坏区域

为什么需要图像增强?

AI生成的图像通常有以下限制:

  • 分辨率限制:SD生成分辨率通常为512-1024像素,需要放大才能用于打印或高清显示
  • 细节不足:AI生成可能导致细节模糊或缺失
  • 人脸问题:小尺寸生成的人脸可能模糊或变形
  • 噪点和瑕疵:生成图像可能存在伪影

超分辨率放大

超分辨率是图像增强的核心技术,可以在放大图像的同时保持甚至增加细节。

ESRGAN系列

ESRGAN(Enhanced Super-Resolution GAN)是最流行的超分辨率模型。

ESRGAN

原始版本,通用放大模型。

  • • 4倍放大能力
  • • 适合通用场景
  • • 可能产生过度锐化
Real-ESRGAN

改进版本,专门针对真实照片优化。

  • • 更自然的放大效果
  • • 更好的去噪能力
  • • 支持动画版本(适合动漫)
  • • 推荐默认使用
4x-UltraSharp

针对清晰度优化的模型。

  • • 更锐利的边缘
  • • 适合照片类图像
  • • 可能不适合艺术作品

SwinIR

SwinIR是基于Swin Transformer的图像修复模型。

  • 架构优势:Transformer架构更适合处理全局信息
  • 多种任务:支持去噪、去模糊、超分辨率
  • 高质量输出:在细节保持上表现优异
  • 计算量大:比ESRGAN慢,但效果更好

SD专用放大方法

Stable Diffusion有专用的放大脚本和扩展。

Ultimate SD Upscale

最受欢迎的SD放大扩展。

  • • 分块放大:将图像分成小块分别处理
  • • 支持超大分辨率(如8K)
  • • 可以添加新细节
  • • 配合ControlNet Tile效果更好
MultiDiffusion

另一种分块放大方法。

  • • 更平滑的拼接效果
  • • 支持全景图生成
  • • 计算效率更高
放大模型选择建议
图像类型推荐模型
写实照片Real-ESRGAN、4x-UltraSharp
动漫/插画Real-ESRGAN Anime、R-ESRGAN 4x+
艺术作品SwinIR、ESRGAN
需要添加细节Ultimate SD Upscale + ControlNet Tile

细节增强

除了放大,还需要增加图像的细节和质感。

Hires.fix(高清修复)

SD WebUI内置的放大功能,在生成后自动进行放大处理。

工作原理
  1. 1. 以低分辨率(如512×512)生成初始图像
  2. 2. 使用选定的放大模型放大到目标分辨率
  3. 3. 对放大后的图像进行少量去噪重绘
  4. 4. 输出高分辨率最终图像
参数设置建议

Upscale by

  • • 1.5-2.0:常规放大
  • • 2.0-4.0:大尺寸放大

Denoising strength

  • • 0.3-0.5:保留原图为主
  • • 0.5-0.7:平衡细节和变化
  • • 0.7+:增加更多新细节

Tile ControlNet细节增强

使用Tile ControlNet可以在放大时添加更丰富的细节。

使用方法
  1. 1. 加载Tile ControlNet模型
  2. 2. 上传需要增强的图像
  3. 3. 设置放大比例
  4. 4. 提示词描述期望的细节
  5. 5. ControlNet会保持整体结构同时添加细节

💡 Tile ControlNet技巧

  • • 使用"tiled diffuse"扩展配合效果更好
  • • 适当提高denoising strength可以添加更多细节
  • • 提示词中添加材质描述增强效果
  • • 适合需要大幅放大且保持细节的场景

多次迭代放大

对于超大分辨率,建议分多次放大:

示例流程:

512×512 → 1024×1024 → 2048×2048 → 4096×4096

每次放大2倍,共3次,最终得到8K图像

图像修复

人脸修复

AI生成的人脸在小尺寸时可能模糊或变形,人脸修复模型可以改善这个问题。

CodeFormer

当前效果最好的人脸修复模型之一。

  • • 强大的面部重建能力
  • • 支持调节保真度(fidelity)
  • • 可作为SD扩展使用
  • • 支持批量处理
GFPGAN

腾讯开源的人脸修复模型。

  • • 效果稳定可靠
  • • 计算速度较快
  • • 可能产生"塑料脸"效果
RestoreFormer

基于Transformer的人脸修复模型,效果介于CodeFormer和GFPGAN之间。

人脸修复使用建议
  • 时机:在放大后进行人脸修复效果更好
  • 保真度:CodeFormer的fidelity参数越高越保留原特征,但修复效果减弱
  • 检测:确保人脸足够清晰可以被检测到
  • 多次处理:严重模糊可能需要多次修复

老照片修复

使用AI技术恢复老照片的质量。

老照片修复流程
  1. 1. 扫描数字化:高质量扫描老照片
  2. 2. 去除瑕疵:使用Inpainting去除划痕、斑点
  3. 3. 上色:使用上色模型(可选)
  4. 4. 放大:使用超分辨率提升分辨率
  5. 5. 人脸修复:修复模糊的面部

去噪去模糊

  • 去噪:使用SwinIR或SCUNet去除图像噪点
  • 去模糊:使用去模糊模型恢复模糊图像
  • 去压缩伪影:去除JPEG压缩产生的块状伪影

常用工具

桌面软件

工具类型特点价格
Topaz Gigapixel专业软件效果最好,支持批量$99.99
Upscayl开源软件免费,跨平台,易用免费
Magnific AI在线服务增强细节能力最强$39/月起
VanceAI在线服务多种AI工具订阅制

SD WebUI扩展

  • Ultimate SD Upscale:分块放大,支持超大分辨率
  • CodeFormer:人脸修复扩展
  • ReActor:人脸替换+修复一体化
  • Multidiffusion-upscaler:高效分块放大
  • Tile ControlNet:细节增强

在线工具

  • Replicate:API调用各种放大模型
  • Magnific AI:最强细节增强
  • Clipdrop:多种图像处理工具
  • Let's Enhance:在线放大服务

工作流程

一个完整的图像增强工作流程:

推荐工作流
1

生成/获取原始图像

使用SD生成或导入需要增强的图像

2

基础放大

使用Hires.fix或Real-ESRGAN放大到中等分辨率

3

人脸修复(如需要)

使用CodeFormer修复模糊的人脸

4

细节增强

使用Tile ControlNet或Ultimate SD Upscale添加细节

5

最终处理

在Photoshop中进行最终调整和输出

💡 最佳实践

  • • 先放大后人脸修复,可以获得更好的效果
  • • 分多次小比例放大比一次大比例放大效果好
  • • 注意避免过度锐化,保持自然感
  • • 不同类型的图像需要不同的模型和参数
  • • 保存中间结果,方便对比和回退
----