图像增强

图像增强技术可以提升图像质量、分辨率和细节表现，是AI图像处理的重要应用。从超分辨率放大到细节增强，从人脸修复到老照片复原，掌握这些技术让你的作品更加完美。

预计阅读时间：45分钟·难度：中级·更新：2024年12月

图像增强概述

AI图像增强是指利用深度学习技术提升图像质量的过程，主要包括以下几个方向：

增强类型

📐 超分辨率

提升图像分辨率，放大同时保持清晰

🔍 细节增强

增加图像细节，提升质感表现

👤 人脸修复

修复模糊、变形的面部

🖼️ 图像修复

去除瑕疵、恢复损坏区域

为什么需要图像增强？

AI生成的图像通常有以下限制：

分辨率限制：SD生成分辨率通常为512-1024像素，需要放大才能用于打印或高清显示
细节不足：AI生成可能导致细节模糊或缺失
人脸问题：小尺寸生成的人脸可能模糊或变形
噪点和瑕疵：生成图像可能存在伪影

超分辨率放大

超分辨率是图像增强的核心技术，可以在放大图像的同时保持甚至增加细节。

ESRGAN系列

ESRGAN（Enhanced Super-Resolution GAN）是最流行的超分辨率模型。

ESRGAN

原始版本，通用放大模型。

• 4倍放大能力
• 适合通用场景
• 可能产生过度锐化

Real-ESRGAN

改进版本，专门针对真实照片优化。

• 更自然的放大效果
• 更好的去噪能力
• 支持动画版本（适合动漫）
• 推荐默认使用

4x-UltraSharp

针对清晰度优化的模型。

• 更锐利的边缘
• 适合照片类图像
• 可能不适合艺术作品

SwinIR

SwinIR是基于Swin Transformer的图像修复模型。

• 架构优势：Transformer架构更适合处理全局信息
• 多种任务：支持去噪、去模糊、超分辨率
• 高质量输出：在细节保持上表现优异
• 计算量大：比ESRGAN慢，但效果更好

SD专用放大方法

Stable Diffusion有专用的放大脚本和扩展。

Ultimate SD Upscale

最受欢迎的SD放大扩展。

• 分块放大：将图像分成小块分别处理
• 支持超大分辨率（如8K）
• 可以添加新细节
• 配合ControlNet Tile效果更好

MultiDiffusion

另一种分块放大方法。

• 更平滑的拼接效果
• 支持全景图生成
• 计算效率更高

放大模型选择建议

图像类型	推荐模型
写实照片	Real-ESRGAN、4x-UltraSharp
动漫/插画	Real-ESRGAN Anime、R-ESRGAN 4x+
艺术作品	SwinIR、ESRGAN
需要添加细节	Ultimate SD Upscale + ControlNet Tile

细节增强

除了放大，还需要增加图像的细节和质感。

Hires.fix（高清修复）

SD WebUI内置的放大功能，在生成后自动进行放大处理。

工作原理

1. 以低分辨率（如512×512）生成初始图像
2. 使用选定的放大模型放大到目标分辨率
3. 对放大后的图像进行少量去噪重绘
4. 输出高分辨率最终图像

参数设置建议

Upscale by

• 1.5-2.0：常规放大
• 2.0-4.0：大尺寸放大

Denoising strength

• 0.3-0.5：保留原图为主
• 0.5-0.7：平衡细节和变化
• 0.7+：增加更多新细节

Tile ControlNet细节增强

使用Tile ControlNet可以在放大时添加更丰富的细节。

使用方法

1. 加载Tile ControlNet模型
2. 上传需要增强的图像
3. 设置放大比例
4. 提示词描述期望的细节
5. ControlNet会保持整体结构同时添加细节

💡 Tile ControlNet技巧

• 使用"tiled diffuse"扩展配合效果更好
• 适当提高denoising strength可以添加更多细节
• 提示词中添加材质描述增强效果
• 适合需要大幅放大且保持细节的场景

多次迭代放大

对于超大分辨率，建议分多次放大：

示例流程：

512×512 → 1024×1024 → 2048×2048 → 4096×4096

每次放大2倍，共3次，最终得到8K图像

图像修复

人脸修复

AI生成的人脸在小尺寸时可能模糊或变形，人脸修复模型可以改善这个问题。

CodeFormer

当前效果最好的人脸修复模型之一。

• 强大的面部重建能力
• 支持调节保真度（fidelity）
• 可作为SD扩展使用
• 支持批量处理

GFPGAN

腾讯开源的人脸修复模型。

• 效果稳定可靠
• 计算速度较快
• 可能产生"塑料脸"效果

RestoreFormer

基于Transformer的人脸修复模型，效果介于CodeFormer和GFPGAN之间。

人脸修复使用建议

• 时机：在放大后进行人脸修复效果更好
• 保真度：CodeFormer的fidelity参数越高越保留原特征，但修复效果减弱
• 检测：确保人脸足够清晰可以被检测到
• 多次处理：严重模糊可能需要多次修复

老照片修复

使用AI技术恢复老照片的质量。

老照片修复流程

1. 扫描数字化：高质量扫描老照片
2. 去除瑕疵：使用Inpainting去除划痕、斑点
3. 上色：使用上色模型（可选）
4. 放大：使用超分辨率提升分辨率
5. 人脸修复：修复模糊的面部

去噪去模糊

• 去噪：使用SwinIR或SCUNet去除图像噪点
• 去模糊：使用去模糊模型恢复模糊图像
• 去压缩伪影：去除JPEG压缩产生的块状伪影

常用工具

桌面软件

工具	类型	特点	价格
Topaz Gigapixel	专业软件	效果最好，支持批量	$99.99
Upscayl	开源软件	免费，跨平台，易用	免费
Magnific AI	在线服务	增强细节能力最强	$39/月起
VanceAI	在线服务	多种AI工具	订阅制

SD WebUI扩展

• Ultimate SD Upscale：分块放大，支持超大分辨率
• CodeFormer：人脸修复扩展
• ReActor：人脸替换+修复一体化
• Multidiffusion-upscaler：高效分块放大
• Tile ControlNet：细节增强

在线工具

• Replicate：API调用各种放大模型
• Magnific AI：最强细节增强
• Clipdrop：多种图像处理工具
• Let's Enhance：在线放大服务

工作流程

一个完整的图像增强工作流程：

💡 最佳实践

• 先放大后人脸修复，可以获得更好的效果
• 分多次小比例放大比一次大比例放大效果好
• 注意避免过度锐化，保持自然感
• 不同类型的图像需要不同的模型和参数
• 保存中间结果，方便对比和回退

← 图像修复

风格迁移 →