1. Stable Diffusion là gì?
Stable Diffusion là mô hình AI mã nguồn mở, cho phép tạo hình ảnh chất lượng cao từ mô tả văn bản. Được phát triển bởi Stability AI và cộng đồng mã nguồn mở, SD nhanh chóng trở thành tiêu chuẩn vàng cho Text-to-Image generation.
Ưu điểm:
- Miễn phí, chạy local
- Mã nguồn mở
- Hỗ trợ nhiều phiên bản và kiến trúc

2. Tổng hợp các phiên bản Stable Diffusion chính
Phiên bản | Yêu cầu VRAM (INT8/FP16) | Độ chi tiết ảnh | Tốc độ | Mục tiêu chính |
---|---|---|---|---|
SD 1.4 / 1.5 | ~4GB / 6GB | Tốt | Nhanh | Ảnh anime, thực tế |
SD 2.1 | ~6GB / 8GB | Rõ hơn, nét hơn | TB | Ảnh chiều sâu, style |
SDXL 1.0 | ~11–13GB | Cao nhất | TB | Ảnh chi tiết, nghệ thuật |
SDXL Turbo | ~8–10GB | Nhanh hơn SDXL | Rất nhanh | Tương tác real-time |
SD 3 (sắp ra) | 12–16GB+ (dự đoán) | Nâng cấp toàn diện | TBD | Cạnh tranh DALL·E 3 |
3. So sánh đặc điểm chi tiết
Stable Diffusion 1.5
- Base phổ biến nhất (ckpt 4GB, .safetensors)
- Tạo ảnh 512×512 rất tốt
- Có nhiều LoRA, checkpoint cộng đồng
- Dễ dàng chạy trên 4–6GB GPU
Stable Diffusion 2.1
- Cải thiện depth, màu sắc
- Hỗ trợ resolution cao hơn (768×768)
- Mô tả chi tiết nội dung tốt hơn
Stable Diffusion XL (SDXL)
- Kích thước model lớn (~6.6B tham số)
- Tạo ảnh 1024×1024 chi tiết cực cao
- Hỗ trợ 2-stage pipeline (base + refiner)
- Cần GPU >= 12GB để chạy mượt
SDXL Turbo
- Tạo ảnh cực nhanh (vài steps)
- Hướng đến tương tác real-time
- Chất lượng kém hơn SDXL một chút nhưng tốc độ bù lại
4. Hệ sinh thái mở rộng
- ControlNet: kiểm soát bố cục, depth, pose…
- LoRA: fine-tune nhẹ nhàng theo style/character
- DreamBooth: huấn luyện model tạo ảnh mang tính cá nhân hóa
- WebUI phổ biến:
- AUTOMATIC1111
- ComfyUI
- InvokeAI
5. Gợi ý model theo VRAM
VRAM GPU | Mô hình đề xuất |
---|---|
4–6GB | SD 1.5, LoRA, anime models |
8–12GB | SD 2.1, SDXL Turbo, basic SDXL |
12–24GB | SDXL + Refiner, ComfyUI workflows, multi-LoRA |
6. Lời kết
Stable Diffusion đang là nền tảng vững chắc cho cộng đồng AI tạo ảnh. Từ phiên bản 1.5 nhẹ nhàng đến SDXL tinh vi, bạn có thể chọn model phù hợp với cấu hình và nhu cầu sáng tạo của mình.
Nếu bạn có GPU từ 4GB trở lên, bạn đã có thể bước vào thế giới sáng tạo không giới hạn với SD!