
模型简介与核心优势
FLUX.2 [klein] 是 Black Forest Labs (BFL) 开源的最新系列模型,主打“快、准、稳”核心特性,重新定义了 AIGC 图像生成与编辑的交互体验。
核心亮点
- 亚秒级交互:RTX 5090 硬件环境下生成单图仅需 1.2 秒,低速显卡也能保障流畅体验。
- 功能一体化:统一文生图、单参考编辑、多参考编辑三大核心功能,无需额外插件。
技术架构
- 文本编码器:采用 Qwen3 系列模型,语义理解能力更强,支持复杂指令输入。
- 原生特性:内置 Multi-reference 多参考机制,无需依赖 ControlNet 等扩展工具。
模型版本选择指南
FLUX.2 [klein] 系列包含 4 个版本,需根据硬件配置、使用场景及商用需求选择,以下为详细对比:
| 模型版本 | [klein] 4B (蒸馏版) | [klein] 4B Base | [klein] 9B (蒸馏版) | [klein] 9B Base |
|---|---|---|---|---|
| 适用场景 | 商业应用、快速出图 | 炼丹/LoRA 微调 | 极致画质、个人娱乐 | 科研、复杂语义理解 |
| 推理步数 | 4 步 (极速) | 50 步 | 4 步 (极速) | 50 步 |
| 显存需求 | ~8.4 GB (最小) | ~9.2 GB | ~19.6 GB | ~21.7 GB |
| 商用许可 | 可商用 (Apache 2.0) | 可商用 (Apache 2.0) | 非商业许可 | 非商业许可 |
| 推荐人群 | 设计师、UI/UX、普通用户 | 炼丹师、模型微调者 | 画质党、高端显卡用户 | 算法研究员 |
8G 显存用户首选:[klein] 4B 蒸馏版,开启 fp8 权重后可稳定运行,兼顾速度与效果。
安装指南 (ComfyUI)
第一步:环境准备
- 更新 ComfyUI:进入 ComfyUI 根目录,通过 git pull 命令更新至最新版本,确保兼容 FLUX.2 模型。
- 秋叶整合包用户专属提示:由于整合包开发版更新停滞(截至 1 月 6 日),需按以下步骤操作: 1. 打开 ComfyUI 界面,进入顶部「设置」选项 2. 找到「Git 配置」,关闭「国内镜像加速」开关 3. 刷新更新列表,重新执行更新操作
第二步:模型下载与放置
下载对应模型文件后,按以下路径放置至 ComfyUI 目录,确保文件格式正确:
主模型 (Diffusion Model)
格式:.safetensors 路径:ComfyUI/models/diffusion_models/
文本编码器 (CLIP/Text Encoder)
说明:Klein 适配 Qwen3 系列编码器,需单独下载对应文件 路径:ComfyUI/models/clip/
VAE
说明:使用 FLUX 标准 VAE,无需额外适配 路径:ComfyUI/models/vae/
关键节点配置 (Settings)
在 ComfyUI 中加载模型后,需按以下参数配置,确保最佳性能与生成效果,重点优化 8G 显存适配:
1. 模型加载 (Load Diffusion Model)
Weight Dtype (权重类型):建议设置为 fp8_e4m3fn
作用:显著降低显存压力,8G 显存用户必选,可减少约 2GB 显存占用,避免溢出报错。
2. 采样器设置 (KSampler)
根据模型版本(蒸馏版/基础版)差异化设置,具体参数如下:
| 参数 | 蒸馏版 (Distilled) | 基础版 (Base) |
|---|---|---|
| Steps (步数) | 4 步(固定,无需调整) | 30 - 50 步(平衡画质与速度) |
| CFG (引导缩放) | 1.0(蒸馏版专用,避免过度引导) | 3.5 - 5.0(数值越高指令相关性越强) |
| Sampler (采样器) | 建议使用 euler(速度最快) | 建议使用 euler(兼容最佳) |
核心工作流用法
FLUX.2 [klein] 支持三大核心场景,以下为详细操作步骤及优化技巧,适配不同使用需求:
场景 A:极速文生图 (Text-to-Image)
- 适用模型:4B 蒸馏版(推荐,8G 显存稳定运行)
- 提示词技巧:支持自然语言描述,重点补充光影(如“暖光照射”)、材质(如“磨砂质感”)、氛围(如“静谧氛围感”)细节,提升生成精度。
- 速度参考:8G 显存设备生成单图约 26 秒,RTX 4090 等高端显卡可实现 3 秒内出图,RTX 5090 达亚秒级。
场景 B:单图语义编辑 (Instruct Editing)
- 核心功能:无需绘制蒙版(Mask),直接通过文字指令修改画面指定区域,操作门槛低。
- 操作步骤:上传原图 → 在指令框输入编辑需求(如“将背景修改成复古咖啡店,保留主体人物”)→ 点击生成。
- 效果特点:蒸馏版在编辑场景中表现“快且稳”,修改后画面融合度高,不易出现边缘模糊、色彩断层问题。
场景 C:多参考图编辑 (Multi-reference)
- 核心功能:原生支持风格迁移、特征融合,无需依赖 ControlNet 或 IP-Adapter 插件,减少环境配置复杂度。
- 操作步骤:同时上传多张参考图(建议 2-3 张,避免特征冲突)→ 输入融合指令 → 生成。
- 实操示例:参考图1(人物肖像)+ 参考图2(汉服风格),提示词:“图1人物换上图2的汉服穿搭,背景替换为洱海边日落场景,保持人物神态不变”。
- 核心优势:特征提取精准,融合效果自然,相比传统插件方案,生成速度提升 40% 以上。
FLUX.2 [klein] GGUF安装与使用手册
7. 进阶方案:极速生成 (GGUF 量化版)
适用场景:显存 ≤ 8GB(如 RTX 4060Ti/3060)、追求极致速度(约 10 秒出图)、需要本地运行流畅的用户。
第一步:下载 GGUF 专用模型
此方案通过量化模型降低显存占用。请下载以下文件:
- 主模型 (Diffusion Model)
- 选择原则:推荐下载 4B 版本的 Q4_K_M (平衡速度与质量的中间值)。
- 文件名示例:
flux-2-klein-4B-Q4_K_M.gguf(注:原文链接指向4B库,但文字误写为9B,建议优先选择4B以保证速度)。 - 放置路径:
ComfyUI/models/diffusion_models/ - 下载源参考:HuggingFace / unsloth (FLUX.2-klein-4B-GGUF)
- 文本编码器 (Text Encoder / CLIP)
- 模型版本:需匹配 Qwen3-4B 的 GGUF 版本。
- 推荐文件:
Qwen3-4B-Q5_K_M.gguf(Q5 量化精度稍高,适合文本理解)。 - 放置路径:
ComfyUI/models/text_encoder/(注意:此前标准版是放clip文件夹,GGUF 方案建议放text_encoder或根据节点加载路径调整)。
第二步:安装 GGUF 插件
要加载上述模型,必须安装 GGUF 节点:
- 插件名称:ComfyUI-GGUF
- 安装方式:
- 方法 A:使用 ComfyUI Manager 搜索 "GGUF" 安装。
- 方法 B:下载源码放入
ComfyUI/custom_nodes/。 - Github参考:
calcuis/gguf
第三步:极速工作流搭建 (GGUF Workflow)
与标准版不同,GGUF 工作流在模型加载区有变化:
- 加载节点 (Loader):
- 使用
Unet Loader (GGUF)节点加载主模型。 - 使用
Clip Loader (GGUF)节点加载 Qwen3-4B GGUF 模型。 - VAE:继续使用原版 FLUX 标准 VAE 即可。
- 使用
- 性能参考:
- 硬件:RTX 4060Ti (8G)
- 文生图速度:约 9.69秒 - 10.45秒。
- 效果:完美支持文生图、多图编辑,且由于速度快,非常适合配合
touch_edit(指哪改哪) 和3D Pose(姿态迁移) 节点进行高频交互。
8. 总结:我该选哪种方案?
| 方案 | 标准版 (Standard) | 极速版 (GGUF Scheme) |
|---|---|---|
| 文件格式 | .safetensors (fp8/bf16) | .gguf (Q4/Q5 Quantized) |
| 核心优势 | 画质无损,官方原味体验 | 速度极致,显存占用极低 |
| 显存要求 | 建议 10GB+ (虽然fp8能跑8G,但较勉强) | 完美适配 6GB - 8GB 显卡 |
| 单图耗时 | 约 26 秒 (4060Ti) | 约 10 秒 (4060Ti) |
| 推荐人群 | 设计师、追求细节的画质党 | 普通玩家、笔记本用户、即时交互需求者 |
主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网

评论(0)