前言
2026 年 5 月,AI 繪圖圈丟了一顆重磅炸彈——Krea 團隊發布了他們第一款從零自建的基礎影像模型 Krea 2,並在短短一個月後推出了速度優化版 Krea 2 Turbo。
更令人興奮的是,隨著 ComfyUI 0.25.0 的發布,Krea 2 終於迎來了原生支援,搭配社群製作的 FP8 量化權重,讓一般消費者等級的顯卡(16GB–24GB VRAM)也能在本機流暢運行。
這篇文章將帶你完整認識 Krea 2 Turbo 的核心特色、技術架構、與其他主流模型的比較,以及如何在 ComfyUI 中部署運行。
Krea 2 Turbo 是什麼?
Krea 2 Turbo 是 Krea 2 系列中的「速度優先」變體,主打約 2 秒內生成高品質影像。它保留了 Krea 2 核心的創意控制能力(風格參考、Moodboard、LoRA),同時將生成速度提升了數倍。
簡單來說,如果你想要「快速試探創意方向、大量迭代」,Turbo 是你的首選;如果你需要「最終成品的極致細節與風格忠實度」,則應升級到 Krea 2 Medium 或 Large。
核心規格一覽
| 項目 | Krea 2 Turbo | Krea 2 Medium | Krea 2 Large |
|---|---|---|---|
| 生成速度 | ~2 秒(本地)/ ~4 秒(API) | ~15 秒 | ~15 秒+ |
| 推理步數 | 8 步 | 8 步 | 8 步 |
| CFG Scale | 1.0(推薦) | 1.0 | 1.0 |
| 支援風格參考 | ✅ 最多 4 張 | ✅ | ✅ |
| 支援 Moodboard | ✅ | ✅ | ✅ |
| 支援 LoRA | ✅ | ✅ | ✅ |
| 支援 Generative Sliders | ✅ | ✅ | ✅ |
| 原始權重大小 | 24.76 GB (BF16) | 較小 | 2 倍以上 Medium |
| FP8 量化後 | 12.01 GB | — | — |
| 推薦顯卡 | 16GB+ VRAM | 12GB+ VRAM | 24GB+ VRAM |
Krea 2 的核心特色
1. 「風格控制」而非「提示詞依賴」
這是 Krea 2 與 Midjourney、Stable Diffusion 等模型最大的差異點。
傳統 AI 繪圖模型高度依賴「提示詞工程」——你需要寫出精確到像素級的描述才能得到想要的結果。但 Krea 2 的設計哲學是:讓視覺參考說話。
- Style References(風格參考):上傳最多 4 張參考圖片,模型會自動提取視覺語言、色調、質感,套用到生成結果中。
- Moodboards(情緒版):建立圖片集合來定義更廣泛的審美方向,比單一參考圖更靈活。
- Generative Sliders(生成滑桿):提供 Intensity(風格化程度)、Complexity(構圖密度)、Movement(姿勢與鏡頭動態)三組滑桿,範圍 -100 到 100,讓你微調視覺輸出。
2. 擁抱「歧義性」,拒絕千篇一律
Krea 團隊在官方文件中提到一句很有趣的話:
“Great art pushes boundaries, and a great image generation model can’t be afraid to make mistakes. K2 thrives on ambiguity.”
翻譯過來就是:好藝術需要突破界線,而好的影像模型不怕犯錯。Krea 2 從簡單提示中會產生多樣化的高品質結果,而不是把同一個概念重複四遍。
這意味著當你輸入一個模糊的提示(例如「一個孤獨的旅人」),Krea 2 可能給你沙漠、雪山、太空站或雨夜街頭——每一張都品質在線,只是方向不同。這種「創造性的多樣性」在概念設計和靈感探索階段非常實用。
3. 避開「AI 感」的審美設計
Krea 2 特別針對避免「明顯的 AI 生成痕跡」做了優化。許多模型會不自覺地給所有輸出套上一層光滑、過度修飾的「AI 質感」,但 Krea 2 能忠實保留你想要的粗糙感、手繪感、膠片顆粒等風格,不會在最後一步把質感「修掉」。
4. 完整的創意生態系
Krea 不只是一個人像生成模型,它是一套整合型創意工具套件:
- 影像生成與編輯
- 影片生成
- 3D 資產生成
- LoRA 訓練
- 即時畫布(Real-time Canvas)
技術架構深度解析
模型架構
Krea 2 是一個 Text-to-Image Diffusion Model,採用以下核心組件:
- Transformer 主模型(DiT):負責影像生成的核心網路,Turbo 版本經過 distillation(知識蒸餾)和 post-training(微調)優化,將推理步數降至 8 步。
- Qwen3-VL 4B 文字編碼器:基於阿里巴巴的 Qwen 系列多模態語言模型,負責將自然語言提示轉換為模型可理解的向量表示。FP8 量化後的名稱是
qwen3vl_4b_fp8_scaled.safetensors。 - Qwen Image VAE:變分自編碼器,負責將潛在空間(latent space)的表示解碼為最終影像。
FP8 量化:讓消費級顯卡也能跑
原版 Krea 2 Turbo 的 BF16 權重大約 24.76 GB,需要 24GB 以上 VRAM 的顯卡。社群貢獻者 AlperKTS 製作了 FP8(float8_e4m3fn)權重-only 量化版本,將體積壓縮至 12.01 GB,讓 16GB VRAM 的顯卡也能流暢運行。
量化策略採用了選擇性量化(Selective weight-only quantization),而非全域量化:
- 僅對
ndim >= 2且大小> 1024的權重張量進行 FP8 量化 - 關鍵層(如
LastLayer.modulation.lin)保留 float32/bfloat16 精度 - 這樣做避免了全域量化常見的 NaN 錯誤和品質退化
推理參數建議
根據 ComfyUI 原生工作流的推薦設定:
值得注意的是,Krea 2 的 CFG Scale 推薦值為 1.0(幾乎無 CFG guidance),這與 Stable Diffusion / FLUX 常見的 4.0–7.0 截然不同。這是因為 Krea 2 的訓練方式讓它在低 CFG 下也能保持結構完整性,同時保留更多的創造性多樣性。
與其他主流 AI 繪圖模型比較
Krea 2 vs Midjourney
| 維度 | Krea 2 | Midjourney |
|---|---|---|
| 核心哲學 | 風格控制、靈活性 | 美學身份、一致性 |
| 工作流 | 即時迭代(~15 秒) | 隊列式(等待 + 4 張變體) |
| 風格控制 | 參考圖、Moodboard、LoRA | --sref 參數 |
| 輸出多樣性 | 高(擁抱歧義) | 中(傾向一致審美) |
| 生態系 | 圖+影片+3D+LoRA訓練 | 僅影像生成 |
| 價格 | 免費層 + $9/月起 | $10–$120/月 |
| 本地部署 | ✅ ComfyUI 原生支援 | ❌ 僅 API |
簡單來說:Midjourney 適合想要「開箱即用、高完成度」的用戶;Krea 2 適合需要「風格控制、迭代速度、本地部署」的專業創作者。
Krea 2 vs FLUX.2
- FLUX.2 採用 Rectified Flow Transformer 架構,在純影像品質(特別是寫實感)上表現優異,在 Artificial Analysis 的 Text-to-Image 排行榜上名列前茅。
- Krea 2 則在「風格忠實度」上更勝一籌。在獨立的風格忠實度基準測試中,Krea 2 Large 得分僅落後 GPT Image 2 約 0.14 點。
- ComfyUI 原生支援讓 Krea 2 在本機部署上比 FLUX.2 更輕量(FP8 僅 12GB)。
Krea 2 Turbo vs 雲端 API 方案
如果你不想在本機部署,Krea 提供 API 方案:
- Runware 等平台提供
krea:krea@2-turbo的 API 接入 - 支援批量生成(最多 20 張/請求)、Webhook 回傳、雲端儲存直接上傳
- 對於需要整合到自動化流程的開發者來說非常友善
ComfyUI 原生部署完整指南
前置條件
- ComfyUI 版本:0.25.0 或更高(原生支援 Krea 2)
- 顯卡:NVIDIA GPU,16GB+ VRAM(FP8 量化版)
- Python:3.10+
步驟 1:下載 FP8 量化權重
前往 Hugging Face 上的 AlperKTS/Krea2_FP8 倉庫,下載以下三個檔案:
krea2_turbo_fp8.safetensors→ 放入ComfyUI/models/unet/qwen3vl_4b_fp8_scaled.safetensors→ 放入ComfyUI/models/text_encoders/qwen_image_vae.safetensors→ 放入ComfyUI/models/vae/
步驟 2:載入工作流
ComfyUI 0.25.0 已內建 Krea 2 支援,無需額外安裝自訂節點。你可以:
- 從 ComfyUI 的 Node Library 搜尋 “Krea 2 Image” 節點
- 或直接拖入官方提供的 Krea 2 Simple Workflow JSON 工作流檔案
步驟 3:調整參數並生成
在工作流中設定:
- Steps: 8
- CFG: 1.0
- Sampler: er_sde
- Scheduler: simple
- Resolution: 1280×720 或 1024×1024
點擊 Generate 即可在約 2–4 秒內看到結果。
進階技巧:使用風格參考與 Moodboard
- 風格參考:在 Style Reference 欄位上傳 1–4 張參考圖片,模型會自動提取風格特徵。
- Moodboard:在 Krea 平台上建立 Moodboard,取得 moodboard_id 後填入工作流。
- Generative Sliders:使用 Intensity、Complexity、Movement 滑桿微調輸出,範圍 -100 到 100。
推薦工作流:Turbo → Medium/Large 升級法
最佳實踐是「先用 Turbo 快速探索方向,再用 Medium/Large 出成品」:
- 用 Krea 2 Turbo 快速生成 10–20 張概念圖(每張 ~2 秒)
- 用 Generative Sliders 和風格參考鎖定視覺方向
- 確認方向後,切換到 Krea 2 Medium 或 Large 生成最終成品
這種「先廣撒網、再精準打魚」的工作流,能最大化創意效率。
適用場景與最佳實踐
最適合的場景
- 快速概念設計:廣告企劃、品牌探索、產品視覺預覽
- 遊戲與娛樂概念藝術:快速生成多個角色、場景、道具概念
- 編輯與排版設計:需要快速迭代視覺風格的設計工作
- 提示詞測試:在投入大量時間到高精度模型前,先用 Turbo 驗證提示詞方向
- Moodboard 探索:建立並測試視覺方向集合
不適合的場景
- 最終寫實照片級輸出:Turbo 在細節和質感上不如 Medium/Large
- 極高風格忠實度需求:需要精確複製特定藝術家風格時,建議用 Medium/Large
- 需要極高解析度的印刷級輸出:Turbo 最高支援 1K 解析度
授權與商業使用
Krea 2 採用 Krea 2 Community License:
- 非商業用途:自由使用
- 商業用途:需另行向 krea.ai 洽詢商業授權
- 部署要求:開發者必須在下游部署中實作內容過濾或審查機制
- 智慧財產權:Krea 不主張用戶生成內容的版權,使用者自行負責
FP8 量化版本(AlperKTS 製作)遵循相同的原始授權條款。
總結
Krea 2 Turbo 代表了 AI 影像生成的一個重要趨勢:從「提示詞驅動」轉向「視覺控制驅動」,同時在速度與創意控制之間取得出色平衡。
ComfyUI 原生支援 + FP8 量化讓它成為目前最易於本地部署的高端影像模型之一。對於需要快速迭代、風格靈活、且不想依賴雲端 API 的創作者來說,Krea 2 Turbo 是目前最值得關注的選項之一。
而隨著 ComfyUI 生態系的不斷擴展,未來我們預期會看到更多基於 Krea 2 的自訂節點、LoRA 模型和進階工作流出現。
參考來源:Krea 官方部落格 、Krea 文件 、Hugging Face 模型頁面 、AlperKTS FP8 量化倉庫 、SGLang 技術文件 、ComfyUI 官方公告