前言

2026 年 5 月,AI 繪圖圈丟了一顆重磅炸彈——Krea 團隊發布了他們第一款從零自建的基礎影像模型 Krea 2,並在短短一個月後推出了速度優化版 Krea 2 Turbo

更令人興奮的是,隨著 ComfyUI 0.25.0 的發布,Krea 2 終於迎來了原生支援,搭配社群製作的 FP8 量化權重,讓一般消費者等級的顯卡(16GB–24GB VRAM)也能在本機流暢運行。

這篇文章將帶你完整認識 Krea 2 Turbo 的核心特色、技術架構、與其他主流模型的比較,以及如何在 ComfyUI 中部署運行。

- 廣告 -

Krea 2 Turbo 是什麼?

Krea 2 Turbo 是 Krea 2 系列中的「速度優先」變體,主打約 2 秒內生成高品質影像。它保留了 Krea 2 核心的創意控制能力(風格參考、Moodboard、LoRA),同時將生成速度提升了數倍。

簡單來說,如果你想要「快速試探創意方向、大量迭代」,Turbo 是你的首選;如果你需要「最終成品的極致細節與風格忠實度」,則應升級到 Krea 2 Medium 或 Large。

核心規格一覽

項目Krea 2 TurboKrea 2 MediumKrea 2 Large
生成速度~2 秒(本地)/ ~4 秒(API)~15 秒~15 秒+
推理步數8 步8 步8 步
CFG Scale1.0(推薦)1.01.0
支援風格參考✅ 最多 4 張
支援 Moodboard
支援 LoRA
支援 Generative Sliders
原始權重大小24.76 GB (BF16)較小2 倍以上 Medium
FP8 量化後12.01 GB
推薦顯卡16GB+ VRAM12GB+ VRAM24GB+ VRAM

Krea 2 的核心特色

1. 「風格控制」而非「提示詞依賴」

這是 Krea 2 與 Midjourney、Stable Diffusion 等模型最大的差異點。

傳統 AI 繪圖模型高度依賴「提示詞工程」——你需要寫出精確到像素級的描述才能得到想要的結果。但 Krea 2 的設計哲學是:讓視覺參考說話

  • Style References(風格參考):上傳最多 4 張參考圖片,模型會自動提取視覺語言、色調、質感,套用到生成結果中。
  • Moodboards(情緒版):建立圖片集合來定義更廣泛的審美方向,比單一參考圖更靈活。
  • Generative Sliders(生成滑桿):提供 Intensity(風格化程度)、Complexity(構圖密度)、Movement(姿勢與鏡頭動態)三組滑桿,範圍 -100 到 100,讓你微調視覺輸出。

2. 擁抱「歧義性」,拒絕千篇一律

Krea 團隊在官方文件中提到一句很有趣的話:

“Great art pushes boundaries, and a great image generation model can’t be afraid to make mistakes. K2 thrives on ambiguity.”

翻譯過來就是:好藝術需要突破界線,而好的影像模型不怕犯錯。Krea 2 從簡單提示中會產生多樣化的高品質結果,而不是把同一個概念重複四遍。

這意味著當你輸入一個模糊的提示(例如「一個孤獨的旅人」),Krea 2 可能給你沙漠、雪山、太空站或雨夜街頭——每一張都品質在線,只是方向不同。這種「創造性的多樣性」在概念設計和靈感探索階段非常實用。

3. 避開「AI 感」的審美設計

Krea 2 特別針對避免「明顯的 AI 生成痕跡」做了優化。許多模型會不自覺地給所有輸出套上一層光滑、過度修飾的「AI 質感」,但 Krea 2 能忠實保留你想要的粗糙感、手繪感、膠片顆粒等風格,不會在最後一步把質感「修掉」。

4. 完整的創意生態系

Krea 不只是一個人像生成模型,它是一套整合型創意工具套件

  • 影像生成與編輯
  • 影片生成
  • 3D 資產生成
  • LoRA 訓練
  • 即時畫布(Real-time Canvas)

技術架構深度解析

模型架構

Krea 2 是一個 Text-to-Image Diffusion Model,採用以下核心組件:

  1. Transformer 主模型(DiT):負責影像生成的核心網路,Turbo 版本經過 distillation(知識蒸餾)和 post-training(微調)優化,將推理步數降至 8 步。
  2. Qwen3-VL 4B 文字編碼器:基於阿里巴巴的 Qwen 系列多模態語言模型,負責將自然語言提示轉換為模型可理解的向量表示。FP8 量化後的名稱是 qwen3vl_4b_fp8_scaled.safetensors
  3. Qwen Image VAE:變分自編碼器,負責將潛在空間(latent space)的表示解碼為最終影像。

FP8 量化:讓消費級顯卡也能跑

原版 Krea 2 Turbo 的 BF16 權重大約 24.76 GB,需要 24GB 以上 VRAM 的顯卡。社群貢獻者 AlperKTS 製作了 FP8(float8_e4m3fn)權重-only 量化版本,將體積壓縮至 12.01 GB,讓 16GB VRAM 的顯卡也能流暢運行。

量化策略採用了選擇性量化(Selective weight-only quantization),而非全域量化:

  • 僅對 ndim >= 2 且大小 > 1024 的權重張量進行 FP8 量化
  • 關鍵層(如 LastLayer.modulation.lin)保留 float32/bfloat16 精度
  • 這樣做避免了全域量化常見的 NaN 錯誤和品質退化

推理參數建議

根據 ComfyUI 原生工作流的推薦設定:

SCSSRtFaceeGmhsppeosSldl:ceuuarlt8l:eiero:e:nr:1_s.si10dm2ep8l0e×720(1024×1024)

值得注意的是,Krea 2 的 CFG Scale 推薦值為 1.0(幾乎無 CFG guidance),這與 Stable Diffusion / FLUX 常見的 4.0–7.0 截然不同。這是因為 Krea 2 的訓練方式讓它在低 CFG 下也能保持結構完整性,同時保留更多的創造性多樣性。

- 廣告 -

與其他主流 AI 繪圖模型比較

Krea 2 vs Midjourney

維度Krea 2Midjourney
核心哲學風格控制、靈活性美學身份、一致性
工作流即時迭代(~15 秒)隊列式(等待 + 4 張變體)
風格控制參考圖、Moodboard、LoRA--sref 參數
輸出多樣性高(擁抱歧義)中(傾向一致審美)
生態系圖+影片+3D+LoRA訓練僅影像生成
價格免費層 + $9/月起$10–$120/月
本地部署✅ ComfyUI 原生支援❌ 僅 API

簡單來說:Midjourney 適合想要「開箱即用、高完成度」的用戶;Krea 2 適合需要「風格控制、迭代速度、本地部署」的專業創作者。

Krea 2 vs FLUX.2

  • FLUX.2 採用 Rectified Flow Transformer 架構,在純影像品質(特別是寫實感)上表現優異,在 Artificial Analysis 的 Text-to-Image 排行榜上名列前茅。
  • Krea 2 則在「風格忠實度」上更勝一籌。在獨立的風格忠實度基準測試中,Krea 2 Large 得分僅落後 GPT Image 2 約 0.14 點。
  • ComfyUI 原生支援讓 Krea 2 在本機部署上比 FLUX.2 更輕量(FP8 僅 12GB)。

Krea 2 Turbo vs 雲端 API 方案

如果你不想在本機部署,Krea 提供 API 方案:

  • Runware 等平台提供 krea:krea@2-turbo 的 API 接入
  • 支援批量生成(最多 20 張/請求)、Webhook 回傳、雲端儲存直接上傳
  • 對於需要整合到自動化流程的開發者來說非常友善

ComfyUI 原生部署完整指南

前置條件

  • ComfyUI 版本:0.25.0 或更高(原生支援 Krea 2)
  • 顯卡:NVIDIA GPU,16GB+ VRAM(FP8 量化版)
  • Python:3.10+

步驟 1:下載 FP8 量化權重

前往 Hugging Face 上的 AlperKTS/Krea2_FP8 倉庫,下載以下三個檔案:

  1. krea2_turbo_fp8.safetensors → 放入 ComfyUI/models/unet/
  2. qwen3vl_4b_fp8_scaled.safetensors → 放入 ComfyUI/models/text_encoders/
  3. qwen_image_vae.safetensors → 放入 ComfyUI/models/vae/

步驟 2:載入工作流

ComfyUI 0.25.0 已內建 Krea 2 支援,無需額外安裝自訂節點。你可以:

  • 從 ComfyUI 的 Node Library 搜尋 “Krea 2 Image” 節點
  • 或直接拖入官方提供的 Krea 2 Simple Workflow JSON 工作流檔案

步驟 3:調整參數並生成

在工作流中設定:

  • Steps: 8
  • CFG: 1.0
  • Sampler: er_sde
  • Scheduler: simple
  • Resolution: 1280×720 或 1024×1024

點擊 Generate 即可在約 2–4 秒內看到結果。

進階技巧:使用風格參考與 Moodboard

  1. 風格參考:在 Style Reference 欄位上傳 1–4 張參考圖片,模型會自動提取風格特徵。
  2. Moodboard:在 Krea 平台上建立 Moodboard,取得 moodboard_id 後填入工作流。
  3. Generative Sliders:使用 Intensity、Complexity、Movement 滑桿微調輸出,範圍 -100 到 100。

推薦工作流:Turbo → Medium/Large 升級法

最佳實踐是「先用 Turbo 快速探索方向,再用 Medium/Large 出成品」:

  1. 用 Krea 2 Turbo 快速生成 10–20 張概念圖(每張 ~2 秒)
  2. 用 Generative Sliders 和風格參考鎖定視覺方向
  3. 確認方向後,切換到 Krea 2 Medium 或 Large 生成最終成品

這種「先廣撒網、再精準打魚」的工作流,能最大化創意效率。

適用場景與最佳實踐

最適合的場景

  • 快速概念設計:廣告企劃、品牌探索、產品視覺預覽
  • 遊戲與娛樂概念藝術:快速生成多個角色、場景、道具概念
  • 編輯與排版設計:需要快速迭代視覺風格的設計工作
  • 提示詞測試:在投入大量時間到高精度模型前,先用 Turbo 驗證提示詞方向
  • Moodboard 探索:建立並測試視覺方向集合

不適合的場景

  • 最終寫實照片級輸出:Turbo 在細節和質感上不如 Medium/Large
  • 極高風格忠實度需求:需要精確複製特定藝術家風格時,建議用 Medium/Large
  • 需要極高解析度的印刷級輸出:Turbo 最高支援 1K 解析度

授權與商業使用

Krea 2 採用 Krea 2 Community License

  • 非商業用途:自由使用
  • 商業用途:需另行向 krea.ai 洽詢商業授權
  • 部署要求:開發者必須在下游部署中實作內容過濾或審查機制
  • 智慧財產權:Krea 不主張用戶生成內容的版權,使用者自行負責

FP8 量化版本(AlperKTS 製作)遵循相同的原始授權條款。

總結

Krea 2 Turbo 代表了 AI 影像生成的一個重要趨勢:從「提示詞驅動」轉向「視覺控制驅動」,同時在速度與創意控制之間取得出色平衡。

ComfyUI 原生支援 + FP8 量化讓它成為目前最易於本地部署的高端影像模型之一。對於需要快速迭代、風格靈活、且不想依賴雲端 API 的創作者來說,Krea 2 Turbo 是目前最值得關注的選項之一。

而隨著 ComfyUI 生態系的不斷擴展,未來我們預期會看到更多基於 Krea 2 的自訂節點、LoRA 模型和進階工作流出現。


參考來源:Krea 官方部落格Krea 文件Hugging Face 模型頁面AlperKTS FP8 量化倉庫SGLang 技術文件ComfyUI 官方公告