Qwen 3.6 深度解析:27B 稠密模型 vs 35B MoE,誰才是本地部署的王者?
前言 前陣子看到一篇來自 Quesma 的文章,作者在他的 MacBook Max M5(128GB RAM)上跑了 Qwen 3.6 系列模型後,得出一個頗具爭議的結論:27B 稠密模型在本地開發中才是最佳選擇,而不是 35B MoE 版本。 這個說法在 Reddit 的 LocalLLaMA 社群引發了熱烈討論——有人認同、有人反對。作為一個長期關注開源模型本地部署的人,我覺得這正是個好機會,把 Qwen 3.6 整個系列徹底盤點一遍,讓大家在實際部署前有個清晰的認知。 - 廣告 - Qwen 3.6 家族全覽 Qwen 3.6 是阿里通義千問團隊在 2026 年 4 月推出的新一代模型家族,主要分為三大版本: 1. Qwen 3.6-Plus(旗艦閉源版) 透過阿里雲百煉 / DashScope API 提供 預設 100 萬 token 上下文視窗 採用混合線性注意力(Linear Attention)+ MoE 架構 估計活躍參數超過 4000 億 定價約 $0.29/100 萬輸入 token、$1.65/100 萬輸出 token,比 Claude Opus 4.6 便宜約 12 倍、GPT-5.4 便宜約 6 倍 2. Qwen 3.6-35B-A3B(開源 MoE 版) ...