Qwythos-9B 深度解析:1M 上下文 + 無限制推理,9B 級開源模型的天花板在哪裡?
前言 2026 年 6 月底,AI 開源圈丟出一顆炸彈——Empero AI 發布了 Qwythos-9B-Claude-Mythos-5-1M。短短幾天內,這個模型在 Hugging Face 上衝上熱門榜,Reddit 的 SelfHostedAI 社群也沸騰了。 為什麼一個 9B 參數的模型能引起這麼大關注?簡單說:它在 9B 級別中,同時拿下了 1M token 上下文窗口、無限制推理能力、以及 原生工具調用——三個通常不會出現在同一個模型身上的標籤。 但它的訓練數據來自閉源的 Claude Mythos,效能表現有強項也有弱項,部署還不算太友善。這篇文章會帶你從技術規格、效能表現、社群反饋到業界爭議,完整拆解 Qwythos-9B 到底值不值得關注。 - 廣告 - 一、模型是什麼?誰做的? Qwythos-9B 是由 Empero AI(一家中國 AI 實驗室)開發的開源推理模型。它的基座是 Qwen3.5-9B,經過全參數微調(不是 LoRA 那種輕量微調),目標是打造一個「在專業領域不跳 boilerplate、能自主驗證事實、能處理超長上下文的推理模型」。 授權是 Apache-2.0,意味著你可以自由商用、修改、再分發。 這裡有個有趣的命名細節:「Qwythos」這個名字,應該是取自 Claude 的 Mythos 系列(Mythos + Fable),再加上 Qwen 的「Q」字頭,暗示它與這兩者的淵源。 ...