Hermes Agent 上下文膨脹實錄:從 1.6K 到 2.8K,你的 token 都去哪了?

前陣子我發現一個現象:Hermes Agent 第一次發話時的初始上下文,從之前的 1.6K tokens 左右,悄悄爬升到了 2.8K tokens,增幅接近 75%。 起初以為只是個人設定差異,結果去 Reddit 的 r/hermesagent 一看——好家伙,幾乎 everybody 都在抱怨同樣的事。 這篇就來好好聊聊這個問題:從發現、原因分析、社群反饋到實戰解法,一次講清楚。 - 廣告 - 什麼叫「初始上下文」?為什麼它很重要? 在深入之前,先釐清一個概念:Hermes Agent 每次發話(無論你只打一個「hi」),都會把完整的 system prompt 送給模型。這包含: 核心行為規則與 persona 所有已載入工具的 schema 定義 Skill 清單(名稱 + 描述) AGENTS.md(開發者指南) Memory、User Profile、SOUL.md 等個人設定 這些全部打包在一起,就是所謂的「初始上下文」或「system overhead」。 為什麼重要? 因為這塊 overhead 是固定成本。你發一句「今天天氣如何」和發一段 5000 字的程式碼需求,初始上下文幾乎是一樣的。對 token 計費的模型來說,這意味著你在為「沒用到的東西」付費。 ...