Hermes Agent 上下文膨脹實錄：從 1.6K 到 2.8K，你的 token 都去哪了？

Mon, 29 Jun 2026 10:30:00 +0800

前陣子我發現一個現象：Hermes Agent 第一次發話時的初始上下文，從之前的 1.6K tokens 左右，悄悄爬升到了 2.8K tokens，增幅接近 75%。

起初以為只是個人設定差異，結果去 Reddit 的 r/hermesagent 一看——好家伙，幾乎 everybody 都在抱怨同樣的事。

這篇就來好好聊聊這個問題：從發現、原因分析、社群反饋到實戰解法，一次講清楚。

什麼叫「初始上下文」？為什麼它很重要？

在深入之前，先釐清一個概念：Hermes Agent 每次發話（無論你只打一個「hi」），都會把完整的 system prompt 送給模型。這包含：

這些全部打包在一起，就是所謂的「初始上下文」或「system overhead」。

為什麼重要？ 因為這塊 overhead 是固定成本。你發一句「今天天氣如何」和發一段 5000 字的程式碼需求，初始上下文幾乎是一樣的。對 token 計費的模型來說，這意味著你在為「沒用到的東西」付費。