前陣子有個朋友跟我說:「哥,我試了好幾個 AI 工具,Claude 好用但貴、ChatGPT 免費但笨、自己架的又老是斷線。有沒有那種『裝一次就管用、還會越用越聰明』的?」
我說:「有啊,叫 Hermes Agent。」
他問:「這東西聽起來很硬核,我這種不會寫程式的人用得了嗎?」
我說:「你連這個都看得懂,絕對用得了。」
這篇文章不是那種「複製貼上就跑」的速成教學——我想跟你聊聊我怎麼從零開始,把 Hermes Agent 架起來、設好 provider、寫 skill、用 tool,然後讓它真的變成我每天的工作夥伴。如果你也想要一個「會跟你一起成長」的 AI 助手,這篇會讓你看到完整的實戰過程。
什麼是 Hermes Agent?
先說結論:Hermes Agent 是一個開源的 AI agent 框架,由 Nous Research 開發。它跟 Claude Code、OpenAI Codex 屬於同一類工具——能讀檔案、跑指令、操作瀏覽器、搜尋網頁,甚至透過 Telegram 跟你聊天。
但 Hermes 有幾個讓我看上它的特色:
- 自我進化:遇到複雜任務後,它會自動把經驗存成 skill,下次遇到同樣問題就變快了
- 跨平台:同一個 agent 可以同時跑在終端機、Telegram、Discord、Slack 上
- 不限模型:OpenRouter、Anthropic、OpenAI、DeepSeek、本地模型,想換就換
- 跨會話記憶:昨天跟你聊過的偏好、習慣,今天還記得
簡單來說,它不是那種「你問一句、它答一句」的聊天機器人,而是一個「住在你機器裡、會記住事情、會自己學東西」的助手。
第一步:兩分鐘裝好
Hermes 的安裝非常直覺,Linux/macOS 上一行指令搞定:
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
安裝完重載 shell(source ~/.bashrc),然後輸入 hermes 就能開始聊天。
Windows 用戶也沒問題,PowerShell 跑一行:
iex (irm https://hermes-agent.nousresearch.com/install.ps1)
注意:安裝器會自動處理 Python 3.11、Node.js、ffmpeg 等依賴,不需要你手動裝一堆東西。
安裝完後先跑一次 hermes doctor,它會檢查所有依賴和設定檔是否正確。如果看到「All checks passed」,恭喜你,已經完成最難的步驟了。
第二步:選你的模型 provider
Hermes 支援 20 多個 provider,這是它最方便的地方——你不需要被綁定在某一家。
最省事的選擇:Nous Portal
如果你不想記一堆 API key,Nous Portal 是最好用的選擇。一個訂閱涵蓋 300+ 模型、網頁搜尋、圖片生成、語音合成、雲端瀏覽器。
hermes setup --portal
跑完這行,OAuth 登入、provider 設定、Tool Gateway 全部搞定。
自己帶 key:OpenRouter
OpenRouter 是另一個熱門選擇,它整合了 200+ 模型,你只需要一個 API key 就能用所有模型。在 .env 裡設定:
然後用 hermes model 選你想要的模型,比如:
hermes model
# 選 anthropic/claude-sonnet-4
其他選項
Hermes 還支援 Anthropic 直接、OpenAI、DeepSeek、Google Gemini、xAI Grok、MiniMax、Hugging Face 等。想換模型?一行指令:
hermes config set model deepseek/deepseek-r1
不用改程式碼、不用重啟服務,即時生效。
第三步:開啟工具權限
裝好 Hermes 之後,它預設開啟了大部分核心工具(terminal、file、search、browser、memory 等)。你可以用互動式介面管理:
hermes tools
這裡會列出所有可用的 toolset,用上下鍵選取、空白鍵切換開關。
常見的 toolset 包括:
| Toolset | 功能 |
|---|---|
terminal | 執行 Shell 指令 |
file | 讀寫搜尋檔案 |
web | 網頁搜尋與內容擷取 |
browser | 瀏覽器自動化 |
memory | 跨會話記憶 |
delegation | 委派子 agent 工作 |
cronjob | 排程任務 |
vision | 圖片分析 |
image_gen | AI 圖片生成 |
tts | 文字轉語音 |
每個 toolset 都可以針對不同平台(CLI、Telegram、Discord 等)獨立開啟或關閉。
第四步:寫第一個 Skill
Skill 是 Hermes 最讓我驚艷的功能。簡單說,skill 就是「程序記憶」——把某個重複性任務的步驟寫成文件,agent 遇到相關任務時就會自動載入。
Skill 的實際應用場景
舉個真實例子:我每次部署 Python 專案到 Docker 時,都需要傳入一堆固定的參數(--read-only、--tmpfs、--cap-drop=ALL 等)。如果每次都口述,agent 不是忘了這個就是漏了那個。
所以我建立了一個 skill,把所有 Docker 隔離測試的參數寫進去。之後每次要跑 Docker 測試,agent 就會自動載入這個 skill,精準傳入所有需要的參數。
建立 Skill 的格式
Skill 是一個 Markdown 檔案,放在 ~/.hermes/skills/ 目錄下。基本結構如下:
---
name: docker-test
description: "Docker 隔離測試的固定參數組合"
version: 1.0.0
---
# Docker 隔離測試
## 固定參數
- `--read-only` 搭配 `--tmpfs /root/.local:exec,size=100m`
- `--tmpfs /tmp:exec,noexec,nosuid,size=200m`
- python image 用 `--entrypoint /usr/local/bin/python3`
- `--cap-drop=ALL --cap-add=DAC_READ_SEARCH`
- `--memory=512m --cpus=1.0`
- `--network=bridge`
- `--rm`
## 注意事項
- Docker Compose 長駐服務用 `bash start.sh` 包裝繞過 exit code -1
建立好之後,agent 在適當的場景會自動載入。你也可以手動載入:
Agent 自動建立 Skill
更厲害的是,Hermes 可以在完成複雜任務後「自動」建立 skill。比如你讓它解決了一個棘手問題,它會問你:「要不要把這個流程存成 skill,下次直接用?」
你回答「好」,它就把整個解決過程存成 skill 文件。下次遇到同樣問題,它會先載入這個 skill,少走好幾步。
第五步:日常使用——讓 Agent 融入工作流
設定完成之後,就是見證奇蹟的時刻。以下是幾個我實際使用 Hermes 的場景:
場景一:爬取動態渲染的網頁
有個需求是要爬 goodinfo.tw 的台股資料。這站首頁只有 1110 bytes 的 JS 殼頁面,真正內容靠 JavaScript 動態渲染。直接 curl 抓到的什麼都沒有。
我跟 Hermes 說:「幫我抓 goodinfo.tw 的台股大盤資訊。」
它自己判斷出這站需要瀏覽器自動化,動用了 scrapling 的 DynamicFetcher(基於 Playwright),設定 headless 模式、等待網路空閒、載入 DOM,然後成功拿到 275K 字元的渲染後 HTML。
整個過程我什麼參數都沒傳,它自己決定要用什麼工具、怎麼設定。
場景二:排程每日科技新聞摘要
我想每天早上收到一份科技新聞摘要。在 Hermes 裡只要一行:
hermes cron create "0 8 * * *" \
-p "搜尋今天科技新聞,整理成繁體中文摘要,發送到 Telegram"
每天早上八點,Hermes 會自動搜尋新聞、整理摘要、透過 Telegram 發給你。完全不用管。
場景三:跨平台工作不中斷
我在電腦上讓 Hermes 跑一個 Python 腳本,中途要出門。回到家打開 Telegram,繼續問它:「剛才的腳本跑完了嗎?結果如何?」
它會接著剛才的進度繼續回答,會話狀態在所有平台間同步。
場景四:用 Cron 監控伺服器
我設定了一個排程任務,每 30 分鐘檢查一次伺服器記憶體使用量。如果超過 80%,就發通知給我。
hermes cron create "30m" \
-p "檢查伺服器記憶體使用率,超過 80% 時通知,否則保持安靜"
這就是「會跟你一起成長」的意義——它不只是回答問題,還能在你不在的時候主動做事。
進階:Gateway 與多平台串接
Hermes 的 Gateway 功能讓你可以透過 Telegram、Discord、Slack 等平台跟 agent 互動。設定方式:
hermes gateway setup # 互動式設定
hermes gateway start # 啟動 gateway
設定好之後,你就可以在 Telegram 上直接跟 Hermes 聊天。它在雲端機器上跑,你隨時隨地都能用手機觸及。
這也解決了「agent 要一直開著終端機」的問題。你的 Hermes 可以跑在 $5 的 VPS 上,24 小時待命,你從任何地方、任何平台跟它對話。
進階:Memory 與自我優化
Hermes 的記憶系統分為兩層:
- Persistent Memory:跨會話的長期記憶,包含你的偏好、環境資訊、經驗教訓
- Session Search:可以搜尋過去所有會話的內容,找到「上週我們討論過的那个問題怎麼解決的」
當你多次修正 agent 的行為後,它會自動把這些修正存成 memory。比如你告訴它「Docker 測試要用 --read-only」,下次它就會自動加上這個參數。
更聰明的是,Hermes 有一個 Curator 系統,會定期掃描所有 skill,把太久沒用的標記為過時、把常用的標記為重要。這確保了你的 agent 不會被一堆沒用的 skill 拖累。
小結:為什麼我推薦 Hermes Agent
用了一段時間之後,我對 Hermes 最深的感受是:它不是另一個聊天機器人,而是一個會住在你家、會記事情、會自己學東西的助手。
- 你教它一次,它記住一輩子
- 你用它越多,它越懂你
- 你換平台(從 CLI 到 Telegram 到 Discord),它跟著走
- 你換模型(從 Claude 到 Gemini 到本地模型),它照樣跑
最重要的是,它是開源的(MIT 授權),你可以跑在自己的機器上,資料不外洩。如果你想要一個「真正屬於自己」的 AI 助手,Hermes Agent 是目前最好的選擇之一。
安裝只要兩分鐘,設定花個半小時,然後剩下的時間——就讓它陪你一起成長吧。