前陣子有個朋友跟我說:「哥,我試了好幾個 AI 工具,Claude 好用但貴、ChatGPT 免費但笨、自己架的又老是斷線。有沒有那種『裝一次就管用、還會越用越聰明』的?」

我說:「有啊,叫 Hermes Agent。」

他問:「這東西聽起來很硬核,我這種不會寫程式的人用得了嗎?」

我說:「你連這個都看得懂,絕對用得了。」

這篇文章不是那種「複製貼上就跑」的速成教學——我想跟你聊聊我怎麼從零開始,把 Hermes Agent 架起來、設好 provider、寫 skill、用 tool,然後讓它真的變成我每天的工作夥伴。如果你也想要一個「會跟你一起成長」的 AI 助手,這篇會讓你看到完整的實戰過程。

什麼是 Hermes Agent?

先說結論:Hermes Agent 是一個開源的 AI agent 框架,由 Nous Research 開發。它跟 Claude Code、OpenAI Codex 屬於同一類工具——能讀檔案、跑指令、操作瀏覽器、搜尋網頁,甚至透過 Telegram 跟你聊天。

但 Hermes 有幾個讓我看上它的特色:

  • 自我進化:遇到複雜任務後,它會自動把經驗存成 skill,下次遇到同樣問題就變快了
  • 跨平台:同一個 agent 可以同時跑在終端機、Telegram、Discord、Slack 上
  • 不限模型:OpenRouter、Anthropic、OpenAI、DeepSeek、本地模型,想換就換
  • 跨會話記憶:昨天跟你聊過的偏好、習慣,今天還記得

簡單來說,它不是那種「你問一句、它答一句」的聊天機器人,而是一個「住在你機器裡、會記住事情、會自己學東西」的助手。

- 廣告 -

第一步:兩分鐘裝好

Hermes 的安裝非常直覺,Linux/macOS 上一行指令搞定:

curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash

安裝完重載 shell(source ~/.bashrc),然後輸入 hermes 就能開始聊天。

Windows 用戶也沒問題,PowerShell 跑一行:

iex (irm https://hermes-agent.nousresearch.com/install.ps1)

注意:安裝器會自動處理 Python 3.11、Node.js、ffmpeg 等依賴,不需要你手動裝一堆東西。

安裝完後先跑一次 hermes doctor,它會檢查所有依賴和設定檔是否正確。如果看到「All checks passed」,恭喜你,已經完成最難的步驟了。

第二步:選你的模型 provider

Hermes 支援 20 多個 provider,這是它最方便的地方——你不需要被綁定在某一家。

最省事的選擇:Nous Portal

如果你不想記一堆 API key,Nous Portal 是最好用的選擇。一個訂閱涵蓋 300+ 模型、網頁搜尋、圖片生成、語音合成、雲端瀏覽器。

hermes setup --portal

跑完這行,OAuth 登入、provider 設定、Tool Gateway 全部搞定。

自己帶 key:OpenRouter

OpenRouter 是另一個熱門選擇,它整合了 200+ 模型,你只需要一個 API key 就能用所有模型。在 .env 裡設定:

OPENROUTER_API_KEY=sk-or-xxxxxxxxxxxx

然後用 hermes model 選你想要的模型,比如:

hermes model
# 選 anthropic/claude-sonnet-4

其他選項

Hermes 還支援 Anthropic 直接、OpenAI、DeepSeek、Google Gemini、xAI Grok、MiniMax、Hugging Face 等。想換模型?一行指令:

hermes config set model deepseek/deepseek-r1

不用改程式碼、不用重啟服務,即時生效。

第三步:開啟工具權限

裝好 Hermes 之後,它預設開啟了大部分核心工具(terminal、file、search、browser、memory 等)。你可以用互動式介面管理:

hermes tools

這裡會列出所有可用的 toolset,用上下鍵選取、空白鍵切換開關。

常見的 toolset 包括:

Toolset功能
terminal執行 Shell 指令
file讀寫搜尋檔案
web網頁搜尋與內容擷取
browser瀏覽器自動化
memory跨會話記憶
delegation委派子 agent 工作
cronjob排程任務
vision圖片分析
image_genAI 圖片生成
tts文字轉語音

每個 toolset 都可以針對不同平台(CLI、Telegram、Discord 等)獨立開啟或關閉。

第四步:寫第一個 Skill

Skill 是 Hermes 最讓我驚艷的功能。簡單說,skill 就是「程序記憶」——把某個重複性任務的步驟寫成文件,agent 遇到相關任務時就會自動載入。

Skill 的實際應用場景

舉個真實例子:我每次部署 Python 專案到 Docker 時,都需要傳入一堆固定的參數(--read-only--tmpfs--cap-drop=ALL 等)。如果每次都口述,agent 不是忘了這個就是漏了那個。

所以我建立了一個 skill,把所有 Docker 隔離測試的參數寫進去。之後每次要跑 Docker 測試,agent 就會自動載入這個 skill,精準傳入所有需要的參數。

建立 Skill 的格式

Skill 是一個 Markdown 檔案,放在 ~/.hermes/skills/ 目錄下。基本結構如下:

---
name: docker-test
description: "Docker 隔離測試的固定參數組合"
version: 1.0.0
---

# Docker 隔離測試

## 固定參數

- `--read-only` 搭配 `--tmpfs /root/.local:exec,size=100m`
- `--tmpfs /tmp:exec,noexec,nosuid,size=200m`
- python image 用 `--entrypoint /usr/local/bin/python3`
- `--cap-drop=ALL --cap-add=DAC_READ_SEARCH`
- `--memory=512m --cpus=1.0`
- `--network=bridge`
- `--rm`

## 注意事項

- Docker Compose 長駐服務用 `bash start.sh` 包裝繞過 exit code -1

建立好之後,agent 在適當的場景會自動載入。你也可以手動載入:

/skilldocker-test

Agent 自動建立 Skill

更厲害的是,Hermes 可以在完成複雜任務後「自動」建立 skill。比如你讓它解決了一個棘手問題,它會問你:「要不要把這個流程存成 skill,下次直接用?」

你回答「好」,它就把整個解決過程存成 skill 文件。下次遇到同樣問題,它會先載入這個 skill,少走好幾步。

第五步:日常使用——讓 Agent 融入工作流

設定完成之後,就是見證奇蹟的時刻。以下是幾個我實際使用 Hermes 的場景:

場景一:爬取動態渲染的網頁

有個需求是要爬 goodinfo.tw 的台股資料。這站首頁只有 1110 bytes 的 JS 殼頁面,真正內容靠 JavaScript 動態渲染。直接 curl 抓到的什麼都沒有。

我跟 Hermes 說:「幫我抓 goodinfo.tw 的台股大盤資訊。」

它自己判斷出這站需要瀏覽器自動化,動用了 scrapling 的 DynamicFetcher(基於 Playwright),設定 headless 模式、等待網路空閒、載入 DOM,然後成功拿到 275K 字元的渲染後 HTML。

整個過程我什麼參數都沒傳,它自己決定要用什麼工具、怎麼設定。

場景二:排程每日科技新聞摘要

我想每天早上收到一份科技新聞摘要。在 Hermes 裡只要一行:

hermes cron create "0 8 * * *" \
  -p "搜尋今天科技新聞,整理成繁體中文摘要,發送到 Telegram"

每天早上八點,Hermes 會自動搜尋新聞、整理摘要、透過 Telegram 發給你。完全不用管。

場景三:跨平台工作不中斷

我在電腦上讓 Hermes 跑一個 Python 腳本,中途要出門。回到家打開 Telegram,繼續問它:「剛才的腳本跑完了嗎?結果如何?」

它會接著剛才的進度繼續回答,會話狀態在所有平台間同步。

場景四:用 Cron 監控伺服器

我設定了一個排程任務,每 30 分鐘檢查一次伺服器記憶體使用量。如果超過 80%,就發通知給我。

hermes cron create "30m" \
  -p "檢查伺服器記憶體使用率,超過 80% 時通知,否則保持安靜"

這就是「會跟你一起成長」的意義——它不只是回答問題,還能在你不在的時候主動做事。

- 廣告 -

進階:Gateway 與多平台串接

Hermes 的 Gateway 功能讓你可以透過 Telegram、Discord、Slack 等平台跟 agent 互動。設定方式:

hermes gateway setup    # 互動式設定
hermes gateway start    # 啟動 gateway

設定好之後,你就可以在 Telegram 上直接跟 Hermes 聊天。它在雲端機器上跑,你隨時隨地都能用手機觸及。

這也解決了「agent 要一直開著終端機」的問題。你的 Hermes 可以跑在 $5 的 VPS 上,24 小時待命,你從任何地方、任何平台跟它對話。

進階:Memory 與自我優化

Hermes 的記憶系統分為兩層:

  1. Persistent Memory:跨會話的長期記憶,包含你的偏好、環境資訊、經驗教訓
  2. Session Search:可以搜尋過去所有會話的內容,找到「上週我們討論過的那个問題怎麼解決的」

當你多次修正 agent 的行為後,它會自動把這些修正存成 memory。比如你告訴它「Docker 測試要用 --read-only」,下次它就會自動加上這個參數。

更聰明的是,Hermes 有一個 Curator 系統,會定期掃描所有 skill,把太久沒用的標記為過時、把常用的標記為重要。這確保了你的 agent 不會被一堆沒用的 skill 拖累。

小結:為什麼我推薦 Hermes Agent

用了一段時間之後,我對 Hermes 最深的感受是:它不是另一個聊天機器人,而是一個會住在你家、會記事情、會自己學東西的助手。

  • 你教它一次,它記住一輩子
  • 你用它越多,它越懂你
  • 你換平台(從 CLI 到 Telegram 到 Discord),它跟著走
  • 你換模型(從 Claude 到 Gemini 到本地模型),它照樣跑

最重要的是,它是開源的(MIT 授權),你可以跑在自己的機器上,資料不外洩。如果你想要一個「真正屬於自己」的 AI 助手,Hermes Agent 是目前最好的選擇之一。

安裝只要兩分鐘,設定花個半小時,然後剩下的時間——就讓它陪你一起成長吧。