AI

Hermes Agentの設定方法は?自律型AIエージェント導入ガイド【2026年版】

Hermes Agentの設定方法は?自律型AIエージェント導入ガイド【2026年版】

Hermes Agentの設定方法は、pip install hermes-agentまたは公式インストールスクリプトでセットアップしたあと、hermes modelコマンドで外部LLM(Anthropic、OpenAI、OpenRouter等)を接続し、~/.hermes/config.yamlでターミナルバックエンドや圧縮設定を調整する、という3段構えで進めます。Hermes Agent本体にはLLMが内蔵されていないため、64,000トークン以上のコンテキストを持つモデルを別途用意するのが必須要件です。

Hermes AgentはNous Researchが2026年2月にリリースしたオープンソースの自律型AIエージェントです。サーバー上に常駐し、経験からスキルを自動生成し、過去のセッションを横断検索して学び続ける「自己改善ループ」を内蔵しています。Claude CodeやCodex CLIと並ぶ次世代AIエージェント基盤として国内外で導入が進み、永続記憶を活用した業務自動化の現実解として注目されています。

本記事では、公式ドキュメント(hermes-agent.nousresearch.com)とGitHubリポジトリの最新仕様にもとづき、Hermes Agentを実運用レベルで動かすまでの設定手順を10ステップに分解して解説します。

この記事でわかること

  • Hermes Agentを最短ルートでインストール・起動する10ステップの全手順
  • 主要LLMプロバイダ8種類の比較と、用途別の最適な選択基準
  • config.yamlで調整すべき5つの重要パラメータと、つまずきやすいポイントの回避策

Hermes Agentとは?自律型AIエージェントの基本

Hermes Agentは、Nous Researchが2026年2月に公開したオープンソースの自律型AIエージェントです。MITライセンスで配布されており、自前のマシンやVPS上で動作します。

ターミナル操作、ファイル編集、Web検索、永続記憶、拡張スキルといった機能を最初から備えています。特徴的なのは「内蔵学習ループ」で、エージェント自身がタスクの過程からスキルを生成し、使い込むほど性能が高まる設計になっています。仕組みの全体像と背景については、別記事「Hermes Agentとは?使うほど賢くなる自己改善型AIエージェントの仕組み」で詳しく扱っています。

Hermes Agentの3つの特徴

1つ目は永続記憶(Persistent Memory)です。過去の会話・スキル・ユーザープロファイルをローカルに保存し、セッションをまたいで参照します。~/.hermes/memories/配下にFTS5全文検索インデックスとともに格納されます。

2つ目は自己改善スキルシステムです。タスクを実行する過程で再利用可能なスキルモジュールを自動生成し、~/.hermes/skills/に蓄積します。次回以降のタスクで自動的に呼び出されます。

3つ目はマルチプラットフォーム配信です。CLI、Telegram、Discord、Slack、WhatsApp、Signalなど複数のチャネルから同じエージェントにアクセスできます。

他のAIエージェントとの違い(比較表)

項目Hermes AgentClaude CodeCodex CLI
提供元Nous ResearchAnthropicOpenAI
ライセンスMIT(OSS)プロプライエタリApache 2.0
LLM外部接続(任意)Claudeシリーズ固定GPT/Codexシリーズ固定
永続記憶内蔵(FTS5検索付き)主にプロジェクト単位のメモリ外部設定が必要
スキル自動生成ありスキル機能あり(手動含む)なし
主な用途長期常駐エージェントコーディング特化コーディング特化
マルチチャネルCLI/Telegram/Slack等CLI/IDECLI

差別化のポイントは「LLMを自由に選べる」点と「常駐型として育てていく」設計思想です。Claude CodeやCodex CLIがコーディング特化なのに対し、Hermes Agentは汎用タスクを長期にわたって任せる用途を想定しています。

合わせて読みたい

なぜ今Hermes Agentが注目されるのか

自律型AIエージェント市場は2025年後半から急速に立ち上がったとされ、各社がコーディング特化型を投入したのが第一波と見られています。Hermes Agentは第二波の「永続記憶 × 自己改善」を前面に押し出した設計で、運用しながら賢くなる点が評価されています。

自己改善型AIエージェントの市場動向

OpenAI、Anthropic、Googleがそれぞれ汎用エージェントを公開する中、Hermes Agentは「LLMを切り替え可能」「OSS」「永続記憶を最初から内蔵」という構成で独自のポジションを取りました。Nous Researchはオープンソースモデル「Hermes」シリーズで知られる研究グループで、その流れを汲んだエージェント実装です。

永続記憶がもたらすビジネスインパクト

従来のAIエージェントは1セッションで完結する設計が主流だったため、ユーザーの好み・過去の判断・進行中のプロジェクトを毎回ゼロから説明する必要がありました。Hermes AgentではSOUL.md(エージェントのアイデンティティ定義)とmemories/に蓄積される個別記憶により、長期的なコンテキストが保たれます。

これにより、定型業務の委任、リサーチアシスタント、Slackボット化など、従来は実装コストが高かったユースケースが標準機能の組み合わせで実現しやすくなりました。

Hermes Agentの設定方法10ステップ

ここからが本記事の中核となる手順解説です。Hermes Agentを動かすまでの全工程を10ステップに分解します。所要時間は環境構築を含めて30〜60分が目安です。

全体像は以下のフローのとおりです。インストール(Step 1-3)→ モデル接続・設定(Step 4-8)→ 起動・運用開始(Step 9-10)の3フェーズで進めます。

Hermes Agent 設定方法 10ステップフロー図

Step 1. 動作環境を確認する

Hermes Agentは以下の環境に対応します。

  • Linux(Ubuntu、Debian、Arch 等)
  • macOS(Apple Silicon/Intel)
  • Windows(WSL2推奨、ネイティブはPowerShell経由の早期ベータ)
  • Termux(Android)

事前にインストールしておきたいのは以下のとおりです。

  • Python 3.11以上
  • Node.js(最新LTS)
  • Git
  • ripgrep
  • ffmpeg

pip経由でインストールする場合、後述するhermes postinstallが依存ツールを自動で揃えてくれるため、未インストールでも先に進めます。

Step 2. Hermes Agentをインストールする

インストール方法は2種類あります。安定性を重視するならpip、最新ブランチを試したいなら公式スクリプトを使います。

A. pipでインストールする場合

pip install hermes-agent

B. 公式インストールスクリプトを使う場合

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
source ~/.bashrc  # zshユーザーは source ~/.zshrc

スクリプト版はuv、Python 3.11、リポジトリ本体を一括セットアップします。sudoは不要で、すべてユーザー領域にインストールされます。

Windows(ネイティブ)の場合はPowerShellで以下を実行します。

irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1 | iex

Step 3. postinstallで依存ツールを揃える

pipでインストールした場合は次のコマンドで周辺ツールを揃えます。

hermes postinstall

Node.js、Playwrightブラウザ、ripgrep、ffmpegを必要に応じて取得します。すでに入っているコンポーネントはスキップされます。

Step 4. LLMプロバイダを選択する

Hermes Agent本体にはLLMが含まれません。OpenAI互換のAPIエンドポイントを持つプロバイダを別途接続します。

hermes model

このコマンドはインタラクティブなプロバイダ選択メニューを開きます。サポートされる主要プロバイダは以下のとおりです。

迷ったらまずOpenRouterを推奨します。1つのAPIキーで複数モデルを試せるため、検証コストが下がります。

Step 5. APIキーを設定する

選択したプロバイダのAPIキーを設定します。シークレット情報は自動的に~/.hermes/.envに書き込まれます。

hermes config set OPENROUTER_API_KEY sk-or-v1-xxxxxxxxxxxx

Anthropic公式の場合はOAuth認証も利用できます。

hermes model
# プロバイダ選択でAnthropicを選び、OAuthフローに従う

CI環境ではAPIキー、対話的に使う個人マシンではOAuthが扱いやすい、という使い分けが現実的です。

Step 6. モデル接続を確認する

設定が反映されたかをドクターコマンドで確認します。

hermes doctor

ここで「context window」項目が64,000トークン以上のモデルを指していることを必ず確認してください。Hermes Agentは多段ツール呼び出しのワーキングメモリを確保するため、これより小さいコンテキストのモデルは起動時に拒否されます。

たとえばgpt-4o-mini(128K)、claude-haiku-4-5(200K)、gemini-2.5-flash(1M)、deepseek-v3(128K)などは条件を満たします。逆に旧モデルで32Kや16Kのものを指定するとエラーで止まります。

Step 7. ターミナルバックエンドを選ぶ

Hermes Agentはエージェントがシェルコマンドを実行する場所(ターミナルバックエンド)を7種類から選べます。

バックエンド用途隔離度
local開発・個人利用なし
docker安全なサンドボックスフル(namespace隔離)
sshリモートサーバーネットワーク境界
modalクラウドの一時VMフル
daytonaマネージドクラウドワークスペースフル
vercel_sandboxクラウドmicroVMフル
singularityHPCクラスタnamespace隔離

初回はlocalで動作確認し、本番運用や信頼境界をまたぐ用途ではdockerを選ぶのが定石です。config.yamlで次のように指定します。

terminal:
  backend: docker
  docker_image: ubuntu:24.04
  container_persistent: true
  docker_run_as_host_user: true

Step 8. config.yamlを調整する

主設定ファイルは~/.hermes/config.yamlにあります。最初に確認・調整すべき項目を抜粋します。

agent:
  max_turns: 90
  reasoning_effort: medium
  api_max_retries: 3

approvals:
  mode: manual  # manual | smart | off

compression:
  enabled: true
  threshold: 0.50
  target_ratio: 0.20
  protect_last_n: 20

memory:
  memory_enabled: true
  memory_char_limit: 2200
  user_char_limit: 1375

display:
  tool_progress: all
  streaming: true
  show_reasoning: false

設定値の優先順位は「CLI引数 → config.yaml → .env → ビルトイン既定値」の順で解決されます。シークレットは必ず.env、それ以外はconfig.yamlに書く、というルールを守ってください。

Step 9. TUIモードで起動する

設定が完了したらTUI(ターミナルUI)モードで起動します。

hermes --tui

会話履歴・現在実行中のツール・トークン消費量がリアルタイムで表示されます。最初はhermes(TUIなし)で動かす方法もありますが、TUIのほうが状況把握が容易なため、運用前検証ではTUIを推奨します。

Step 10. 最初のタスクを実行する

初回の動作確認には、副作用が小さく結果を検証しやすいタスクを選びます。たとえば次のような指示が手頃です。

このリポジトリを5つの箇条書きで要約してください

実行後、hermes --continueで同じセッションを再開できることを確認してください。これが成功すれば、永続記憶が正しく書き込まれています。

hermes --continue

ここまでで Hermes Agent の基本セットアップは完了です。

主要LLMプロバイダ比較

Hermes Agentに接続するLLMプロバイダの選定は、運用コスト・レイテンシ・モデル品質のトレードオフで決まります。代表的な選択肢を比較します。

プロバイダ強み弱み想定用途
Nous PortalHermesシリーズに最適化、独自モデル群提供モデルが限定的公式推奨環境、検証用
OpenRouter200+モデルを横断利用、課金一元化中継分のわずかなレイテンシモデル選定フェーズ、本番運用
AnthropicClaudeの高品質長文処理、200KコンテキストコストはOpenRouter経由よりやや高め長文・複雑タスク
OpenAIGPT-5系の安定性、エコシステムコストは中〜高汎用、ツール利用が多いタスク
DeepSeek圧倒的な低コスト、コーディング得意一部のレギュレーションで利用制限大量バッチ処理
Google AIGemini 2.5/3系の長文(1M)、マルチモーダルエンタープライズ向け契約が必要な場合あり長文資料解析
Hugging FaceOSSモデルを試せる推論速度がプロバイダによるOSSモデル評価
自前エンドポイント(vLLM等)フルコントロール、データ秘匿運用負荷センシティブデータ案件

迷ったら「初期検証はOpenRouter」「本番はAnthropicまたはOpenAI」「センシティブデータは自前エンドポイント」の組み合わせが現実解になります。

設定ファイル(config.yaml)の主要項目

~/.hermes/config.yamlで押さえておきたい設定ブロックを4つ取り上げます。

モデル設定(auxiliary)

メインの会話モデルとは別に、ビジョン処理・Web抽出・会話圧縮を別モデルにルーティングできます。コスト最適化に効きます。

auxiliary:
  vision:
    provider: openrouter
    model: openai/gpt-4o
    timeout: 120
  compression:
    provider: openrouter
    model: google/gemini-3-flash-preview

圧縮や軽量タスクには高速・低コストのモデル、推論本体には高品質モデル、と役割分担するのが王道です。

圧縮設定(compression)

長い会話を自動圧縮してコンテキスト上限内に収めます。

compression:
  enabled: true
  threshold: 0.50      # コンテキスト上限の50%で圧縮開始
  target_ratio: 0.20   # 直近20%を非圧縮で残す
  protect_last_n: 20   # 最低20メッセージは圧縮しない

圧縮対象が大きすぎると重要情報が失われ、小さすぎるとコストが下がりません。0.50起点で運用しながら調整するのがおすすめです。

承認モード(approvals)

エージェントがコマンド実行する前に承認を求める粒度を決めます。

  • manual:すべての実行で対話的に承認を求める(最も安全、初期推奨)
  • smart:LLMがリスクを判定し、安全な操作は自動承認する
  • off:承認チェックを無効化(自動化用途、危険性を理解したうえで)
approvals:
  mode: smart  # manual | smart | off

業務用途ではsmartを基本にし、危険コマンドだけ手動承認、という運用が現実的です。Tirithによるコマンドスキャンを併用するとさらに堅牢になります。

security:
  tirith_enabled: true
  tirith_timeout: 5

メモリ設定(memory)

セッションをまたいで保持する記憶量を制御します。

memory:
  memory_enabled: true
  memory_char_limit: 2200  # 約800トークン
  user_char_limit: 1375    # 約500トークン

メモリ容量を増やすほどコンテキスト使用量も増えるため、頻繁に参照する重要情報だけを残す方針が、長期運用ではコスト効率が良くなります。

つまずきやすい5つのポイント

実際の導入で詰まりやすいポイントを先回りで挙げます。

1つ目は64Kコンテキスト要件の見落としです。古いモデルや軽量モデルを指定して起動失敗するケースが頻発します。hermes doctorで必ずコンテキストサイズを確認してください。

2つ目はAPIキーを0に書いてしまうことです。シークレットは.env、それ以外はconfig.yamlが原則になります。逆に書くと環境共有時の事故につながります。

3つ目は0の飛ばし忘れです。pipインストール時にPlaywrightやffmpegが入らず、Web操作・動画処理タスクが落ちます。後から走らせれば復旧できます。

4つ目は承認モードをいきなりoffにする運用です。初回からoffで動かすと、意図しないファイル変更やコマンド実行のリスクが高くなります。manualかsmartで運用開始するのが定石です。

5つ目はターミナルバックエンドをlocalのまま本番運用することです。エージェントがホストマシン全体にアクセスできてしまいます。本番ではdocker・modal・vercel_sandboxなどのサンドボックス系に切り替えてください。

トラブルシューティング

問題発生時の調査順序は次のとおりです。

hermes doctor    # 環境チェック(プロバイダ接続、依存ツール、コンテキスト要件)
hermes model     # モデル設定を再選択
hermes setup     # 全体を再構成

頻出するエラーと対処を整理します。

症状主な原因対処
Context window too small64Kに満たないモデルを指定より大きいモデルへ変更
Authentication failedAPIキー誤りまたは期限切れhermes config set で再設定
Tool not found: ripgreppostinstall未実行hermes postinstall を実行
Browser launch failedPlaywrightブラウザ未取得playwright install を手動実行
Memory write error~/.hermes/ への書き込み権限不足所有権を自ユーザーに変更

公式のGitHub IssuesとDiscordコミュニティに既知の問題と対処が蓄積されています。ローカルで解決しない場合はそちらを参照してください。

まとめ

Hermes Agentの設定方法は、インストール → LLMプロバイダ接続 → config.yaml調整の3工程に整理できます。10ステップの手順を順番に踏めば、永続記憶と自己改善ループを備えた自律型AIエージェントを自前環境で動かせます。

判断ポイントは「LLMプロバイダの選択」と「ターミナルバックエンドの選択」の2つ。ここを誤ると、あとから運用コストやセキュリティ面で痛みが出ます。初回検証はOpenRouter + localで素早く立ち上げ、本番運用ではプロバイダを用途別に最適化し、バックエンドをdockerなどのサンドボックスに切り替える、という二段構えが現実的です。

導入後は、エージェントに任せるタスクの粒度を徐々に広げながら、自動生成されるスキルと永続記憶を観察するフェーズに移ります。Hermes Agentのおもしろさは「育てるほど賢くなる」という設計思想にあるので、初日の設定よりも、数週間から数か月の運用で蓄積される個別記憶のほうが、長期の投資対効果を決めると感じています。

FAQ

Q1. Hermes AgentはClaude CodeやCodex CLIの代替になりますか? コーディング特化用途では、現時点でClaude CodeやCodex CLIのほうが成熟しています。Hermes Agentの強みは汎用タスクの長期常駐と永続記憶にあるため、Slackボット化・リサーチアシスタント・定型業務の委任といった用途で補完関係として併用するのが現実的です。

Q2. 完全にオフライン環境で動かせますか? LLM部分を自前のvLLMやOllamaなどローカル推論サーバーに接続し、ターミナルバックエンドをlocalにすれば、外部通信なしで動作します。ただし64Kコンテキストを満たすローカルモデルの選定が必要で、ハードウェア要件が高い点に注意してください。

Q3. 商用利用は可能ですか? Hermes Agent本体はMITライセンスで配布されているため商用利用は可能です。ただし接続するLLMプロバイダの利用規約は別途確認する必要があります(OpenAI、Anthropic、各社のAPI利用規約が適用されます)。

Q4. APIコストはどの程度かかりますか? 利用するLLMプロバイダとタスクの複雑さに依存するため一概には言えません。検証段階ではOpenRouter経由でDeepSeekやGemini Flashなどの低コストモデルを使えば月数ドル規模に収まります。本番運用でClaude OpusやGPT-5系を使う場合は月数十〜数百ドルの予算感が目安になります。

Q5. Windows環境でも安定して動きますか? WSL2上での動作は安定しています。PowerShellネイティブは早期ベータ段階のため、トラブルが出やすい状況です。WindowsユーザーはWSL2 + Ubuntu/Debianの構成を選ぶのが安全です。

Q6. 永続記憶はどこに保存されますか?データの管理は? ~/.hermes/memories/配下にMarkdownファイルとFTS5全文検索インデックスが保存されます。すべてローカルファイルなので、バックアップ・移行は通常のファイルコピーで完結します。複数マシン間で同期したい場合は、ディレクトリごとgit管理またはクラウドストレージ同期に乗せる運用が一般的です。

Q7. プロファイル機能とは何ですか? 複数のエージェント人格・設定セットを切り替えて使う仕組みです。プロファイルごとに独立したconfig、memory、sessions、skills、gateway serviceを持つため、業務用・個人用・プロジェクト別といった使い分けが可能になります。トークンロック隔離により、プロファイル間の認証情報衝突は発生しません。


この記事を書いた人
ZIDAI Notebook 編集部

新規事業開発支援、生成AIを活用したDX支援を実施する株式会社ZIDAIの事業開発、AI情報メディア「ZIDAI Notebook」。 多くの事業開発やAIを活用した開発を行ってきたBizDev、エンジニアの監修の元、情報をお届けします。