Hermes Agentの設定方法は？自律型AIエージェント導入ガイド【2026年版】

Hermes Agentの設定方法は、pip install hermes-agentまたは公式インストールスクリプトでセットアップしたあと、hermes modelコマンドで外部LLM（Anthropic、OpenAI、OpenRouter等）を接続し、~/.hermes/config.yamlでターミナルバックエンドや圧縮設定を調整する、という3段構えで進めます。Hermes Agent本体にはLLMが内蔵されていないため、64,000トークン以上のコンテキストを持つモデルを別途用意するのが必須要件です。

Hermes AgentはNous Researchが2026年2月にリリースしたオープンソースの自律型AIエージェントです。サーバー上に常駐し、経験からスキルを自動生成し、過去のセッションを横断検索して学び続ける「自己改善ループ」を内蔵しています。Claude CodeやCodex CLIと並ぶ次世代AIエージェント基盤として国内外で導入が進み、永続記憶を活用した業務自動化の現実解として注目されています。

本記事では、公式ドキュメント（hermes-agent.nousresearch.com）とGitHubリポジトリの最新仕様にもとづき、Hermes Agentを実運用レベルで動かすまでの設定手順を10ステップに分解して解説します。

この記事でわかること

Hermes Agentを最短ルートでインストール・起動する10ステップの全手順
主要LLMプロバイダ8種類の比較と、用途別の最適な選択基準
config.yamlで調整すべき5つの重要パラメータと、つまずきやすいポイントの回避策

1 Hermes Agentとは？自律型AIエージェントの基本
2 なぜ今Hermes Agentが注目されるのか
3 Hermes Agentの設定方法10ステップ
4 主要LLMプロバイダ比較
5 設定ファイル(config.yaml)の主要項目
6 つまずきやすい5つのポイント
7 トラブルシューティング
8 まとめ
9 FAQ

Hermes Agentとは？自律型AIエージェントの基本

Hermes Agentは、Nous Researchが2026年2月に公開したオープンソースの自律型AIエージェントです。MITライセンスで配布されており、自前のマシンやVPS上で動作します。

ターミナル操作、ファイル編集、Web検索、永続記憶、拡張スキルといった機能を最初から備えています。特徴的なのは「内蔵学習ループ」で、エージェント自身がタスクの過程からスキルを生成し、使い込むほど性能が高まる設計になっています。仕組みの全体像と背景については、別記事「Hermes Agentとは？使うほど賢くなる自己改善型AIエージェントの仕組み」で詳しく扱っています。

Hermes Agentの3つの特徴

1つ目は永続記憶（Persistent Memory）です。過去の会話・スキル・ユーザープロファイルをローカルに保存し、セッションをまたいで参照します。~/.hermes/memories/配下にFTS5全文検索インデックスとともに格納されます。

2つ目は自己改善スキルシステムです。タスクを実行する過程で再利用可能なスキルモジュールを自動生成し、~/.hermes/skills/に蓄積します。次回以降のタスクで自動的に呼び出されます。

3つ目はマルチプラットフォーム配信です。CLI、Telegram、Discord、Slack、WhatsApp、Signalなど複数のチャネルから同じエージェントにアクセスできます。

他のAIエージェントとの違い（比較表）

項目	Hermes Agent	Claude Code	Codex CLI
提供元	Nous Research	Anthropic	OpenAI
ライセンス	MIT（OSS）	プロプライエタリ	Apache 2.0
LLM	外部接続（任意）	Claudeシリーズ固定	GPT/Codexシリーズ固定
永続記憶	内蔵（FTS5検索付き）	主にプロジェクト単位のメモリ	外部設定が必要
スキル自動生成	あり	スキル機能あり（手動含む）	なし
主な用途	長期常駐エージェント	コーディング特化	コーディング特化
マルチチャネル	CLI/Telegram/Slack等	CLI/IDE	CLI

差別化のポイントは「LLMを自由に選べる」点と「常駐型として育てていく」設計思想です。Claude CodeやCodex CLIがコーディング特化なのに対し、Hermes Agentは汎用タスクを長期にわたって任せる用途を想定しています。

: Hermes Agentとは？使うほど賢くなる自己改善型AIエージェントの仕組み
Hermes Agentは、米AI企業 Nous Research が2026年2月25日に公開した、オープンソース（MITライセンス）の自律型AIエージェントです。最大の特徴は「使うほどスキルが蓄積 ...

合わせて読みたい

なぜ今Hermes Agentが注目されるのか

自律型AIエージェント市場は2025年後半から急速に立ち上がったとされ、各社がコーディング特化型を投入したのが第一波と見られています。Hermes Agentは第二波の「永続記憶 × 自己改善」を前面に押し出した設計で、運用しながら賢くなる点が評価されています。

自己改善型AIエージェントの市場動向

OpenAI、Anthropic、Googleがそれぞれ汎用エージェントを公開する中、Hermes Agentは「LLMを切り替え可能」「OSS」「永続記憶を最初から内蔵」という構成で独自のポジションを取りました。Nous Researchはオープンソースモデル「Hermes」シリーズで知られる研究グループで、その流れを汲んだエージェント実装です。

永続記憶がもたらすビジネスインパクト

従来のAIエージェントは1セッションで完結する設計が主流だったため、ユーザーの好み・過去の判断・進行中のプロジェクトを毎回ゼロから説明する必要がありました。Hermes AgentではSOUL.md（エージェントのアイデンティティ定義）とmemories/に蓄積される個別記憶により、長期的なコンテキストが保たれます。

これにより、定型業務の委任、リサーチアシスタント、Slackボット化など、従来は実装コストが高かったユースケースが標準機能の組み合わせで実現しやすくなりました。

Hermes Agentの設定方法10ステップ

ここからが本記事の中核となる手順解説です。Hermes Agentを動かすまでの全工程を10ステップに分解します。所要時間は環境構築を含めて30〜60分が目安です。

全体像は以下のフローのとおりです。インストール（Step 1-3）→ モデル接続・設定（Step 4-8）→ 起動・運用開始（Step 9-10）の3フェーズで進めます。

Step 1. 動作環境を確認する

Hermes Agentは以下の環境に対応します。

Linux（Ubuntu、Debian、Arch 等）
macOS（Apple Silicon／Intel）
Windows（WSL2推奨、ネイティブはPowerShell経由の早期ベータ）
Termux（Android）

事前にインストールしておきたいのは以下のとおりです。

Python 3.11以上
Node.js（最新LTS）
Git
ripgrep
ffmpeg

pip経由でインストールする場合、後述するhermes postinstallが依存ツールを自動で揃えてくれるため、未インストールでも先に進めます。

Step 2. Hermes Agentをインストールする

インストール方法は2種類あります。安定性を重視するならpip、最新ブランチを試したいなら公式スクリプトを使います。

A. pipでインストールする場合

pip install hermes-agent

B. 公式インストールスクリプトを使う場合

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
source ~/.bashrc  # zshユーザーは source ~/.zshrc

スクリプト版はuv、Python 3.11、リポジトリ本体を一括セットアップします。sudoは不要で、すべてユーザー領域にインストールされます。

Windows（ネイティブ）の場合はPowerShellで以下を実行します。

irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1 | iex

Step 3. postinstallで依存ツールを揃える

pipでインストールした場合は次のコマンドで周辺ツールを揃えます。

hermes postinstall

Node.js、Playwrightブラウザ、ripgrep、ffmpegを必要に応じて取得します。すでに入っているコンポーネントはスキップされます。

Step 4. LLMプロバイダを選択する

Hermes Agent本体にはLLMが含まれません。OpenAI互換のAPIエンドポイントを持つプロバイダを別途接続します。

hermes model

このコマンドはインタラクティブなプロバイダ選択メニューを開きます。サポートされる主要プロバイダは以下のとおりです。

Nous Portal（Hermesシリーズ含むNous Researchの公式エンドポイント）
OpenAI
Anthropic
OpenRouter（200以上のモデルを統一インターフェースで利用可能）
DeepSeek
Google AI（Gemini）
Hugging Face
カスタムOpenAI互換エンドポイント（自前のvLLM、LM Studio、Ollama等）

迷ったらまずOpenRouterを推奨します。1つのAPIキーで複数モデルを試せるため、検証コストが下がります。

Step 5. APIキーを設定する

選択したプロバイダのAPIキーを設定します。シークレット情報は自動的に~/.hermes/.envに書き込まれます。

hermes config set OPENROUTER_API_KEY sk-or-v1-xxxxxxxxxxxx

Anthropic公式の場合はOAuth認証も利用できます。

hermes model
# プロバイダ選択でAnthropicを選び、OAuthフローに従う

CI環境ではAPIキー、対話的に使う個人マシンではOAuthが扱いやすい、という使い分けが現実的です。

Step 6. モデル接続を確認する

設定が反映されたかをドクターコマンドで確認します。

hermes doctor

ここで「context window」項目が64,000トークン以上のモデルを指していることを必ず確認してください。Hermes Agentは多段ツール呼び出しのワーキングメモリを確保するため、これより小さいコンテキストのモデルは起動時に拒否されます。

たとえばgpt-4o-mini（128K）、claude-haiku-4-5（200K）、gemini-2.5-flash（1M）、deepseek-v3（128K）などは条件を満たします。逆に旧モデルで32Kや16Kのものを指定するとエラーで止まります。

Step 7. ターミナルバックエンドを選ぶ

Hermes Agentはエージェントがシェルコマンドを実行する場所（ターミナルバックエンド）を7種類から選べます。

バックエンド	用途	隔離度
local	開発・個人利用	なし
docker	安全なサンドボックス	フル（namespace隔離）
ssh	リモートサーバー	ネットワーク境界
modal	クラウドの一時VM	フル
daytona	マネージドクラウドワークスペース	フル
vercel_sandbox	クラウドmicroVM	フル
singularity	HPCクラスタ	namespace隔離

初回はlocalで動作確認し、本番運用や信頼境界をまたぐ用途ではdockerを選ぶのが定石です。config.yamlで次のように指定します。

terminal:
  backend: docker
  docker_image: ubuntu:24.04
  container_persistent: true
  docker_run_as_host_user: true

Step 8. config.yamlを調整する

主設定ファイルは~/.hermes/config.yamlにあります。最初に確認・調整すべき項目を抜粋します。

agent:
  max_turns: 90
  reasoning_effort: medium
  api_max_retries: 3

approvals:
  mode: manual  # manual | smart | off

compression:
  enabled: true
  threshold: 0.50
  target_ratio: 0.20
  protect_last_n: 20

memory:
  memory_enabled: true
  memory_char_limit: 2200
  user_char_limit: 1375

display:
  tool_progress: all
  streaming: true
  show_reasoning: false

設定値の優先順位は「CLI引数 → config.yaml → .env → ビルトイン既定値」の順で解決されます。シークレットは必ず.env、それ以外はconfig.yamlに書く、というルールを守ってください。

Step 9. TUIモードで起動する

設定が完了したらTUI（ターミナルUI）モードで起動します。

hermes --tui

会話履歴・現在実行中のツール・トークン消費量がリアルタイムで表示されます。最初はhermes（TUIなし）で動かす方法もありますが、TUIのほうが状況把握が容易なため、運用前検証ではTUIを推奨します。

Step 10. 最初のタスクを実行する

初回の動作確認には、副作用が小さく結果を検証しやすいタスクを選びます。たとえば次のような指示が手頃です。

このリポジトリを5つの箇条書きで要約してください

実行後、hermes --continueで同じセッションを再開できることを確認してください。これが成功すれば、永続記憶が正しく書き込まれています。

hermes --continue

ここまでで Hermes Agent の基本セットアップは完了です。

主要LLMプロバイダ比較

Hermes Agentに接続するLLMプロバイダの選定は、運用コスト・レイテンシ・モデル品質のトレードオフで決まります。代表的な選択肢を比較します。

プロバイダ	強み	弱み	想定用途
Nous Portal	Hermesシリーズに最適化、独自モデル群	提供モデルが限定的	公式推奨環境、検証用
OpenRouter	200+モデルを横断利用、課金一元化	中継分のわずかなレイテンシ	モデル選定フェーズ、本番運用
Anthropic	Claudeの高品質長文処理、200Kコンテキスト	コストはOpenRouter経由よりやや高め	長文・複雑タスク
OpenAI	GPT-5系の安定性、エコシステム	コストは中〜高	汎用、ツール利用が多いタスク
DeepSeek	圧倒的な低コスト、コーディング得意	一部のレギュレーションで利用制限	大量バッチ処理
Google AI	Gemini 2.5/3系の長文（1M）、マルチモーダル	エンタープライズ向け契約が必要な場合あり	長文資料解析
Hugging Face	OSSモデルを試せる	推論速度がプロバイダによる	OSSモデル評価
自前エンドポイント（vLLM等）	フルコントロール、データ秘匿	運用負荷	センシティブデータ案件

迷ったら「初期検証はOpenRouter」「本番はAnthropicまたはOpenAI」「センシティブデータは自前エンドポイント」の組み合わせが現実解になります。

設定ファイル(config.yaml)の主要項目

~/.hermes/config.yamlで押さえておきたい設定ブロックを4つ取り上げます。

モデル設定（auxiliary）

メインの会話モデルとは別に、ビジョン処理・Web抽出・会話圧縮を別モデルにルーティングできます。コスト最適化に効きます。

auxiliary:
  vision:
    provider: openrouter
    model: openai/gpt-4o
    timeout: 120
  compression:
    provider: openrouter
    model: google/gemini-3-flash-preview

圧縮や軽量タスクには高速・低コストのモデル、推論本体には高品質モデル、と役割分担するのが王道です。

圧縮設定（compression）

長い会話を自動圧縮してコンテキスト上限内に収めます。

compression:
  enabled: true
  threshold: 0.50      # コンテキスト上限の50%で圧縮開始
  target_ratio: 0.20   # 直近20%を非圧縮で残す
  protect_last_n: 20   # 最低20メッセージは圧縮しない

圧縮対象が大きすぎると重要情報が失われ、小さすぎるとコストが下がりません。0.50起点で運用しながら調整するのがおすすめです。

承認モード（approvals）

エージェントがコマンド実行する前に承認を求める粒度を決めます。

manual：すべての実行で対話的に承認を求める（最も安全、初期推奨）
smart：LLMがリスクを判定し、安全な操作は自動承認する
off：承認チェックを無効化（自動化用途、危険性を理解したうえで）

approvals:
  mode: smart  # manual | smart | off

業務用途ではsmartを基本にし、危険コマンドだけ手動承認、という運用が現実的です。Tirithによるコマンドスキャンを併用するとさらに堅牢になります。

security:
  tirith_enabled: true
  tirith_timeout: 5

メモリ設定（memory）

セッションをまたいで保持する記憶量を制御します。

memory:
  memory_enabled: true
  memory_char_limit: 2200  # 約800トークン
  user_char_limit: 1375    # 約500トークン

メモリ容量を増やすほどコンテキスト使用量も増えるため、頻繁に参照する重要情報だけを残す方針が、長期運用ではコスト効率が良くなります。

つまずきやすい5つのポイント

実際の導入で詰まりやすいポイントを先回りで挙げます。

1つ目は64Kコンテキスト要件の見落としです。古いモデルや軽量モデルを指定して起動失敗するケースが頻発します。hermes doctorで必ずコンテキストサイズを確認してください。

2つ目はAPIキーを0に書いてしまうことです。シークレットは.env、それ以外はconfig.yamlが原則になります。逆に書くと環境共有時の事故につながります。

3つ目は0の飛ばし忘れです。pipインストール時にPlaywrightやffmpegが入らず、Web操作・動画処理タスクが落ちます。後から走らせれば復旧できます。

4つ目は承認モードをいきなりoffにする運用です。初回からoffで動かすと、意図しないファイル変更やコマンド実行のリスクが高くなります。manualかsmartで運用開始するのが定石です。

5つ目はターミナルバックエンドをlocalのまま本番運用することです。エージェントがホストマシン全体にアクセスできてしまいます。本番ではdocker・modal・vercel_sandboxなどのサンドボックス系に切り替えてください。

トラブルシューティング

問題発生時の調査順序は次のとおりです。

hermes doctor    # 環境チェック（プロバイダ接続、依存ツール、コンテキスト要件）
hermes model     # モデル設定を再選択
hermes setup     # 全体を再構成

頻出するエラーと対処を整理します。

症状	主な原因	対処
`Context window too small`	64Kに満たないモデルを指定	より大きいモデルへ変更
`Authentication failed`	APIキー誤りまたは期限切れ	`hermes config set` で再設定
`Tool not found: ripgrep`	postinstall未実行	`hermes postinstall` を実行
`Browser launch failed`	Playwrightブラウザ未取得	`playwright install` を手動実行
`Memory write error`	`~/.hermes/` への書き込み権限不足	所有権を自ユーザーに変更

公式のGitHub IssuesとDiscordコミュニティに既知の問題と対処が蓄積されています。ローカルで解決しない場合はそちらを参照してください。

まとめ

Hermes Agentの設定方法は、インストール → LLMプロバイダ接続 → config.yaml調整の3工程に整理できます。10ステップの手順を順番に踏めば、永続記憶と自己改善ループを備えた自律型AIエージェントを自前環境で動かせます。

判断ポイントは「LLMプロバイダの選択」と「ターミナルバックエンドの選択」の2つ。ここを誤ると、あとから運用コストやセキュリティ面で痛みが出ます。初回検証はOpenRouter + localで素早く立ち上げ、本番運用ではプロバイダを用途別に最適化し、バックエンドをdockerなどのサンドボックスに切り替える、という二段構えが現実的です。

導入後は、エージェントに任せるタスクの粒度を徐々に広げながら、自動生成されるスキルと永続記憶を観察するフェーズに移ります。Hermes Agentのおもしろさは「育てるほど賢くなる」という設計思想にあるので、初日の設定よりも、数週間から数か月の運用で蓄積される個別記憶のほうが、長期の投資対効果を決めると感じています。

FAQ

Q1. Hermes AgentはClaude CodeやCodex CLIの代替になりますか？ コーディング特化用途では、現時点でClaude CodeやCodex CLIのほうが成熟しています。Hermes Agentの強みは汎用タスクの長期常駐と永続記憶にあるため、Slackボット化・リサーチアシスタント・定型業務の委任といった用途で補完関係として併用するのが現実的です。

Q2. 完全にオフライン環境で動かせますか？ LLM部分を自前のvLLMやOllamaなどローカル推論サーバーに接続し、ターミナルバックエンドをlocalにすれば、外部通信なしで動作します。ただし64Kコンテキストを満たすローカルモデルの選定が必要で、ハードウェア要件が高い点に注意してください。

Q3. 商用利用は可能ですか？ Hermes Agent本体はMITライセンスで配布されているため商用利用は可能です。ただし接続するLLMプロバイダの利用規約は別途確認する必要があります（OpenAI、Anthropic、各社のAPI利用規約が適用されます）。

Q4. APIコストはどの程度かかりますか？ 利用するLLMプロバイダとタスクの複雑さに依存するため一概には言えません。検証段階ではOpenRouter経由でDeepSeekやGemini Flashなどの低コストモデルを使えば月数ドル規模に収まります。本番運用でClaude OpusやGPT-5系を使う場合は月数十〜数百ドルの予算感が目安になります。

Q5. Windows環境でも安定して動きますか？ WSL2上での動作は安定しています。PowerShellネイティブは早期ベータ段階のため、トラブルが出やすい状況です。WindowsユーザーはWSL2 + Ubuntu/Debianの構成を選ぶのが安全です。

Q6. 永続記憶はどこに保存されますか？データの管理は？ ~/.hermes/memories/配下にMarkdownファイルとFTS5全文検索インデックスが保存されます。すべてローカルファイルなので、バックアップ・移行は通常のファイルコピーで完結します。複数マシン間で同期したい場合は、ディレクトリごとgit管理またはクラウドストレージ同期に乗せる運用が一般的です。

Q7. プロファイル機能とは何ですか？ 複数のエージェント人格・設定セットを切り替えて使う仕組みです。プロファイルごとに独立したconfig、memory、sessions、skills、gateway serviceを持つため、業務用・個人用・プロジェクト別といった使い分けが可能になります。トークンロック隔離により、プロファイル間の認証情報衝突は発生しません。