Engineering · アーキテクチャ

agens を動かすエージェントハーネス — 2026年の実行基盤の全体像

エージェントハーネスとは、AIモデル(頭脳)に実行ループ・ツール・実行環境・記憶・統制を与える『仕事のための環境一式』。agens は、この一式を業務で安全に使えるかたちに束ねた製品です。

要点

  • AIモデル単体は『考えて答える』だけ。業務を最後までやり切るには、周りの“環境一式”=ハーネスが要る。
  • 2026年、主要各社の設計は同じ要素に収束した:実行ループ/ツール(MCP)/実行環境(サンドボックス)/メモリ・コンテキスト/サブエージェント/検証・統制。
  • 中核は「文脈を集める→行動する→結果を確かめる→繰り返す」という実行ループ(Anthropic の整理)。
  • コンテキスト(文脈)は有限の資源。agens は要約(compaction)やサブエージェントで“軽いまま”長い仕事を回す。
  • agens の違いは、この一式を日本企業の統制要件(監査・権限分離・国内データ)まで含めて束ねている点です。

agens が、AIモデルに『仕事の環境』を与える

高性能なAIモデルは、質問に答え、文章やコードを書ける『頭脳』です。けれど、頭脳だけでは会社の仕事は終わりません。請求書を処理する、データを更新する、レポートを作って共有する——どれもツールを操作して初めて完了します。

agens は、AIモデルに『手・作業場・記憶・統制』を与えてこの差を埋めます。この“仕事のための環境一式”を、エージェントハーネス(エージェンティックハーネス)と呼びます。頭脳がモデルなら、ハーネスは作業机・道具箱・ノート・記録係をまとめた仕事場のことです。

Anthropic はエージェントを「自分で手順を決め、ツールを使い、どう達成するかを自分で握るシステム」と定義し、その土台を『拡張されたLLM(検索・ツール・記憶を備えたモデル)』と整理しています(2024-12「Building effective agents」)。agens は、この土台に企業向けの統制を足したものだと考えると分かりやすいです。

ハーネスは何でできているか

エージェントハーネス(agens)モデルに「手・作業場・記憶・統制」を与える一式AI モデル(頭脳)実行ループ計画→実行→検証メモリ・コンテキスト記憶と文脈を管理サブエージェント役割分担・並列ツール使用MCP でツール操作実行環境サンドボックス検証・統制eval・承認・監査→ 自律的に、でも安全に業務を実行
AIモデル(頭脳)を中心に、実行ループ・ツール使用・実行環境(サンドボックス)・メモリ/コンテキスト・サブエージェント・検証/統制が囲む。agens はこの一式を束ねている。

中核は「集める→行動→確かめる」の繰り返し

ハーネスの心臓部は、実行ループです。Anthropic は Claude Code の動きを「文脈を集める → 行動する(ツールを実行)→ 結果を確かめる → 繰り返す」という反復として整理し、これは他のエージェントにも通じる考え方だとしています。

鍵は、各ステップで“環境からの手応え(ground truth)”を得ること。ツールの実行結果やコードの出力という事実を見て、AIは次の一手を決めます。だから agens は、操作をサンドボックスの中で実際に走らせ、結果を確かめながら前に進みます——『たぶんこうなるはず』の推測で突き進ませません。

確かめながら、最後までやり切る

未達なら繰り返す① 文脈を集める指示・記憶・データ② 行動するツールを実行③ 確かめる結果を検証完了成果を会社資産へ監査ログに記録
目標に達するまでループし、完了したら成果を会社の資産として残す。各ステップの結果を確かめながら進むのが実行型の特徴。

2026年、各社の設計は同じ形に近づいた

この『ハーネス』という捉え方は、2025〜2026年に業界の共通言語になりました。Anthropic は2025年9月、開発キットの名称を Claude Code SDK から Claude Agent SDK へ改め、「汎用のエージェントハーネス」と位置づけ直しています。OpenAI も2026年4月、Agents SDK に『モデルネイティブなハーネス』と『ネイティブのサンドボックス実行』を導入し、ハーネスと実行環境(compute)を分離する設計を打ち出しました。

各社の部品立てはよく似ています——ツール接続はMCP、能力の動的読み込み(スキル)、作業の実行環境(サンドボックス)、記憶・コンテキスト管理。agens も同じ土台に立っています。違うのは、その上に日本企業の統制要件を最初から組み込んでいる点です。

長い仕事をこなす鍵は『コンテキスト管理』

AIに長い作業を任せるほど、効いてくるのがコンテキスト(文脈)の扱いです。Anthropic はコンテキストを『有限の資源』と表現します。モデルには“注意の予算”があり、入力トークンが増えるほど一つひとつへの注意は薄まる——長文ほど取りこぼしが増える現象は『context rot』として知られています(Chroma の研究、2025)。

agens は要約(compaction)やサブエージェントで文脈を“軽いまま”保ち、成果は会話の外(フォルダ)に資産として書き出して持ち越します。その詳しい設計は「コンテキスト管理・メモリ設計」で解説します。

agens がハーネスとして束ねるもの

能力はスキルで足し(→ スキルの設計)、ツール接続はMCPで(→ MCP接続設計)、記憶は要約とフォルダで(→ コンテキスト管理・メモリ設計)、実行は使い捨てのサンドボックスで(→ サンドボックス実行)、安全と統制は多層防御と権限分離で(→ セキュリティ設計/統制・権限分離)。一般的な『AIエージェントとは/構成要素』の解説は homula.jp の学習ガイドが詳しいので、そちらへリンクしています。

よくある質問

なぜAIモデルだけでは業務が回らないのですか?
モデルは考えて答えるところまでで、ツールを操作しません。実際の業務はツールを動かして初めて完了します。agens はモデルに実行ループ・ツール・実行環境・記憶・統制を与え、業務そのものを完了させます。
長時間の作業でも文脈が壊れませんか?
要約(compaction)とサブエージェントで文脈を“軽いまま”保ち、成果は会話の外(フォルダ)に書き出して持ち越します。長い作業ほどコンテキスト管理が品質を左右するため、agens はここを設計の中心に置いています。
他社のエージェント基盤と何が違うのですか?
部品立て(実行ループ・MCP・サンドボックス・記憶)は各社で似てきています。agens の違いは、その上に監査・権限分離・操作の巻き戻し・国内データといった日本企業の統制要件を最初から組み込んでいる点です。
エージェントハーネスとは何ですか?
AIモデル(頭脳)に、実行ループ・ツール・実行環境・記憶・統制といった『仕事のための環境一式』を与える仕組みです。基礎概念は homula.jp の学習ガイドで体系的に解説しています。

最終更新: 2026-06