Engineering · 連携

agens が大量のツールでも“軽く”動く理由 — ツールの見つけ方と、結果をモデルに渡さない設計

つなぐツールが増えるほど、ツールの“説明書き”だけで文脈が溢れます。agens は必要なツールだけをオンデマンドで見つけ、生データは実行環境の中で絞ってモデルに渡さないことで、大量のツールでも軽く・安全に動きます。

要点

  • ツールをつなぐほど、ツールの“説明書き(定義)”だけで文脈(コンテキスト)が膨らむ。Anthropic の例では58のツール定義で会話前に約55,000トークンを消費(最大13万超の例も)。
  • 解は「ツールを減らす」ではなく「必要なツールだけをオンデマンドで見つける」。Anthropic の一例では約85%のトークン削減。
  • 生データや中間結果は実行環境の中で絞り、モデルには最終結果だけを渡す——これは速さだけでなく“機密データをLLMに渡さない”データ主権にも効く。
  • agens は MCP(サーバー・クライアント両対応)で200を超えるツールへゼロ構築接続。コード実行で必要な分だけ扱う設計と相性がよい。
  • ツールの“応答の作り方”も大事。返す情報量を選べるようにし、上限を設ける。これは agens の社内ツール/コネクタ設計にも通じる。

つなぐツールが増えるほど、文脈が“説明書き”で埋まる

AIに業務を任せるには、会社のツールにつながっている必要があります。けれど、つなぐツールが増えるほど見落とされがちな問題があります。AIが作業を始める前に、すべてのツールの“説明書き(どう呼ぶか、何を渡すか)”を読み込むだけで、文脈(コンテキスト)が埋まってしまうのです。

Anthropic は2025年11月の記事で、5つの連携先・計58のツールをつなぐと、会話を始める前に約55,000トークンを説明書きが消費し、最適化前には134,000トークンに達した例もある、と報告しています(Anthropic「Introducing advanced tool use」2025-11-24)。文脈は有限の資源なので、これは無視できません。

解は「減らす」でなく「必要な分だけ見つける」

従来:ツール定義を全部先に読むツール定義 ×多数会話の前に全ロードコンテキスト定義で埋まる一例で約 55,000 トークン読む前から文脈を消費(最大13万超の例も)オンデマンド発見:必要な分だけ必要なツールだけ探す見つけてから読むコンテキスト軽いまま約 8,700 トークン約85%削減(Anthropic の一例)
全ツールの説明書きを先に読むと文脈が溢れる(一例で約55,000トークン)。必要なツールだけをオンデマンドで見つければ、文脈は軽いまま保てる(同じ例で約8,700トークン=約85%削減、Anthropic 報告)。

agens は“ゼロ構築”でつなぎ、必要な分だけ呼ぶ

agens は MCP(Model Context Protocol)という共通規格で、200を超えるツールへ個別開発なしに接続します。MCP のクライアントとサーバーの両方に対応し、社内の独自システムも同じ作法で結べます。

そのうえで効くのが、「全部を先に読む」のではなく「必要なツールだけをオンデマンドで見つけて読む」発想です。Anthropic の一例では、この方式でツール定義のトークンを約85%削減できたと報告されています。つなぐツールが多いほどAIが選び間違える確率も上がるため、OpenAI も『必要なツールだけを与え、動的に絞る』ことを勧めています。ツールをコードとして扱い必要な分だけ読み込む考え方は、Cloudflare も「Code Mode」として、研究者の Joel Pobar も先行例として示しており、業界で共有されつつある設計です。

生データは、モデルに渡さない

もうひとつの要点は、ツールが返す“生データ”をそのままモデルに渡さないことです。1万行のデータを全部モデルに読ませる必要はありません。実行環境(サンドボックス)の中でフィルタや集計をかけ、モデルには絞った結果だけを渡す。中間結果は実行環境にとどめておけます。

これは速さやコストのためだけではありません。機密データや個人情報をモデルに渡さずにワークフローを流せる——つまりデータ主権の観点でも効きます。Anthropic は、実行環境の中で個人情報を伏せ字(プレースホルダ)に置き換えてからモデルに渡す、という設計パターンも示しています(出荷済みの固定機能ではなく、コード実行で“実現できる”パターンとしての提示です)。agens は実行をサンドボックスに閉じ込め、オンプレミスや国内リージョンで完結させられるため、この“データを外に出さない”設計と相性がよいのです。

機密データを外に出さずにワークフローを流す

AI モデル結果だけ見る実行環境(サンドボックス)フィルタ:1万行 → 5行個人情報は伏せ字に中間結果はここに留まるモデルに渡すのは最終結果だけ絞った結果社内データ1万行・個人情報連携先システム基幹 / SaaS実データ機密データをモデルに渡さず、実行環境の中だけで扱える(オンプレ/国内リージョンと好相性)
生データは実行環境の中で絞り・伏せ字にし、モデルには最終結果だけを渡す。実データはモデルを通らずに連携先へ流れるため、機密情報を外に出さずワークフローを回せる。

ツールの“応答の作り方”も設計のうち

つなぐ側だけでなく、ツールそのものの作り方も効いてきます。Anthropic は、ツールに『詳しく返す/簡潔に返す』を選べる仕組みを持たせ、文脈の予算に応じて情報量を選べるようにすることを勧めています。また Claude Code では、ツールの応答を既定で25,000トークンに制限し、長すぎる結果はページ送りや絞り込みで返すようにしています(Anthropic「Writing effective tools for agents」2025-09-11)。

同じ考え方は、agens が社内ツールや基幹システムを MCP でつなぐときのコネクタ設計にも通じます。「エージェントが迷わず、必要な分だけ受け取れる」ようにツールを整えることが、大量のツールをつないでも軽く・確実に動く土台になります。

数値はいずれも各社の測定値です

本記事の『約55,000トークン』『約85%削減』『25,000トークン上限』などは、いずれも Anthropic が自社の例や製品について報告した値で、測っている対象(ツール定義の量/特定構成での削減幅/応答の上限)はそれぞれ異なります。agens の実績値ではありません。agens 側で実装しているのは、MCP のサーバー・クライアント両対応、200を超えるツールへのゼロ構築接続、サンドボックス内での実行と監査で、ここに『必要な分だけ呼ぶ/結果を実行環境で絞る』という設計を重ねています。

よくある質問

ツールをたくさんつなぐと、AIは遅く・不安定になりませんか?
つなぐツールが増えると、その“説明書き”だけで文脈が膨らみます。agens は必要なツールだけをオンデマンドで見つけて読み込み、生データは実行環境の中で絞ってモデルに渡すため、大量のツールでも軽いまま動けます。
agens はどうやって200を超えるツールにつなぐのですか?
MCP(Model Context Protocol)という共通規格を使い、個別開発なしで接続します。サーバー・クライアントの両方に対応し、社内の独自システムも同じ作法で結べます。対応ツールは統合(Integrations)ページをご覧ください。
機密データや個人情報をAIに渡さずに使えますか?
生データは実行環境(サンドボックス)の中で絞り・伏せ字にし、モデルには最終結果だけを渡せます。実データはモデルを通らずに連携先へ流せるため、機密情報を外に出さずワークフローを回せます。オンプレミスや国内リージョンで完結させることもできます。
「約85%削減」などの数値は agens の実績ですか?
いいえ。本記事の数値はいずれも Anthropic などが自社の例について報告した値で、測っている対象も異なります。agens の実績値ではなく、設計の考え方を裏づける外部事例として引用しています。

最終更新: 2026-06