Engineering · アーキテクチャ

agens のコンテキスト管理・メモリ設計 — 長い仕事を“軽いまま”やり切る

AIに長い作業を任せるほど効いてくるのが、コンテキスト(文脈)の扱い。agens は要約・サブエージェント・フォルダへの書き出しで文脈を“軽いまま”保ち、長い仕事を最後までやり切ります。

要点

  • コンテキスト(文脈)は有限の資源。詰め込むほど一つひとつへの注意が薄まり、取りこぼしが増える(context rot)。
  • 要約(compaction)=上限が近づいたら会話を高精度に要約し、新しい文脈で続ける。
  • サブエージェント=調べ物などを別の作業者に任せ、戻すのは1〜2千トークンの要約だけ。まとめ役の文脈を汚さない。
  • 成果は会話の外(フォルダ)に資産として書き出し、途中経過を持ち越す。
  • 文脈は“盛る”のではなく“絞る”。最も濃い情報の最小集合を選ぶ——指示は『適切な高度』に、ツールは最小限に(Anthropic)。
  • 必要な資料は先回りで全部渡さず、軽い目印を辿って必要なときに取りに行く(just-in-time)。agens は社内フォルダの索引で実現し、外部ベクタDBに依存しない。
  • 「複数の文脈をまたいで一貫して進める」のは業界でも未解決の難所(Anthropic, 2025-11)。agens はフォルダ+要約で現実解を取る。

長い仕事ほど、文脈の“重さ”が効いてくる

AIは、渡された文脈(これまでのやり取り・資料・指示)を手がかりに次の一手を決めます。ところが Anthropic が指摘するとおり、文脈は『有限の資源』です。モデルには“注意の予算”があり、入力トークンが増えるほど一つひとつへの注意は薄まる——長文ほど取りこぼしが増える現象は『context rot』として知られています(Chroma の研究、2025)。

だから agens は、文脈に何でも詰め込むのではなく、“いま必要な分だけ”を保つように設計しています。長い作業ほど、この管理が成果の質を左右します。

コンテキストは“盛る”のではなく“絞る”

ここで効いてくるのが、コンテキストエンジニアリング——『望む結果につながる、最小で“濃い”情報だけを選ぶ』という設計です。Anthropic はこれを『最も高シグナルなトークンの最小集合を見つけること』と表現します。たくさん渡すほど賢くなるのではなく、むしろ余計な情報がノイズになる。だから“盛る”のではなく“絞る”のが基本です。

絞り方は2つあります。ひとつは指示(システムプロンプト)の“高度”を合わせること。細かすぎて脆いルールでも、曖昧すぎる指示でもない、ちょうどいい中間(Anthropic の言う『適切な高度』)を狙います。もうひとつは、道具(ツール)を盛りすぎないこと。Anthropic は『人間の担当者でもどのツールを使うべきか即断できないなら、AIにはなおさら無理だ』として、役割の重ならない最小限のツール集合を勧めています(つなぐツールが増えるほど文脈を食う話は「大量ツールの文脈設計」で詳しく扱っています)。

agens が“軽いまま賢く動く”のは、この『絞る』を最初の前提に置いているからです。

上限が来ても、要約して続ける

満杯に近い文脈履歴が積み上がる要約要約高精度に圧縮新しい文脈=軽い要約+空きで続行上限が来ても“軽いまま”長い作業を続けられる
満杯に近い文脈を高精度に要約(compaction)し、新しい軽い文脈として続行する。上限が来ても“軽いまま”作業を続けられる。

調べ物は“別の作業者”に任せる

もうひとつの要が、サブエージェントです。調査や下調べのような“文脈を大量に消費する作業”を別の作業者に切り出し、本体(まとめ役)の文脈を汚さないようにします。

サブエージェントは自分の作業の中で数万トークンを使っても、まとめ役に戻すのは凝縮した要約(多くは1〜2千トークン)だけ。こうしてまとめ役は全体像に集中でき、長く・大きな仕事でも破綻しにくくなります。

サブエージェントで文脈を汚さない

まとめ役文脈は軽いまま① 役割を分けて任せるサブエージェントA調査:数万トークン消費サブエージェントB調査:数万トークン消費サブエージェントC実装:数万トークン消費戻すのは“要約”だけ(1〜2千トークン)→ まとめ役の文脈は汚れない
まとめ役が役割を分けて任せ、各サブエージェントは数万トークンを使っても戻すのは1〜2千トークンの要約だけ。まとめ役の文脈は軽いまま保たれる。

成果は会話の外に、資産として残す

文脈は有限でも、成果は消したくありません。agens は作業の成果や中間生成物を、会話の中ではなく会社のフォルダ(Folders / Files)に資産として書き出します。

これは“持ち越せる記憶”として効きます。長い作業の途中経過をフォルダに残しておけば、文脈を入れ替えても続きから再開でき、別の担当者やタスクが同じ資産を再利用できます。会話が消えても、仕事の成果は会社に残ります。

全部を先に渡さず、必要なときに取りに行く

文脈を軽く保つ要点が、もうひとつあります。必要になりそうな資料を“先回りで全部”渡しておくのではなく、必要になったときに必要な分だけ取りに行く——『just-in-time(必要なときに)』という考え方です。Anthropic は、エージェントにファイルパスや保存したクエリ、リンクといった“軽い目印”だけを持たせ、実行時にそれを辿って必要なデータを読み込む方式を勧めています。人が何でも暗記せず、索引やフォルダを引くのと同じ発想です。

agens のフォルダ(Folders / Files)は、まさにこの“目印”として働きます。社内フォルダの索引を辿って必要な分だけ取りに行けるので、外部のベクタDBに大量のデータを事前に流し込んでおく必要がありません。これはデータを社外に出したくない現場——オンプレミスや国内リージョン——との相性もよい設計です。Anthropic の言う『動く範囲でいちばん単純なやり方を選ぶ』を、地で行く形になります。

必要なときに、必要な分だけ取りに行く

事前に全部を埋め込む資料を丸ごと先読み全部入れるコンテキスト重い・古くなりうる全部を先に抱える必要なときに取りに行く軽い識別子を持つパス・クエリ・リンク必要な分だけ実行時に取得コンテキスト軽い・最新agens は社内フォルダの索引を辿り、必要な分だけ取得(外部のベクタDBに依存しない)
必要になりそうな資料を先回りで全部抱えると文脈は重く・古くなりがち。軽い識別子(パス・クエリ・リンク)を持って必要なときに取りに行けば、文脈は軽く・最新に保てる。agens は社内フォルダの索引を辿って必要分だけ取得する。

長時間タスクは、業界でも難所

Anthropic は2025年11月、「複数の文脈をまたいで一貫して前進させるのは、いまだ未解決の課題」と率直に認めています(高い能力のモデルでも、ひと言の指示だけで長大な制作をやり切るのは難しい)。だからこそ要約・サブエージェント・フォルダへの書き出しといった“文脈を軽く保つ”工夫が要になります。agens はこの現実解を最初から組み込んでいます。

よくある質問

長い作業の途中で、AIが文脈を見失いませんか?
上限が近づくと会話を高精度に要約(compaction)して新しい文脈で続け、調べ物はサブエージェントに切り出してまとめ役の文脈を軽く保ちます。成果はフォルダに書き出すため、途中経過も持ち越せます。
サブエージェントとは何ですか?
本体(まとめ役)が、文脈を大量に使う作業を別の作業者に任せる仕組みです。サブエージェントは自分の中で多くのトークンを使っても、戻すのは凝縮した要約だけ。まとめ役の文脈を汚さずに大きな仕事を分担できます。
過去の作業の続きを、後からやらせられますか?
はい。成果や中間生成物を会社のフォルダに資産として残すため、文脈を入れ替えても続きから再開でき、別の担当者やタスクが同じ資産を再利用できます。
なぜ文脈を“軽いまま”保つことが大事なのですか?
モデルには“注意の予算”があり、文脈を詰め込むほど一つひとつへの注意が薄まって取りこぼしが増えるためです(context rot)。必要な分だけを保つほうが、長い作業でも品質を維持できます。
文脈はたくさん渡すほど賢くなりますか?
いいえ。むしろ余計な情報がノイズになり、取りこぼしが増えます。Anthropic は『最も濃い情報の最小集合を選ぶ』ことを勧めています。agens も“盛る”のではなく“絞る”——指示は適切な高度に、ツールは最小限に——を前提に設計しています。
大量の資料を事前に取り込まないと答えられませんか?
必ずしも必要ありません。agens は社内フォルダの索引という“軽い目印”を辿り、必要なときに必要な分だけ取りに行けます(just-in-time)。外部のベクタDBに事前に流し込む必要がなく、オンプレミスや国内リージョンとも相性のよい設計です。

最終更新: 2026-06