Engineering · アーキテクチャ

agens のコンテキスト管理・メモリ設計 — 長い仕事を“軽いまま”やり切る

AIに長い作業を任せるほど効いてくるのが、コンテキスト(文脈)の扱い。agens は要約・サブエージェント・フォルダへの書き出しで文脈を“軽いまま”保ち、長い仕事を最後までやり切ります。

要点

  • コンテキスト(文脈)は有限の資源。詰め込むほど一つひとつへの注意が薄まり、取りこぼしが増える(context rot)。
  • 要約(compaction)=上限が近づいたら会話を高精度に要約し、新しい文脈で続ける。
  • サブエージェント=調べ物などを別の作業者に任せ、戻すのは1〜2千トークンの要約だけ。まとめ役の文脈を汚さない。
  • 成果は会話の外(フォルダ)に資産として書き出し、途中経過を持ち越す。
  • 「複数の文脈をまたいで一貫して進める」のは業界でも未解決の難所(Anthropic, 2025-11)。agens はフォルダ+要約で現実解を取る。

長い仕事ほど、文脈の“重さ”が効いてくる

AIは、渡された文脈(これまでのやり取り・資料・指示)を手がかりに次の一手を決めます。ところが Anthropic が指摘するとおり、文脈は『有限の資源』です。モデルには“注意の予算”があり、入力トークンが増えるほど一つひとつへの注意は薄まる——長文ほど取りこぼしが増える現象は『context rot』として知られています(Chroma の研究、2025)。

だから agens は、文脈に何でも詰め込むのではなく、“いま必要な分だけ”を保つように設計しています。長い作業ほど、この管理が成果の質を左右します。

上限が来ても、要約して続ける

満杯に近い文脈履歴が積み上がる要約要約高精度に圧縮新しい文脈=軽い要約+空きで続行上限が来ても“軽いまま”長い作業を続けられる
満杯に近い文脈を高精度に要約(compaction)し、新しい軽い文脈として続行する。上限が来ても“軽いまま”作業を続けられる。

調べ物は“別の作業者”に任せる

もうひとつの要が、サブエージェントです。調査や下調べのような“文脈を大量に消費する作業”を別の作業者に切り出し、本体(まとめ役)の文脈を汚さないようにします。

サブエージェントは自分の作業の中で数万トークンを使っても、まとめ役に戻すのは凝縮した要約(多くは1〜2千トークン)だけ。こうしてまとめ役は全体像に集中でき、長く・大きな仕事でも破綻しにくくなります。

サブエージェントで文脈を汚さない

まとめ役文脈は軽いまま① 役割を分けて任せるサブエージェントA調査:数万トークン消費サブエージェントB調査:数万トークン消費サブエージェントC実装:数万トークン消費戻すのは“要約”だけ(1〜2千トークン)→ まとめ役の文脈は汚れない
まとめ役が役割を分けて任せ、各サブエージェントは数万トークンを使っても戻すのは1〜2千トークンの要約だけ。まとめ役の文脈は軽いまま保たれる。

成果は会話の外に、資産として残す

文脈は有限でも、成果は消したくありません。agens は作業の成果や中間生成物を、会話の中ではなく会社のフォルダ(Folders / Files)に資産として書き出します。

これは“持ち越せる記憶”として効きます。長い作業の途中経過をフォルダに残しておけば、文脈を入れ替えても続きから再開でき、別の担当者やタスクが同じ資産を再利用できます。会話が消えても、仕事の成果は会社に残ります。

長時間タスクは、業界でも難所

Anthropic は2025年11月、「複数の文脈をまたいで一貫して前進させるのは、いまだ未解決の課題」と率直に認めています(高い能力のモデルでも、ひと言の指示だけで長大な制作をやり切るのは難しい)。だからこそ要約・サブエージェント・フォルダへの書き出しといった“文脈を軽く保つ”工夫が要になります。agens はこの現実解を最初から組み込んでいます。

よくある質問

長い作業の途中で、AIが文脈を見失いませんか?
上限が近づくと会話を高精度に要約(compaction)して新しい文脈で続け、調べ物はサブエージェントに切り出してまとめ役の文脈を軽く保ちます。成果はフォルダに書き出すため、途中経過も持ち越せます。
サブエージェントとは何ですか?
本体(まとめ役)が、文脈を大量に使う作業を別の作業者に任せる仕組みです。サブエージェントは自分の中で多くのトークンを使っても、戻すのは凝縮した要約だけ。まとめ役の文脈を汚さずに大きな仕事を分担できます。
過去の作業の続きを、後からやらせられますか?
はい。成果や中間生成物を会社のフォルダに資産として残すため、文脈を入れ替えても続きから再開でき、別の担当者やタスクが同じ資産を再利用できます。
なぜ文脈を“軽いまま”保つことが大事なのですか?
モデルには“注意の予算”があり、文脈を詰め込むほど一つひとつへの注意が薄まって取りこぼしが増えるためです(context rot)。必要な分だけを保つほうが、長い作業でも品質を維持できます。

最終更新: 2026-06