Engineering · アーキテクチャ

AIが書くオーケストレーション — ダイナミック・ワークフローと“数百のサブエージェント”の設計

AIがオーケストレーションのプログラムを自分で書き、数百のサブエージェントをバックグラウンドで並行に動かす——Claude Opus 4.8が示した『ダイナミック・ワークフロー』、その設計を解説します。

要点

  • ダイナミック・ワークフロー(Anthropic、2026-05-28)は、Claudeがオーケストレーションのスクリプトを生成し、バックグラウンドランタイムが数百のサブエージェントを並行・非同期に実行する仕組み(現在 research preview)。
  • 1セッションで数百のサブエージェントが並行で動く一方、セッション自体はレスポンシブなまま保たれる(Anthropic は具体的なエージェント数の上限値を公表していない)。
  • 従来の『静的な並列割り当て』と異なり、問題の形に応じてオーケストレーションを動的に組み立てる——渡すのは『手順』でなく『目標』。
  • 収束型反復:一部のエージェントが仮説を立て、別のエージェントが反論・検証。答えが収束するまで繰り返すことで信頼性が上がる。
  • Anthropic Engineering(2026-03-24)の知見:Planner/Generator/Evaluatorの役割分離、評価者はプロセスを見ない(サンクコストバイアスの排除)、Opus 4.6 でコンテキストリセットが不要化(SDK の自動 compaction が吸収)。

手順を指定するから、目標を渡すへ

並列エージェントの典型的な形は、人が事前にタスクをA・B・Cに分割して、それぞれのエージェントに固定で割り振る「静的な並列」です。誰が何をするかは、実行前に人が設計します。問題が明確で、分割の仕方が決まっている場合はこれで十分です。

ダイナミック・ワークフローは違います。Claudeに「目標」と「合格の定義(どこで完了とみなすか)」を渡すと、Claudeがオーケストレーションのプログラム(スクリプト)を自ら書きます。そのプログラムがバックグラウンドランタイムで実行され、問題の形に応じてサブエージェントを動的に展開します。

手順を事前に完璧に設計しなくてよくなる——それがダイナミック・ワークフローの根本的な変化です。代わりに明確にすべきは「何を達成するか」という目標と「合格の条件は何か」という収束の定義です。

目標を渡すと、手順はAIが組み立てる

静的な並列割り当て人が事前に分割手順を指定AI AAI BAI C固定タスクを担当ダイナミック・ワークフロー目標を渡すClaudeがスクリプト生成動的に展開AI ①AI ②AI ③収束・成果目標に応じて1セッションで数百のサブエージェント
左の静的並列は人が事前にA/B/Cに分割して固定割り当てする。右のダイナミック・ワークフローはClaudeが目標を受け取ってスクリプトを生成し、サブエージェントが動的に展開・収束する(1セッションで数百規模)。

Claude Opus 4.8 のダイナミック・ワークフロー(Anthropic、2026-05-28)

Anthropicは2026年5月28日、Claude Opus 4.8の発表とともに「ダイナミック・ワークフロー(dynamic workflows)」を研究プレビュー(research preview)として公開しました。Enterprise/Team/Max プランの Claude Code が対象です。

仕組みはこうです。タスクを説明するとClaudeがオーケストレーション・スクリプトを生成し、バックグラウンドランタイムがそのスクリプトを実行します。セッション自体はその間もレスポンシブな状態を保ちます——タスクが裏で動いている間も、別の指示を出したり進捗を確認したりできます。

Anthropic は「1セッションで数百のサブエージェントを並行に走らせ」、「コードベース規模の移行(数十万行規模)を、開始からマージまで、既存のテストスイートを基準にこなせる」と報告しています(2026-05-28。具体的なエージェント数の上限値は公表されていません)。一部のエージェントが仮説を立て、別のエージェントがそれを反論・検証する——答えが収束するまで繰り返すことで、信頼性の高い成果を生み出します。

AIがプログラムを書き、数百のサブエージェントが動く

あなた目標を渡すClaudeスクリプトを生成ランタイムバックグラウンド実行セッションレスポンシブ数百を並行に展開エージェント①エージェント②エージェント③収束・成果を返す答えが揃ったら完了数百のサブエージェントを並行実行(1セッション)
あなたが目標を渡すとClaudeがスクリプトを生成し、バックグラウンドランタイムが数百のサブエージェントを並行に展開する。セッションはレスポンシブなまま。答えが収束するまで動き続ける(Anthropic 2026-05-28。具体的な上限値は非公表)。

長時間自律実行を成立させる3つの要(Anthropic Engineering、2026-03-24)

Anthropicは2026年3月24日、「Harness design for long-running application development」(anthropic.com/engineering/harness-design-long-running-apps)として社内の設計知見を公開しています。以下は、この記事をもとにした一般論・設計原則の整理です((B) 設計・一般論モード)。

第一の要は役割の分離です。Planner(1〜4文のプロンプトを詳細な仕様に展開)・Generator(実装)・Evaluator(評価)の3役割を分けます。重要なのは、評価者がプロセスを見ないことです。生成プロセスを知っている評価者は「せっかくここまで作ったから合格にしよう」というサンクコストバイアスに引っ張られます。評価者は成果物だけを見て、事前に定めた採点基準(デザイン品質・独自性・クラフト・機能性)で判定します(→ 生成役と評価役を分ける)。

第二の要は反復の設計です。Anthropic は(フロントエンド生成で)1生成あたり5〜15回のイテレーションを回す設計を報告しています。第三の要はコンテキスト管理の進化です。初期設計にあったコンテキストリセット(作業中に文脈を再初期化する仕組み)は、Opus 4.6 でほぼ自動的に不要になり、SDKの自動 compaction がコンテキストの膨張を吸収するようになりました(→ コンテキスト管理・メモリ設計)。

反論させるほど、答えが信頼できる

① 仮説を出す生成エージェント A生成エージェント B生成エージェント C② 反論する反論エージェント別の角度から検証③ 収束チェック収束チェック仮説が一致したか未収束:繰り返す収束成果を確定信頼性の高い答え各エージェントが独立して検証 → 収束するまで繰り返す
生成エージェントが仮説を出し、反論エージェントが別の角度から検証する。収束チェックで仮説が一致しなければ繰り返す。各エージェントが独立して検証するため、自己採点の甘さを排除できる(Anthropic の実証パターンを一般化)。

一次資料と注記

本記事の事実はすべて Anthropic の公開情報に基づきます:「Introducing Claude Opus 4.8」(Anthropic、2026-05-28)、「Harness design for long-running application development」(Anthropic Engineering、2026-03-24)。『数百の並行サブエージェント』や実行業務規模はいずれも Anthropic の報告であり、agens の機能・実績ではありません(Anthropic は具体的なエージェント数の上限値を公表していません)。ダイナミック・ワークフローは現在 research preview(Enterprise/Team/Max プランの Claude Code)。一般提供の時期は未公表です。

収束の設計——目標・制約・合格の定義

ダイナミック・ワークフローが示す設計の変化は、3つの問いで整理できます((B) 設計の一般論)。

最初の問いは「何を目標として渡すか」です。Claudeにオーケストレーションを動的に生成させるには、「手順」ではなく「目標・制約・収束の定義(done の基準)」を渡す必要があります。「合格の条件」が曖昧なままだと、エージェントはループし続けます。採点基準を具体的に定める——「いいデザインとは?」を「視覚的統一性・独自性・タイポグラフィ・機能性」のように採点可能な指標に落とし込む——のが出発点です。

次の問いは「どう収束させるか」です。一部のエージェントが仮説を立て、別のエージェントが独立した視点で反論・検証する。答えが揃うまで繰り返す——これが品質の核心です。自分で採点すると甘くなるという傾向は、スケールが数百のサブエージェントになっても変わりません。

最後の問いは「統制をどこに置くか」です。スケールが上がるほど「何をやったか」の追跡が難しくなります。監査ログと巻き戻し——誰が何をAIにやらせ、どう完了したかを記録して戻せる仕組み——の価値は、スケールに比例して大きくなります。

🛡 agens との関係

(A)agens は、大規模・長時間の自律実行を「統制の枠内で動かす」製品です。タスクごとのサンドボックス隔離(エージェントが何をしても隔離環境内に閉じる)・全操作の監査とタスク単位の巻き戻し・RBAC による権限分離・スキル・ワークフローによる繰り返し業務の自動化・サブエージェントによる役割分担——これらをすぐに使えます。スケールが上がるほど、この統制レイヤーの価値は増します。(C)ダイナミック・ワークフローのような動的オーケストレーション規模への直接サポートは、設計上の拡張方向として位置づけています。

よくある質問

ダイナミック・ワークフローと静的な並列実行はどう違うのですか?
静的な並列は、人が事前にタスクをA・B・Cに分割して各エージェントに固定割り当てするパターンです。ダイナミック・ワークフローは、目標を渡すとClaudeがオーケストレーションのプログラムを生成し、問題の形に応じてサブエージェントを動的に展開します(Anthropic、2026-05-28)。
数百のサブエージェントが一斉に動くのですか?
Anthropic は「1セッションで数百のサブエージェントを並行に走らせる」と説明しています(2026-05-28。具体的な同時数・累計数の上限値は公表されていません)。セッション自体はその間もレスポンシブな状態を保ちます。
長時間動かしてもコンテキストが壊れませんか?
Anthropicの報告では、Opus 4.6 でコンテキストリセットが不要になり、SDKの自動 compaction がコンテキストの膨張を吸収します(Anthropic Engineering、2026-03-24)。コンテキスト管理の設計詳細は「コンテキスト管理・メモリ設計」で解説しています。
評価者がプロセスを見ないのはなぜですか?
プロセスを知っている評価者は「せっかく作ったから」というサンクコストバイアスに引っ張られるためです(Anthropic Engineering、2026-03-24)。評価者は成果物だけを採点基準で判定することで、客観性を保てます。詳細は「生成役と評価役を分ける」の記事で解説しています。
agens でこうした大規模並列実行を安全に運用できますか?
agens はタスクごとのサンドボックス隔離・全操作の監査・巻き戻し・RBAC による権限分離を提供します。自律実行のスケールが上がるほど、これらの統制レイヤーが価値を持ちます。

最終更新: 2026-06