Engineering · アーキテクチャ

AIが書くオーケストレーション — ダイナミック・ワークフローと“数百のサブエージェント”の設計

AIがオーケストレーションのプログラムを自分で書き、数百のサブエージェントをバックグラウンドで並行に動かす——Claude Opus 4.8が示した『ダイナミック・ワークフロー』、その設計を解説します。

要点

✓ダイナミック・ワークフロー（Anthropic、2026-05-28）は、Claudeがオーケストレーションのスクリプトを生成し、バックグラウンドランタイムが数百のサブエージェントを並行・非同期に実行する仕組み（現在 research preview）。
✓1セッションで数百のサブエージェントが並行で動く一方、セッション自体はレスポンシブなまま保たれる（Anthropic は具体的なエージェント数の上限値を公表していない）。
✓従来の『静的な並列割り当て』と異なり、問題の形に応じてオーケストレーションを動的に組み立てる——渡すのは『手順』でなく『目標』。
✓収束型反復：一部のエージェントが仮説を立て、別のエージェントが反論・検証。答えが収束するまで繰り返すことで信頼性が上がる。
✓Anthropic Engineering（2026-03-24）の知見：Planner/Generator/Evaluatorの役割分離、評価者はプロセスを見ない（サンクコストバイアスの排除）、Opus 4.6 でコンテキストリセットが不要化（SDK の自動 compaction が吸収）。

手順を指定するから、目標を渡すへ

並列エージェントの典型的な形は、人が事前にタスクをA・B・Cに分割して、それぞれのエージェントに固定で割り振る「静的な並列」です。誰が何をするかは、実行前に人が設計します。問題が明確で、分割の仕方が決まっている場合はこれで十分です。

ダイナミック・ワークフローは違います。Claudeに「目標」と「合格の定義（どこで完了とみなすか）」を渡すと、Claudeがオーケストレーションのプログラム（スクリプト）を自ら書きます。そのプログラムがバックグラウンドランタイムで実行され、問題の形に応じてサブエージェントを動的に展開します。

手順を事前に完璧に設計しなくてよくなる——それがダイナミック・ワークフローの根本的な変化です。代わりに明確にすべきは「何を達成するか」という目標と「合格の条件は何か」という収束の定義です。

目標を渡すと、手順はAIが組み立てる

左の静的並列は人が事前にA/B/Cに分割して固定割り当てする。右のダイナミック・ワークフローはClaudeが目標を受け取ってスクリプトを生成し、サブエージェントが動的に展開・収束する（1セッションで数百規模）。

Claude Opus 4.8 のダイナミック・ワークフロー（Anthropic、2026-05-28）

Anthropicは2026年5月28日、Claude Opus 4.8の発表とともに「ダイナミック・ワークフロー（dynamic workflows）」を研究プレビュー（research preview）として公開しました。Enterprise/Team/Max プランの Claude Code が対象です。

仕組みはこうです。タスクを説明するとClaudeがオーケストレーション・スクリプトを生成し、バックグラウンドランタイムがそのスクリプトを実行します。セッション自体はその間もレスポンシブな状態を保ちます——タスクが裏で動いている間も、別の指示を出したり進捗を確認したりできます。

Anthropic は「1セッションで数百のサブエージェントを並行に走らせ」、「コードベース規模の移行（数十万行規模）を、開始からマージまで、既存のテストスイートを基準にこなせる」と報告しています（2026-05-28。具体的なエージェント数の上限値は公表されていません）。一部のエージェントが仮説を立て、別のエージェントがそれを反論・検証する——答えが収束するまで繰り返すことで、信頼性の高い成果を生み出します。

AIがプログラムを書き、数百のサブエージェントが動く

あなたが目標を渡すとClaudeがスクリプトを生成し、バックグラウンドランタイムが数百のサブエージェントを並行に展開する。セッションはレスポンシブなまま。答えが収束するまで動き続ける（Anthropic 2026-05-28。具体的な上限値は非公表）。

長時間自律実行を成立させる3つの要（Anthropic Engineering、2026-03-24）

Anthropicは2026年3月24日、「Harness design for long-running application development」（anthropic.com/engineering/harness-design-long-running-apps）として社内の設計知見を公開しています。以下は、この記事をもとにした一般論・設計原則の整理です（(B) 設計・一般論モード）。

第一の要は役割の分離です。Planner（1〜4文のプロンプトを詳細な仕様に展開）・Generator（実装）・Evaluator（評価）の3役割を分けます。重要なのは、評価者がプロセスを見ないことです。生成プロセスを知っている評価者は「せっかくここまで作ったから合格にしよう」というサンクコストバイアスに引っ張られます。評価者は成果物だけを見て、事前に定めた採点基準（デザイン品質・独自性・クラフト・機能性）で判定します（→ 生成役と評価役を分ける）。

第二の要は反復の設計です。Anthropic は（フロントエンド生成で）1生成あたり5〜15回のイテレーションを回す設計を報告しています。第三の要はコンテキスト管理の進化です。初期設計にあったコンテキストリセット（作業中に文脈を再初期化する仕組み）は、Opus 4.6 でほぼ自動的に不要になり、SDKの自動 compaction がコンテキストの膨張を吸収するようになりました（→ コンテキスト管理・メモリ設計）。

反論させるほど、答えが信頼できる

生成エージェントが仮説を出し、反論エージェントが別の角度から検証する。収束チェックで仮説が一致しなければ繰り返す。各エージェントが独立して検証するため、自己採点の甘さを排除できる（Anthropic の実証パターンを一般化）。

一次資料と注記

本記事の事実はすべて Anthropic の公開情報に基づきます：「Introducing Claude Opus 4.8」（Anthropic、2026-05-28）、「Harness design for long-running application development」（Anthropic Engineering、2026-03-24）。『数百の並行サブエージェント』や実行業務規模はいずれも Anthropic の報告であり、agens の機能・実績ではありません（Anthropic は具体的なエージェント数の上限値を公表していません）。ダイナミック・ワークフローは現在 research preview（Enterprise/Team/Max プランの Claude Code）。一般提供の時期は未公表です。

収束の設計——目標・制約・合格の定義

ダイナミック・ワークフローが示す設計の変化は、3つの問いで整理できます（(B) 設計の一般論）。

最初の問いは「何を目標として渡すか」です。Claudeにオーケストレーションを動的に生成させるには、「手順」ではなく「目標・制約・収束の定義（done の基準）」を渡す必要があります。「合格の条件」が曖昧なままだと、エージェントはループし続けます。採点基準を具体的に定める——「いいデザインとは？」を「視覚的統一性・独自性・タイポグラフィ・機能性」のように採点可能な指標に落とし込む——のが出発点です。

次の問いは「どう収束させるか」です。一部のエージェントが仮説を立て、別のエージェントが独立した視点で反論・検証する。答えが揃うまで繰り返す——これが品質の核心です。自分で採点すると甘くなるという傾向は、スケールが数百のサブエージェントになっても変わりません。

最後の問いは「統制をどこに置くか」です。スケールが上がるほど「何をやったか」の追跡が難しくなります。監査ログと巻き戻し——誰が何をAIにやらせ、どう完了したかを記録して戻せる仕組み——の価値は、スケールに比例して大きくなります。

🛡 agens との関係

（A）agens は、大規模・長時間の自律実行を「統制の枠内で動かす」製品です。タスクごとのサンドボックス隔離（エージェントが何をしても隔離環境内に閉じる）・全操作の監査とタスク単位の巻き戻し・RBAC による権限分離・スキル・ワークフローによる繰り返し業務の自動化・サブエージェントによる役割分担——これらをすぐに使えます。スケールが上がるほど、この統制レイヤーの価値は増します。（C）ダイナミック・ワークフローのような動的オーケストレーション規模への直接サポートは、設計上の拡張方向として位置づけています。

よくある質問

ダイナミック・ワークフローと静的な並列実行はどう違うのですか？

静的な並列は、人が事前にタスクをA・B・Cに分割して各エージェントに固定割り当てするパターンです。ダイナミック・ワークフローは、目標を渡すとClaudeがオーケストレーションのプログラムを生成し、問題の形に応じてサブエージェントを動的に展開します（Anthropic、2026-05-28）。

数百のサブエージェントが一斉に動くのですか？

Anthropic は「1セッションで数百のサブエージェントを並行に走らせる」と説明しています（2026-05-28。具体的な同時数・累計数の上限値は公表されていません）。セッション自体はその間もレスポンシブな状態を保ちます。

長時間動かしてもコンテキストが壊れませんか？

Anthropicの報告では、Opus 4.6 でコンテキストリセットが不要になり、SDKの自動 compaction がコンテキストの膨張を吸収します（Anthropic Engineering、2026-03-24）。コンテキスト管理の設計詳細は「コンテキスト管理・メモリ設計」で解説しています。

評価者がプロセスを見ないのはなぜですか？

プロセスを知っている評価者は「せっかく作ったから」というサンクコストバイアスに引っ張られるためです（Anthropic Engineering、2026-03-24）。評価者は成果物だけを採点基準で判定することで、客観性を保てます。詳細は「生成役と評価役を分ける」の記事で解説しています。

agens でこうした大規模並列実行を安全に運用できますか？

agens はタスクごとのサンドボックス隔離・全操作の監査・巻き戻し・RBAC による権限分離を提供します。自律実行のスケールが上がるほど、これらの統制レイヤーが価値を持ちます。

最終更新: 2026-06

agens を実際に動かしてみませんか?

デモ・お問い合わせ agens を詳しく見る他の技術解説を見る