Engineering · アーキテクチャ

agens の並列エージェント設計 — 1つの大仕事を、複数のAIで分担する

大きな仕事は、複数のAIで分担すると速く進みます。ただし“テストが通った=完了”ではありません。agens は並列エージェントの協調を、監査・巻き戻し・人の検証ゲートで囲みます。

要点

  • 1つの大きな仕事を、複数のAIが共有コードベース上で並列に分担できる(Anthropic は実証として並列のClaudeに1つのCコンパイラを作らせた)。
  • 協調は意外と素朴:中央の指揮役(オーケストレータ)を置かず、各AIが次のタスクをロックして担当し、ロックで二重取得を防ぐ。
  • 落とし穴は『検証』。テスト(評価役)がほぼ完璧でないと、AIは“間違った問題”を解いてしまう(Anthropic)。
  • “テストが通った=完了”ではない。自律実行ほど、人が確かめるゲートと、後から戻せる記録が要る。
  • agens は並列エージェントを統制で囲む:全操作の監査・巻き戻し、重要な節目の人の承認、隔離されたサンドボックス。

大きな仕事は、分担すると速い

人間のチームと同じで、大きな仕事は複数で分担すると速く進みます。AIでも同じです。Anthropic は2026年2月、その極端な実証を公開しました——16体のClaudeを並列で動かし、人がつきっきりにならずに、約2,000回のセッション・約2万ドルで、10万行のCコンパイラ(x86・ARM・RISC-V 向けに起動可能な Linux 6.9 をビルドできる)を作らせた、というものです(Anthropic「Building a C compiler with a team of parallel Claudes」2026-02-05)。

ここで面白いのは、その協調のしかたが意外と素朴だったことです。

中央の指揮役を置かず、ロックで分担する

1つの大仕事を、複数のAIで分担エージェントAタスク①エージェントBタスク②エージェントCタスク③それぞれ別のタスクをロックして担当(中央の指揮役なし)共有コードベース(git)ロックで二重取得を防ぐ
1つの大仕事を複数のAIで分担し、それぞれが別のタスクをロックして担当する。中央の指揮役(オーケストレータ)はなく、共有コードベース(git)のロックで二重取得を防ぐ。

協調は素朴、難しいのは“検証”

Anthropic の実証では、エージェント同士を仕切る“司令塔”は置かれていません。各エージェントが『次にいちばん明らかな問題』を自分で選び、作業するタスクをファイルのロックで確保する。二体が同じタスクを取りに行っても、git の同期で後発がはじかれ、別の仕事に回る——という具合です。

本当に難しいのは協調ではなく、『検証』でした。Anthropic は『タスクの検証器(テスト)がほぼ完璧でないと、Claude は“間違った問題”を解いてしまう』と率直に書いています。さらに著者(元・侵入テストの専門家)は、自分で検証していないソフトを人がデプロイすることへの懸念を述べ、“テストが通った=完了”と思い込みがちだが現実はそう甘くない、と釘を刺します。

agens は、並列の自律を“統制”で囲む

ここが agens の出番です。複数のAIに自律的に並列で働かせるほど、『誰が・何を・どの順でやったか』が見えなくなりがちです。だから agens は、並列エージェントの全操作をタスク単位で監査し、必要なら巻き戻せるようにします。問題が起きても原因をたどり、影響を戻せる——自律と統制を両立させる土台です。

そして“テストが通った=完了”にしません。影響の大きい節目には人の検証ゲートをはさみ、承認されたものだけを『完了=会社の資産』として残します。作業は隔離されたサンドボックスの中で行うため、並列で攻めても被害は局所化されます。並列の速さと、組織としての安心を、同時に取りに行く設計です(監査・承認の詳しい設計は「統制設計」を、AIの成果をAIが検証する仕組みは「生成役と評価役を分ける」もあわせてご覧ください)。

並列の自律を、監査と人の検証で囲む

agens の統制並列のAIAI ①AI ②AI ③監査・巻き戻し誰が何をしたか記録人の検証ゲート“通った” ≠ 完了承認されたものだけ完了=会社の資産
並列で動くAIの全操作を監査・巻き戻しで記録し、“通った”を完了とせず人の検証ゲートを通す。承認されたものだけが完了=会社の資産になる。並列の速さと統制を両立させる。

数値・実証はいずれも Anthropic の報告です

本記事の『16体・約2,000セッション・約2万ドル・10万行のコンパイラ・99%のテスト合格』などは、いずれも Anthropic(著者 Nicholas Carlini)が自社の実験について報告した値で、agens の機能や実績ではありません。並列協調・検証の知見も Anthropic の実証によるものです。agens の役割は、こうした並列の自律実行を安全に運用する統制——全操作の監査・巻き戻し、人の検証ゲート、隔離されたサンドボックス——を与えることです。

よくある質問

複数のAIで分担すると、どう協調するのですか?
中央の指揮役を置かず、各AIが次のタスクをロックして担当し、共有コードベース(git)のロックで二重取得を防ぐ——という素朴な方式が実証されています(Anthropic)。agens はこの並列の自律を監査・承認で囲みます。
並列でAIに任せて、品質は大丈夫ですか?
落とし穴は『検証』です。テストがほぼ完璧でないとAIは“間違った問題”を解いてしまいます(Anthropic)。agens は“テストが通った=完了”とせず、重要な節目に人の検証ゲートをはさみます。
並列で動かすと、何をしたか分からなくなりませんか?
agens は並列エージェントの全操作をタスク単位で監査し、必要なら巻き戻せます。問題が起きても原因をたどり、影響を戻せるため、自律と統制を両立できます。
サブエージェントと並列エージェントは違うのですか?
サブエージェントは“文脈を汚さないために調べ物を切り出す”仕組み(→ コンテキスト管理・メモリ設計)、並列エージェントは“1つの大仕事を複数で分担する”仕組みで、狙いが異なります。agens はどちらも統制の枠内で扱います。

最終更新: 2026-06