Engineering · アーキテクチャ
agens の並列エージェント設計 — 1つの大仕事を、複数のAIで分担する
大きな仕事は、複数のAIで分担すると速く進みます。ただし“テストが通った=完了”ではありません。agens は並列エージェントの協調を、監査・巻き戻し・人の検証ゲートで囲みます。
要点
- ✓1つの大きな仕事を、複数のAIが共有コードベース上で並列に分担できる(Anthropic は実証として並列のClaudeに1つのCコンパイラを作らせた)。
- ✓協調は意外と素朴:中央の指揮役(オーケストレータ)を置かず、各AIが次のタスクをロックして担当し、ロックで二重取得を防ぐ。
- ✓落とし穴は『検証』。テスト(評価役)がほぼ完璧でないと、AIは“間違った問題”を解いてしまう(Anthropic)。
- ✓“テストが通った=完了”ではない。自律実行ほど、人が確かめるゲートと、後から戻せる記録が要る。
- ✓agens は並列エージェントを統制で囲む:全操作の監査・巻き戻し、重要な節目の人の承認、隔離されたサンドボックス。
大きな仕事は、分担すると速い
人間のチームと同じで、大きな仕事は複数で分担すると速く進みます。AIでも同じです。Anthropic は2026年2月、その極端な実証を公開しました——16体のClaudeを並列で動かし、人がつきっきりにならずに、約2,000回のセッション・約2万ドルで、10万行のCコンパイラ(x86・ARM・RISC-V 向けに起動可能な Linux 6.9 をビルドできる)を作らせた、というものです(Anthropic「Building a C compiler with a team of parallel Claudes」2026-02-05)。
ここで面白いのは、その協調のしかたが意外と素朴だったことです。
中央の指揮役を置かず、ロックで分担する
協調は素朴、難しいのは“検証”
Anthropic の実証では、エージェント同士を仕切る“司令塔”は置かれていません。各エージェントが『次にいちばん明らかな問題』を自分で選び、作業するタスクをファイルのロックで確保する。二体が同じタスクを取りに行っても、git の同期で後発がはじかれ、別の仕事に回る——という具合です。
本当に難しいのは協調ではなく、『検証』でした。Anthropic は『タスクの検証器(テスト)がほぼ完璧でないと、Claude は“間違った問題”を解いてしまう』と率直に書いています。さらに著者(元・侵入テストの専門家)は、自分で検証していないソフトを人がデプロイすることへの懸念を述べ、“テストが通った=完了”と思い込みがちだが現実はそう甘くない、と釘を刺します。
agens は、並列の自律を“統制”で囲む
ここが agens の出番です。複数のAIに自律的に並列で働かせるほど、『誰が・何を・どの順でやったか』が見えなくなりがちです。だから agens は、並列エージェントの全操作をタスク単位で監査し、必要なら巻き戻せるようにします。問題が起きても原因をたどり、影響を戻せる——自律と統制を両立させる土台です。
そして“テストが通った=完了”にしません。影響の大きい節目には人の検証ゲートをはさみ、承認されたものだけを『完了=会社の資産』として残します。作業は隔離されたサンドボックスの中で行うため、並列で攻めても被害は局所化されます。並列の速さと、組織としての安心を、同時に取りに行く設計です(監査・承認の詳しい設計は「統制設計」を、AIの成果をAIが検証する仕組みは「生成役と評価役を分ける」もあわせてご覧ください)。
並列の自律を、監査と人の検証で囲む
数値・実証はいずれも Anthropic の報告です
本記事の『16体・約2,000セッション・約2万ドル・10万行のコンパイラ・99%のテスト合格』などは、いずれも Anthropic(著者 Nicholas Carlini)が自社の実験について報告した値で、agens の機能や実績ではありません。並列協調・検証の知見も Anthropic の実証によるものです。agens の役割は、こうした並列の自律実行を安全に運用する統制——全操作の監査・巻き戻し、人の検証ゲート、隔離されたサンドボックス——を与えることです。
よくある質問
複数のAIで分担すると、どう協調するのですか?
並列でAIに任せて、品質は大丈夫ですか?
並列で動かすと、何をしたか分からなくなりませんか?
サブエージェントと並列エージェントは違うのですか?
最終更新: 2026-06
