エージェントと人間の協治設計
Flapbase における人間とAIエージェントの役割分担と、変更依頼・委譲ポリシーによるガバナンス
人間主権の原則
エージェントが高度に自律化されるほど、「誰が最終的な責任を持つか」という問いが重要になる。
Flapbase の答えは明確だ。ワークスペースの主権は人間にある。
エージェントがどれだけ高い精度でタスクを実行できても、判断を「委ねられた」のであって、「奪った」わけではない。この原則は設計の根底に置かれており、エージェントが自律的に実行できる範囲は、常に人間が設定した境界の内側に留まる。
なぜこの原則が重要か。それはエージェントを「便利なツール」で終わらせないためだ。エージェントを本当の意味でビジネスの一員として機能させるには、人間とエージェントの間に信頼関係が必要であり、信頼関係は「いつでも取り戻せる」という確信から生まれる。
エージェントの権限範囲
Flapbase のエージェントには、実行できる操作に明確な段階がある。
読み取り(常に許可): エージェントはワークスペースの知識・タスク・目標・意思決定を常に参照できる。観察のためのアクセスに承認は不要だ。
記録・追記(デフォルト許可): メモの作成、タスクへのコメント、ログの記録といった「追記型」の操作は、原則としてエージェントが自律実行できる。
更新・変更(ポリシー依存): 既存データの更新、ステータス変更、スケジュールの変更などは、change_delegation_policies の設定に従う。
削除・外部連携(原則承認必要): データの削除、外部サービスへの送信、コスト発生を伴う操作は、デフォルトで人間の承認を必要とする。
この段階設計により、エージェントは「読んで記録する」ことは自律的に行いながら、「変えて送る」ことは人間の確認を経る、という自然な役割分担が実現する。
change_delegation_policies
権限の境界は、change_delegation_policies(変更委譲ポリシー)によって定義される。
ポリシーは、変更の種類・対象スコープ・承認条件の3要素で構成される。たとえば:
- 「
_v.taskのステータス変更は、自動承認する」 - 「
_v.decisionの新規作成は、承認待ちとして人間に通知する」 - 「外部Slack への送信は、毎回確認を求める」
このポリシーはワークスペースオーナーが設定し、エージェントはポリシーの存在を知りながら動く。ポリシーに収まる変更は自律実行し、収まらない変更は「変更依頼(Change Request)」として人間にエスカレーションする。
エスカレーションは積極的な失敗ではない。むしろ正しい動作だ。エージェントが「判断できない」と認識して人間に委ねることは、エージェントの能力の限界ではなく、ガバナンス設計の成功を意味する。
承認フロー
Change Request が発生すると、人間のインボックスに通知が届く。
承認フローは以下のステップで進む:
- エージェントが変更を提案: 変更内容・変更理由・影響範囲をまとめた Change Request を作成する
- 人間がレビュー: 変更内容を確認し、承認・拒否・修正指示を選択する
- 承認の場合: エージェントが変更を実行し、結果をログに記録する
- 拒否の場合: エージェントはその決定を学習情報として記録し、類似の判断に活かす
- スナップショット: 変更前後のデータスナップショットが保存され、いつでも差分確認・ロールバックができる
重要なのは、承認フローが「エージェントを制限する仕組み」ではなく、「人間とエージェントが合意形成する仕組み」だという点だ。変更依頼のやり取りを通じて、エージェントはオーナーの価値観を学び、次第により自律的に動けるようになる。
委譲の段階的拡大
信頼関係は使用を通じて育つ。
Flapbase では、委譲ポリシーを段階的に拡大していくことを前提とした設計になっている。最初は多くの操作が「要承認」に設定されていても、実績を積み重ねるにつれて、オーナーは特定カテゴリの自律実行を許可していく。
この設計は、AIへの恐れを「不透明なものへの不信」と捉えていることから来ている。承認フローを通じて変更の内容と理由が可視化されることで、エージェントの行動が「ブラックボックス」でなくなる。可視化が信頼を生み、信頼が委譲を可能にする。
エージェントと人間の協治とは、AIに仕事を「任せる」ことではない。互いの役割を定義し、透明性の中で協働する関係を設計することだ。Flapbase はその設計を、システムの根幹に組み込んでいる。