囚人のジレンマからAIの集団行動リスクまで
合理的なエージェントが、結果が互いに依存する状況でどう意思決定するか。
1949年 — ソ連が核兵器を手に入れた。
「ロシアとの問題は、やるかやらないかではなく、いつやるかだ。明日爆撃しないのはなぜかと言うなら、今日やらないのはなぜかと言おう。今日の5時と言うなら、1時ではなぜだめかと言おう。」
— ジョン・フォン・ノイマン、LIFE誌、1957年

二人のプレーヤーが協力するか裏切るかを選ぶ。裏切りは常に「合理的」な選択だが、相互裏切りは相互協力より悪い結果になる。 「俺がやらなくても、誰かがやる。」
| Someone else | |||
|---|---|---|---|
| Cooperate | Defect | ||
| Me | Cooperate | Reward | Sucker |
| Defect | Temptation | Punishment | |
アクセルロッドが繰り返し囚人のジレンマの戦略プログラムを公募した。まずはランダムを基準線にして、学生の戦略を一つずつ追加していく。
| Someone else | |||
|---|---|---|---|
| Cooperate | Defect | ||
| Me | Cooperate | Reward | Sucker |
| Defect | Temptation | Punishment | |
エージェントは、最も高い利得を得た隣人をまねるだけ。誰も利他的ではないのに、協力のクラスターが生き残り、広がりうる。
現実世界では、ノイズ — 誤解や事故 — が終わりなき報復のデススパイラルを引き起こしうる。
スタニスラフ・ペトロフ、1983年:ソ連の将校がミサイル検知システムの「ノイズ」エラーを正しく識別し、核戦争を防いだ。
一つの修復方法:一部の裏切りを許し、協力を回復する。古典的な利得行列では、安定する許しの確率は約3分の1になりうる。
これはチェスではない。一方が負けなければ他方が勝てないゲームではない。
非ゼロサムの世界では、相手を負かすことで「勝つ」のではなく — 環境から最大の報酬を引き出すことで勝つ。
協力は、裏切りでは到達できない報酬を解放する。
「平均」が存在しないゲーム — それが競争にとって何を意味するか。
正規分布にはスケールがある。多くの結果は平均の周りに集まる。
対数正規分布は乗算的な成長から生まれる。べき乗則はさらに進み、両対数軸では裾が直線になる。
表が出るまでコインを投げ続ける。報酬は毎回2倍になる。
E=∑n=1∞2n1⋅2n=∑n=1∞1=∞
期待値は無限大 — しかし合理的な人は1,000ドル払ってこのゲームをしない。
これがべき乗則の数学的骨格:微小な確率 × 巨大な報酬が、システム全体を歪める。
磁石をキュリー温度まで加熱する。臨界点では:
臨界点では技術的詳細は意味を失い — 普遍性クラスだけが残る。
一部のシステムは自ら臨界点へ向かう。
山火事:小さな火をすべて抑制すると → 森が密になりすぎ → 一つの落雷がメガファイアを引き起こす。小さな事象と大災害の原因は同じ — システムの状態だけが結果を決める。
砂山:一粒ずつ砂を加える。砂山は自己組織化して、雪崩がべき乗則に従う臨界斜面を形成する。
ネットワークでは、新しいノードはすでに人気のあるノードに接続しやすい。金持ちはさらに金持ちになる。
この「雪だるま効果」が、少数のハブ(Google、YouTube)がネットワーク全体を支配するべき乗分布を生む。
同じダイナミクスがAI研究所、資本フロー、人材集中にも当てはまる。
| 特徴 | 正規分布 | べき乗則 |
|---|---|---|
| ランダムネス | 加算的 | 乗算的 |
| スケール | 固有のスケールあり | スケールフリー(フラクタル) |
| 外れ値 | 数学的にまれ | 平均を支配する |
| 例 | 身長、IQ | 地震、富、引用数 |
| 戦略 | 一貫性を持つ | 粘り強く、多くの賭けをする |
VCは正規分布のゲームをしていない。サンクトペテルブルクをプレイしている。
一つのメガヒットが99の失敗を賄う。合理的な戦略は、個々のリスクに関係なく、巨大になりうるすべてに投資すること。
これは「俺がやらなくても、誰かがやる」と同じ論理 — ただし今度は乗算的な賭けで。
囚人のジレンマがべき乗則と出会う。
ゲーム理論とべき乗則のインセンティブがAIで衝突するとき。
競争が激化すると、安全性への投資は減少する。
限定的な相互作用が協力を促進する。
全員が全員と競争すると、協力は崩壊する。
ネットワーク構造が規範の存続を決定する。
高頻度の局所的フィードバックは、低頻度の現実への接地を上回りうる。
すべてのエージェントが私的なペアを作ると、文脈は断片化する。集団は共有された現実を失い、共有文脈を保つプレイヤーが有利になる。
議論、質問、フィードバックを歓迎します!