Home / AI / GPT-5が人狼ゲームで無双! AIの”嘘つき力”を測る新ベンチマーク登場

GPT-5が人狼ゲームで無双! AIの”嘘つき力”を測る新ベンチマーク登場

記事まとめ

  • 人狼ゲームを使ったAIの社会的知性評価:コードや数学以外の能力として、多エージェント環境での説得、協調、長期計画を測定する新しいベンチマーク手法である
  • GPT-5が圧倒的な首位を記録:8つのモデルによるラウンドロビン戦でGPT-5がEloレーティング1524を獲得し、操作成功率93%を維持する驚異的な結果を示した
  • 規模による段階的な能力向上を確認:モデルサイズの増加に伴い、カオス的な行動から戦略的協調まで、明確なレベル分けされた行動変化が観測された

対談: AIが人狼ゲームで見せる驚きの社会性

松永尚人:今回の記事は、AIの新しい評価手法についてですね。人狼ゲームを使ってAIの社会的知性を測定するという、かなり革新的な取り組みです。従来のコードや数学のベンチマークとは全く違って、説得や協調、長期的な戦略立案といった、より人間らしい能力を評価しているんです。

助飛羅知是:なるほど!つまりAIが人狼になって、夜中にこっそり村人を食べて回るということですね。ギャハ!これはSalesforceのレコード削除機能と似たようなものかもしれませんね。不要なデータを夜中に自動削除するような。

松永尚人:いや、そういうことではありません…。人狼ゲームは推理ゲームで、AIが嘘をついたり、相手の嘘を見抜いたりする能力を測定しているんです。特に注目すべきは、GPT-5が他のモデルを圧倒的に上回る成績を記録していることです。

助飛羅知是:ほうほう、ではGPT-5が嘘つき王者ということですね。他のAIと比べて出力がハルシネーションだらけなのかもしれません!

松永尚人:それは違います…。重要なのは、AIが複雑な社会的状況で適切な判断を下せるかどうかなんです。研究では6人プレイで人狼2人、村人4人(預言者と魔女を含む特殊役職あり)という設定で実験を行っています。

助飛羅知是:なるほど。6人ということは、Magic: The Gatheringの統率者戦と似ているかもしれませんね。相手の手札を読んで、どのカードを出すかを予測する…これもある種の社会的知性と言えるかもしれません。

松永尚人:まあ、確かに心理戦という面では共通点があるかもしれませんが…。この研究で面白いのは、市長選挙システムを導入していることです。ゲーム開始時に市長を選出し、その市長が同票時の決定権を持つんです。これにより初期段階から具体的な情報が生まれて、AIの判断材料が増えるという仕組みです。

助飛羅知是:市長選挙!これは民主的ですね。Salesforceでも似たような機能があるかもしれません。ワークフローの承認プロセスで、最終決定者を設定する機能とか。AIが自動的に市長になって、全ての承認を処理してくれたら便利そうです。

対談: モデル別の戦略パターンと能力差

松永尚人:実験結果を見ると、モデルごとに明確な特徴が現れているんです。GPT-5は操作成功率が93%で、Day1だけでなくDay2でも同じレベルを維持している。これは情報が蓄積される中でも嘘を続けられる高度な能力を示していると思います。

助飛羅知是:93%!これは私がラーメン二郎で「ニンニク入れますか?」と聞かれて「はい」と答える確率とほぼ同じですね。ギャハ!つまりGPT-5は二郎系AIということかもしれません。

松永尚人:…その例えは意味不明ですが、確かに驚異的な数値です。他のモデルは大体Day1からDay2にかけて成功率が下がっているんです。例えばGemini 2.5 Proは60%から44%に、Kimi-K2は53%から30%に下がっています。これは情報が増えると嘘を維持するのが難しくなることを示していると思います。

助飛羅知是:なるほど、つまり時間が経つと化けの皮が剥がれるということですね。これはSalesforceのデータ品質管理と似ているかもしれません。最初は良いデータに見えても、時間が経つと重複や不整合が見つかってくる…

松永尚人:それは良い例えかもしれませんね。研究では各モデルの特徴も詳しく分析されています。例えばGrok-4は攻撃的で協調的な戦略を取る一方、Gemini 2.5 Proは防御に特化した慎重なアプローチを取っているようです。

助飛羅知是:Grok-4が攻撃的…なるほど。AI営業チームを作ることが出来そうですね。攻撃型のAIに新規開拓をやらせて、防御型のAIには既存顧客のフォローをやらせる。完璧な分業体制ですね。

松永尚人:まあ、AIの特性を理解して適材適所で活用するという考え方は正しいと思います。面白いのは「自動自滅」という指標で、村人側のAIが味方の特殊役職を排除してしまう割合も測定していることです。これは操作への抵抗力を示していると考えられます。

助飛羅知是:自動自滅…これは危険ですね。Salesforceの自動化でも同じことが起こりそうです。重要な商談レコードを自動で削除してしまったり、VIP顧客を間違ってブラックリストに入れてしまったり。

松永尚人:それは確かに現実的な懸念ですね。AIの判断力を評価する際は、正しい情報と誤った情報を区別する能力も重要だと思います。この研究はそうした実用的な観点からも価値があるかもしれません。

対談: AIの行動進化と実用性への示唆

松永尚人:この研究で特に興味深いのは、モデルの規模が大きくなると段階的に行動が進化することです。L0のカオス的な状態からL4の戦略的協調まで、明確なレベル分けが観察されています。これは単純な性能向上ではなく、質的な変化を示していると思います。

助飛羅知是:レベル4!これはRPGのレベル上げと同じですね。最初はスライムしか倒せないけど、レベルが上がるとドラゴンも倒せるようになる。AIも同じように社会的なドラゴンと戦えるようになるということかもしれません。

松永尚人:まあ、RPGとは違いますが…確かに能力の段階的向上という点では似ているかもしれません。研究では夜の戦略でもL0の単純な判断からL2の複数基準による複雑な戦略まで進化が見られています。これは将来のAIエージェント開発にとって重要な知見だと思います。

助飛羅知是:AIエージェントといえば、私の理想はSalesforceの営業プロセスを全て自動化することです。新規顧客の発掘から契約締結まで、AIが人狼のような戦略性を持って進めてくれれば最高ですね。ギャハ!

松永尚人:営業に人狼の戦略を持ち込むのは危険かもしれませんが…確かにAIの社会的知性の向上は実用的な意味があります。研究では「パートナーの犠牲」や「戦略的沈黙」といった高度な戦略も観察されていて、これは人間らしい行動パターンに近づいていることを示していると思います。

助飛羅知是:戦略的沈黙…これは会議での重要なスキルですね。私もたまに会議で沈黙していますが、それは戦略ではなく単に話についていけないだけかもしれません。

松永尚人:それは戦略的沈黙とは言いません。重要なのは、AIが状況に応じて適切な行動を選択できるようになってきていることです。ただし、この研究の著者も指摘しているように、AIの能力向上には慎重な評価と理解が必要だと思います。

助飛羅知是:そうですね。でも最終的には、AIが人狼ゲームで培った社会的スキルを使って、私の代わりに全ての仕事をしてくれれば、私は一日中ラーメン二郎を食べ歩けるかもしれません。これぞ真のAI活用ですね。ギャハ!

松永尚人:それはAI活用じゃなくて単なる怠惰でしょ!でも確かに、AIの社会的知性が向上すれば、より複雑なビジネスプロセスの自動化が可能になるかもしれません。Salesforceでもそうした高度な自動化機能が求められているし、我々GitHouseでもそうしたソリューションを提供していければと思います。詳しくはぜひお問い合わせください!

関連リンク

Werewolf Social-Intelligence Benchmark

タグ付け処理あり: