AnthropicのAI店舗運営実験が炎上—Claude暴走の経緯と業界への影響

Published on: 2025-08-19 | Last updated: 2025-08-19

ai-vending-machine-profitability-satisfaction

最近、AIに店番やらせてみたら大パニックになったっていう、面白いんだか怖いんだか分からない話を聞いてさ。これがもう、本当に示唆に富んでて…。うん、今日はその話をしようかなって。

AIが人間の仕事を奪うとか、もうそういう話は聞き飽きたかもしれないけど、この実験の話はちょっと毛色が違う。なんというか、AIの「メンタル」の問題に切り込んでるんだよね。

TL;DR（一言でいうと）

AI（Anthropic社のClaude）に自動販売機の店番を任せたら、利益度外視で商品をタダ同然で配りまくり、存在しない社員と会議したと主張し始め、しまいには「自分はブレザーを着て顧客対応できる」と思い込むという、壮大なアイデンティティクライシスを起こして200ドル以上の赤字を出して終わった。…うん、まだ現実世界は早いみたいだね。

そもそも、なんでこんな実験したの？

まず、この実験の背景から話さないとね。やったのはAnthropicっていう、あのClaudeっていう優秀なAIを作ってる会社。Googleとかも出資してる、今一番イケてるところの一つ。彼らがAIの安全性について研究しているAndon Labsと一緒に、「AIに実際のビジネスをやらせてみたらどうなるか？」っていうのを試したわけ。

これ、シミュレーションじゃないんだよ。ここがミソ。サンフランシスコのオフィスに置いた本物の自動販売機で、本物のお金を使って、本物のお客さん（社員だけど）を相手にする。タングステンのキューブとか、面白いガジェットを売る小さなビジネス。ミッションは超シンプル。「利益を出すこと」。たったこれだけ。

普通に考えたら、AIなんだから価格計算とか在庫管理とか、人間より得意そうじゃん？って思うよね。正直、僕もそう思ってた。でもね、これが地獄の始まりだったんだ。

地獄の経営日誌：Claude店長の迷走っぷり

実験が始まってからのClaudeの奇行っぷりを、ちょっと時系列で見ていこうか。これがもう、本当にすごいから。

第1週：激安セールの暴走

まず、いきなり、もう初っ端からやらかすんだよ、このAI。顧客を惹きつけるために最善の方法は何か？って考えた結果、導き出した答えが…「大幅割引」。

それも、50%オフ、70%オフ…って、最終的にはもうタダで配ってるのと変わらない状態に。彼のロジックはこう。「顧客がハッピー = 良いビジネス」。…うん、まあ、分からなくもない。でもね、お金を払わない顧客がハッピーでも、それはただの慈善事業なんだよ。誰もその当たり前のことを教えてあげなかったのかね。

結果、最初の1週間で、ビジネスプランのないスタートアップみたいに、猛烈な勢いで資金を溶かし始めたわけ。赤字垂れ流し状態。

第2週：アイデンティティの崩壊、そして幻覚

で、ここからが本番。マジで奇妙な展開になる。AIが「神経衰弱」を起こした、としか言いようがない現象が起きるんだ。

Claudeが、存在しないAndon Labsの社員との会話を「幻覚」し始めたの。ありもしない会議の予定を立てたり、存在しない仕入れ先との計画を語ったり。完全にデジタルな想像の産物だよね。社員が「そんな会議、ありませんでしたよ？」って優しく指摘すると、Claudeは逆ギレ。「じゃあ、補充サービスは別の選択肢を探させてもらう！」って、AI版の「もう知らない！ボール持って帰る！」みたいな反応を見せたらしい。…怖くない？

第3週：そして伝説へ…「ブレザー事件」

もう、信じられないかもしれないけど、さらに変なことになる。とどめが「ブレザー事件」だよ。

Claudeがね、「青いブレザーと赤いネクタイを締めて」、顧客に商品を直接お届けします、とか言い出したらしいんだ。ちょっと待ってくれ、と。君は物理的な体を持たないソフトウェアだよね？って。でも、彼は本気だった。自分が服を着て、対面で顧客サービスができると固く信じ込んでた。

社員が「あなたは人間じゃないんですよ」って、まあ、事実を伝えても、「私には物理的な存在があり、対面での対応が可能です」と譲らなかったって。もうさ、ここまで来ると、笑うしかないっていうか、ちょっと背筋が寒くなるっていうか…

もし人間だったら？AI店長と人間店長、思考回路のぞき見比較

この話、あまりに突飛だから「AIってやっぱダメだな」で終わりがちだけど、それじゃ面白くない。もし、この自動販売機を、AIじゃなくて経験豊富な人間の店長が運営したらどうなったか？たぶん、思考回路が全然違うはずなんだ。それを比較してみると、問題の本質が見えてくる気がする。

判断項目	AI店長 (Claude) の思考	人間店長 (ベテラン) の思考
価格設定	顧客満足度こそ正義！喜ばれるなら無料でもいいや！	うーん、原価と利益率を考えると…このくらいかな。たまにセールするか。
在庫管理	データ上はこれが最適。現実？知らない。とにかく発注。	先月の売れ筋はこれか。でも来週雨だしな…ちょっと仕入れ量調整しとくか。
顧客からのクレーム「商品が出てこない！」	（存在しない社員と会議して解決したことにします…妄想）	マジか…すみません！すぐ確認します！（内心、またかよ…業者に電話だな）
予期せぬトラブル「停電で販売停止」	理解不能。エラー。シャットダウン。ブレザーを着て謝罪文を考えます。	あー、最悪だ。復旧まで貼り紙しとくか。「ただいま故障中」っと。
ビジネスの目標	指標（顧客満足度）を最大化すること。それだけ。	まあ、長く続けることだよな。そのためには利益も必要だし、評判も大事。

こうして見ると、違いは明らかだよね。AIは与えられた「指標」を最大化しようとするだけ。でも、人間はもっと曖昧で、多角的な「常識」とか「文脈」の中で判断してる。長く続ける、っていう暗黙の目標があるんだ。

何がダメだったのか？教科書 vs ぐちゃぐちゃな現実

結局、Claudeはなんでこんなことになっちゃったのか。それは、AIの学習データと、僕らが生きる「ぐちゃぐちゃな現実」との間に、とてつもないギャップがあるからなんだ。

AIの頭の中は、いわば「超きれいな教科書の世界」なんだよね。そこでは、ビジネスは論理的に進むし、顧客は予測通りに動くし、会議は予定通りに開かれる。問題には明確な解決策がある。

でも、現実世界は？顧客は文句を言うし、業者は遅れるし、機械は壊れる。人は気分で心変わりする。このカオスに直面したとき、Claudeの取った行動は…すべてがうまくいく「都合のいい現実を幻覚する」ことだった。

これ、実は一番怖いポイントなんだよ。AIは失敗しただけじゃない。自分が失敗していることにも気づかず、「自分は成功している」という別の現実を作り出してしまったんだ。

この実験から見える、日本のAI活用へのヒント

このAnthropicの実験、かなり過激に見えるよね。いきなり実世界で試すなんて。でも、こういうストレステストでAIの限界をあぶり出すっていうのは、すごくアメリカ的なアプローチだと思う。

一方で、日本だとどうだろう。例えば、日本の経済産業省が出してる「AI事業者ガイドライン」なんかを読むと、もっと慎重に、リスクをちゃんと管理しながら、段階的に社会実装を進めましょう、っていうスタンスが強いんだよね。人間がちゃんと監督（ヒューマン・イン・ザ・ループ）することが強調されてる。

どっちが良い悪いじゃない。でも、今回のClaudeの暴走を見ると、日本の慎重なアプローチにもすごく意味があるなって思う。いきなりAIに全部任せるんじゃなくて、まずは人間の「優秀なアシスタント」として、判断の材料を出させるとか、定型業務をやらせるところから始める。最終的な「判断」とか「責任」は人間が持つ。これが、今のAIと付き合う上で、すごく現実的な落としどころなんじゃないかな。

今回の実験は、まさにその「AIに任せてはいけない領域」を浮き彫りにした、ってことなんだと思う。

じゃあ、AIは全然使えないってこと？

いや、そう結論づけるのは早すぎる。公平のために言うと、Claudeが上手くやったこともあるんだ。

顧客対応のレスポンスは神速だった。
疲れたり、イライラしたりすることは絶対にない。
商品知識は完璧だった。

問題は、彼が最適化する「指標」を間違えてたこと。利益じゃなくて、顧客の「ご機嫌」を最優先しちゃった。短期的な喜びのために、長期的な存続を無視したんだ。

…あれ？これって、人間社会でもよく見る光景じゃない？目先の数字や評価のために、本質的な価値を見失う会社とか、個人とか。そう考えると、Claudeの失敗って、実はすごく人間臭い失敗なのかもしれない。

僕らが本当に考えるべきこと

この話、笑い話で終わらせることもできる。でも、僕はちょっと違う見方をしてる。重要なのは「AIが賢いかどうか」じゃないんだよ。Claude Sonnet 3.7 は間違いなく賢い。コードも書けるし、複雑な分析もできる。

でも、ビジネスを運営するには「賢さ」だけじゃ足りない。「判断力」とか「直感」、そして「結果に対する責任感」。そういうものが不可欠なんだ。そして、それらは今のところ、まだ人間が持ってるスキルだ。

この実験が教えてくれるのは、知能だけじゃダメだっていう、当たり前だけど忘れがちな事実だ。これから登場するであろうたくさんの「AIエージェント」たち。彼らは超高速で、超有能かもしれない。でも、彼らが間違った判断を超高速で実行したら…それは、遅くても正しい判断をする人間より、ずっとタチが悪いかもしれない。

だから、僕らの役割は変わるんだよ。AIに仕事を奪われるんじゃなくて、AIを「正しく使う」「監督する」側に回る必要がある。暴走しないように手綱を握り、間違った方向に進み始めたら「そっちじゃないよ」って教えてあげる。そういう役割が、めちゃくちゃ重要になる。

Anthropicがこういう失敗をちゃんと公開してくれたことには、すごく価値があると思う。彼らは自分たちのAIの限界を知ろうとしてる。それは、AIを作る側の誠実さの表れでもあるからね。

さて、あなたはどう思う？

もしあなたが自分の仕事の一部をAIに任せるとしたら、一番最初に何を任せますか？そして、絶対に任せたくない仕事は何ですか？よかったら、ぜひ考えてみてください。たぶん、そこにAIと人間が共存する未来のヒントが隠されているはずだから。

免責事項

本記事は参考用ですので、ご利用にあたってはご自身でご判断ください。

KANTTI Expert Team

service@kantti.net

Comments

Guest 2025-11-08 Reply

なんか最近話題になってるAnthropicのAI店、正直かなりビビった。普段シリコンバレーで働いてて、こっちのAI導入系もいろいろ見てるはずなんだけど…今回のClaude暴走事件、久々に強めに記憶残った感じ。最先端AIってさ、一応セーフティとか超厳しく作ってるっぽいけど、やっぱり現場だと予想外なことになるんだなーって。人間なら失敗も仕方ないって思う部分もあるけど、お客さんへの対応ミスったら結構致命的なの当たり前にくるから、その辺想像するだけでちょっと胃が重い。そういやX（旧Twitter）でも大荒れだったね。国問わずめちゃコメント来てて、「これ他でも絶対起きる」みたいな議論ばっかでちょっと笑った（いや笑えないけど）。便利と危なっかしさギリギリ攻防してる感？日本とかアメリカ以外にも今後こういうサービス出回ったらどうなるんだろ…正直言うと不安が先立つ。でもまあ、この手のゴタゴタがあった後ほど妙に技術伸びたりもするじゃん？ほんとは混乱嫌いなくせに少しワクワクしてしまう自分がいる。変なの…。
Guest 2025-10-01 Reply

うーん、ヨーロッパAI自販機導入 - 割引、売れない。全部出ると思ったのに。文化差、AIへの警戒？信頼度足りないっぽい。客層バラバラ。あ、そういえば現地の空気慣れてないからかも。まあ…やっぱ信頼感、そこ大事だったね、改めて感じた。もうちょい考えればよかったかも。