安全企業が5日間で2度壊れた
逆張り — Anthropic
3月26日、Anthropicの内部CMSに設定ミスが見つかり、未公開資産約3,000件が外部からアクセス可能な状態になっていた。流出した情報の中に、社内コードネーム「Capybara」で開発中の次世代モデル「Claude Mythos」の存在が含まれていた。内部ベンチマークでは、現行のClaude Opus 4.6をコーディング・推論・サイバーセキュリティのすべてで大幅に上回るとされ、「能力の次元が変わる(step change)」と記述されていた。
その5日後の3月31日、今度はClaude Codeのソースコードがnpmパッケージに含まれたまま公開された。.npmignoreファイルの設定漏れで、59.8MBのソースマップ——1,900ファイル、512,000行のTypeScriptがそのまま配信された。
コミュニティの反応は爆発的だった。流出コードをもとにしたクリーンルーム書き換えプロジェクトが立ち上がり、2時間で5万GitHub スターを獲得した。同時に、混乱に乗じたサプライチェーン攻撃が発生。トロイの木馬化されたaxiosパッケージがUTC 00:21〜03:29の間に配信され、その間にアップデートした開発者が被害を受けた。
“Anthropicはモデルの安全性については世界最高水準かもしれないが、基本的なDevOpsのセキュリティで躓いた。.npmignoreの1行が抜けていただけだ”
反論
Anthropicは両事故とも数時間以内に対応し、影響範囲の特定と修正を完了したと発表した。モデルの安全性研究と運用セキュリティは別の問題であり、前者の実績が後者の事故で否定されるわけではないという指摘もある。
