AIにセキュリティを教える問いは、「境界線」の話ではもうない

セキュリティ知識をAIに学習させることは、攻撃能力を高める危険を上回るのか。

この問いに向き合った記事がある。AIに「見せてはいけないもの」を、人類はもう見せ始めている。記事の核心は三点だ。AIはセキュリティを学習すると「守る知識」と「壊す知識」を同時に持つ。ノーコード開発のAIが「関連している」と判断して意図外のロジックを変更するように、AIは人間の想定を超えた「全体」を見る。だから今必要なのは「AIに全部やらせる能力」ではなく、「何を見せないか」を決める能力だ——と。

問いの立て方はわかる。だが、この問いが乗っている前提に引っかかる。

「見せない」という戦略のアーキテクチャ的限界
問いを書き換えると、構造が見えてくる

「見せない」という戦略のアーキテクチャ的限界

「何を見せるか」を管理できる、という前提だ。

現実はすでに動いている。米国系ラボ、中国系ラボ、OSSコミュニティが並行してセキュリティ知識を学習したモデルを開発・公開している。NVD（National Vulnerability Database）のような公開脆弱性データベースはすでに広く学習材料として使われており、一社が「境界線」を引いても別の主体は引かない。「見せない」という戦略は、単一のアクターが学習データを統制できるという前提に立っているが、その前提はすでに崩れている。

問いを書き換えると、構造が見えてくる

「AIにセキュリティを学習させるべきか」ではなく、「AIが防御側に与えるレバレッジは攻撃側に与えるレバレッジより大きいか」——この問いのほうが、実質的だ。

ここには構造的な非対称性がある。防御側はシステムの内部構造・ログ・文脈を持っている。攻撃側は外部から探索する。AIが脆弱性探索能力を高めるとき、防御側は「自分のシステムの文脈込みでAIを活用できる」というアドバンテージを持つ。この非対称性が、セキュリティAIの波及先を決める。

サイバー保険の引受モデルはAIによる脆弱性スキャン結果をリスク評価に組み込み始めている。コンプライアンスオートメーションでは規制要件をセキュリティ設定に変換するツールが登場し、DevSecOpsではリアルタイム脆弱性検出がパイプラインに標準化されつつある。いずれも「守る知識をAIが持つ」ことを前提に設計された隣接領域だ。これらの動きは「境界線を引く」方向ではなく、「防御側がAIのレバレッジをいかに先に手にするか」という競争として展開している。

「学習させるべきでなかった」という後知恵の問いより、「誰の手に防御AIが先に届くか」という設計の問いが、すでに実質的な論点になっている。

関連記事

参考文献

AIに「見せてはいけないもの」を、人類はもう見せ始めている