誤検知が信頼を壊す——LLMはセキュリティスキャンをどう変えるか

セキュリティツールへの信頼は、誤検知によって静かに失われていく。

GitHubは、シークレットスキャンにおける誤検知削減の取り組みを詳解した記事を公開した。Making secret scanning more trustworthy: Reducing false positives at scale では、以下の要点が示されている。

LLMをスキャン結果の文脈判断に活用し、誤検知を大規模に抑制する仕組みを実装
Microsoftの主任応用科学者 Mariko が、LLMを用いたエージェントワークフローの観点からこの取り組みを主導
正規表現では捉えられない「それっぽさ」の判定にLLMを組み込むことで、スキャン精度の向上を図る

従来のシークレットスキャンは、正規表現ベースのパターンマッチングが主流だった。APIキーやトークンらしき文字列を広く検出するには有効だが、テストコードのダミー値や例示用の文字列も引っかかる。大量のアラートが生成されると、開発者は「どうせノイズだろう」と感じ始める。本物の漏洩を見逃すリスクは、アラートが増えるほど高まるという逆説だ。「狼少年」になったスキャナーは、組織全体のセキュリティ感度を静かに下げていく。

LLMを介入させると、この構造が変わる。「これは実際に使われているシークレットか」という文脈判断が加わる。コードの周辺、変数名、ファイルの種別から、本番環境で有効なトークンか、テスト用のプレースホルダーかを推論できる。ルールベースでは捉えられない「それっぽさ」の判定こそLLMが得意とする領域であり、セキュリティスキャンとの相性は高い。

誤検知の削減は、機能追加ではなく信頼の回復だ。アラートを信じられるツールになってはじめて、開発者はそれを行動の起点にできる。LLMが「判断の補助」を超えて「ツールへの信頼の基盤」として機能する事例として、この取り組みは参照価値がある。

関連記事

参考文献

Making secret scanning more trustworthy: Reducing false positives at scale – The GitHub Blog