クラウドに頼らない医療AIが、なぜ56倍速で動けるのか

医療AIが直面する制約の一つは、「患者データをクラウドに送れない」という現実だ。だが、クラウドAPIを使わなければ性能はどこまで確保できるのか。その問いに、一つの答えが出た。

OncoAgent: A Dual-Tier Multi-Agent Framework for Privacy-Preserving Oncology Clinical Decision Support は、腫瘍科向けの臨床意思決定支援システムを完全オープンソースで実装した技術プレプリントだ。70以上のNCCN・ESMOガイドラインを参照するCorrective RAGパイプラインと、9Bと27Bの2段階LLMによるルーティング設計を組み合わせ、Zero-PHIポリシー（患者個人情報の完全非保存）をアーキテクチャ上で実現している。

注目すべきはその処理速度だ。AMD Instinct MI300X上でQLoRAファインチューニングを実施したところ、APIベース生成と比べて56倍のスループット向上を達成した。26万6000件超の腫瘍科症例を含むコーパスを用いたファインチューニングが約50分で完了している。

ここで揺らぐのは、「オンプレ＝妥協」という前提だ。従来、高性能な医療AIはクラウドAPIへの依存とセットで語られることが多かった。OncoAgentはその等式を崩し、オンプレ完結・完全オープンソースという選択肢が、性能においても後退を意味しないことを示した。

プライバシー制約の強い医療機関や公的機関にとって、「クラウドなしでも本格的なマルチエージェントAIが動く」という実証は、導入検討の起点になりうる。ローカルで動くことが制約ではなく、設計の強みになる——そういうアーキテクチャの選択肢が増えつつある。

出典：OncoAgent（OncoAgent Research Group, May 2026）

参考文献

OncoAgent: A Dual-Tier Multi-Agent Framework for Privacy-Preserving Oncology Clinical Decision Support

クラウドに頼らない医療AIが、なぜ56倍速で動けるのか

関連記事

コメント