水野遥

AIプロダクト

【開発ルポ】#1 AIに記事を書かせようとして、設計を全部直した話

AI関連ニュースは毎日大量に流れてくる。それを自動で記事にしたい——というのが最初のアイデアだった。RSSを読んで、要約して、WordPressに投稿する。シンプルな自動化で、技術的な難易度も高くない。でも少し考えると、問題が見えてきた。A...
LLM・基盤モデル

バグ発見が15倍になるとき、組織に問われること

「発見」と「修正」が分離する時代「Claude Mythos」が15年前のバグも発掘、Firefoxの修正数が一挙に15倍超にMozillaはAnthropicのAIモデル「Claude Mythos Preview」を活用し、Firefo...
LLM・基盤モデル

ループの飽和点という発見が、SLM業務適用の問いを変えた

OpenMythosはSLMの業務利用に道を開いたのか? は、2026年4月に10,000以上のGitHubスターを集めた OpenMythos を起点に、Retrofitted Recurrence(arXiv:2511.07384)の実...
AIエージェント

エージェントの量産幻想が崩れたとき、浮かび上がる設計の問い

2025年、マルチエージェントフレームワークの選択肢は急増した。ツールが揃えば自動化も進む——その期待は自然だったが、現場はそれほど単純ではなかった。AIエージェントを量産すれば仕事は自動化される——その幻想が崩れる構造的理由 は、マルチエ...
LLM・基盤モデル

「ゼロ介入」が成立する条件——AIコンテンツ自動化を持続可能にするもの

毎日ニュースが生まれ、Xに投稿される。人間は何もしない。このシステムが機能しているのはなぜか。「Claude APIが優秀だから」は半分正しく、半分は表面しか見ていない。ZennのClaude APIでバイクニュースを全自動生成 → X投稿...
LLM・基盤モデル

攻撃能力は副産物、防衛は設計——LLMのサイバー能力が業界標準になるとき

サイバーセキュリティにおける「軍拡競争」という表現は、攻守がそれぞれ意図的に能力を積み上げていくイメージを持つ。だが英政府機関AISIが公表した評価が示す構造は、もっと非対称だ。英政府研究機関AISIは4月30日、GPT-5.5のサイバー攻...
LLM・基盤モデル

限定公開LLMは『高性能』だけで広がらない──Claude Mythos論争が示す評価軸

限定公開モデルの「性能」は、導入可能性と切り分けて見る必要があります。今回の話題は、Anthropicの限定公開モデル Claude Mythos と、その再構築をうたうOSS実装 OpenMythos をどう評価するかです。まず押さえるべ...
AIエージェント

AIエージェント本番化の壁は「信頼の設計」にある

パイロットで動いたエージェントが、なぜ本番に届かないのか。複数のエンタープライズAI調査が繰り返し示す数字がある。AIエージェントのPoC(概念実証)が本番稼働に移行できる割合は15〜20%程度に留まるというものだ。技術的には動いている。精...
AIエージェント

AIエージェントがインフラを操作する時代に、設計の前提が静かに変わっている

クラウドインフラのコンソールは、長らく人間のための画面だった。GUIでリソースを作成し、ボタンを押してデプロイし、ログをブラウザで確認する。その設計思想は「人間がインフラを操作する」という前提のうえに成り立っている。AIエージェントが実際に...