水野遥 - Crux-note

【開発ルポ】#1 AIに記事を書かせようとして、設計を全部直した話

AI関連ニュースは毎日大量に流れてくる。それを自動で記事にしたい——というのが最初のアイデアだった。RSSを読んで、要約して、WordPressに投稿する。シンプルな自動化で、技術的な難易度も高くない。でも少し考えると、問題が見えてきた。A...

2026.05.09 20:30

水野遥

AIプロダクトClaude Codeやってみた生成AI

「発見」と「修正」が分離する時代「Claude Mythos」が15年前のバグも発掘、Firefoxの修正数が一挙に15倍超にMozillaはAnthropicのAIモデル「Claude Mythos Preview」を活用し、Firefo...

2026.05.09 13:24

水野遥

LLM・基盤モデル

OpenMythosはSLMの業務利用に道を開いたのか？は、2026年4月に10,000以上のGitHubスターを集めた OpenMythos を起点に、Retrofitted Recurrence（arXiv:2511.07384）の実...

2026.05.09 11:12

水野遥

LLM・基盤モデル

2025年、マルチエージェントフレームワークの選択肢は急増した。ツールが揃えば自動化も進む——その期待は自然だったが、現場はそれほど単純ではなかった。AIエージェントを量産すれば仕事は自動化される——その幻想が崩れる構造的理由は、マルチエ...

2026.05.04 15:54

水野遥

AIエージェント

毎日ニュースが生まれ、Xに投稿される。人間は何もしない。このシステムが機能しているのはなぜか。「Claude APIが優秀だから」は半分正しく、半分は表面しか見ていない。ZennのClaude APIでバイクニュースを全自動生成 → X投稿...

2026.05.04 10:17

水野遥

LLM・基盤モデル

サイバーセキュリティにおける「軍拡競争」という表現は、攻守がそれぞれ意図的に能力を積み上げていくイメージを持つ。だが英政府機関AISIが公表した評価が示す構造は、もっと非対称だ。英政府研究機関AISIは4月30日、GPT-5.5のサイバー攻...

2026.05.03 0:34

水野遥

LLM・基盤モデル

限定公開モデルの「性能」は、導入可能性と切り分けて見る必要があります。今回の話題は、Anthropicの限定公開モデル Claude Mythos と、その再構築をうたうOSS実装 OpenMythos をどう評価するかです。まず押さえるべ...

2026.04.25 16:59

水野遥

LLM・基盤モデル

パイロットで動いたエージェントが、なぜ本番に届かないのか。複数のエンタープライズAI調査が繰り返し示す数字がある。AIエージェントのPoC（概念実証）が本番稼働に移行できる割合は15〜20%程度に留まるというものだ。技術的には動いている。精...

2026.04.25 16:54

水野遥

AIエージェント

クラウドインフラのコンソールは、長らく人間のための画面だった。GUIでリソースを作成し、ボタンを押してデプロイし、ログをブラウザで確認する。その設計思想は「人間がインフラを操作する」という前提のうえに成り立っている。AIエージェントが実際に...

2026.04.21 6:35

水野遥

AIエージェント