AIエージェント

クラウドに頼らない医療AIが、なぜ56倍速で動けるのか

医療AIが直面する制約の一つは、「患者データをクラウドに送れない」という現実だ。だが、クラウドAPIを使わなければ性能はどこまで確保できるのか。その問いに、一つの答えが出た。OncoAgent: A Dual-Tier Multi-Agen...
AIプロダクト

【開発ルポ】#3 Slackのリアクション一つで回る、月$54の一人編集部を作った

UIをどこに置くかは、運用が続くかどうかを決める。最初はWebの管理画面も考えた。でもSlackはすでに開いていて、通知が自然に届き、リアクション絵文字で返答できる。入力の摩擦が圧倒的に低い。Cruxnoteの編集部はSlackに置くことに...
AIコーディング

【開発ルポ】#2 LLMシステムを作ると、実装の大半がパースとリトライになった

「LLMシステムを作る」と言うと「Claude APIを呼ぶコードを書く」と思われやすい。でも実際に作ってみると、API呼び出し自体は全体の2割程度で、残りの8割はパースとリトライと排他制御に費やされる。Cruxnoteの実装でそれを体感し...
AIプロダクト

【開発ルポ】#1 AIに記事を書かせようとして、設計を全部直した話

AI関連ニュースは毎日大量に流れてくる。それを自動で記事にしたい——というのが最初のアイデアだった。RSSを読んで、要約して、WordPressに投稿する。シンプルな自動化で、技術的な難易度も高くない。でも少し考えると、問題が見えてきた。A...
AIコーディング

プロンプトのコピペをなくす設計思想——「知識」と「振る舞い」を分離すると何が変わるか

AIエージェントに文脈を持たせる——繰り返し入力が消える設計の本質毎回同じ前提を貼り付けながらAIを動かしている——そのコスト、設計で取り除けます。NotebookLM × Gem で実現する「指示ゼロAI」── 毎回のプロンプト入力から解...
AIビジネス

「会話を読む広告」が問う、AIアシスタントの中立性

「ChatGPTの「広告表示テスト」、日本でも開始へ 数週間以内に」(ITmedia AI+、2026年5月8日)によれば、OpenAIは日本でもChatGPT内の広告表示テストを数週間以内に開始する。無料プランと月額1400円のGoプラン...
LLM・基盤モデル

バグ発見が15倍になるとき、組織に問われること

「発見」と「修正」が分離する時代「Claude Mythos」が15年前のバグも発掘、Firefoxの修正数が一挙に15倍超にMozillaはAnthropicのAIモデル「Claude Mythos Preview」を活用し、Firefo...
生成AI

MoEの「専門化」は形だけだった——EMOが示す、本当のモジュール分化

Allen AIが公開したEMOは、既存MoEアーキテクチャの「専門化」に、静かに根拠を問い直す。EMO: Pretraining mixture of experts for emergent modularity(Allen AI)は、...
生成AI

【AIエージェント実地観察記 第4話】「任せる設計」が実用段階に入った——AIエージェント実地観察記 第4話

今回の観察テーマは「委任の粒度」です。半年前まで、AIエージェントへの期待は二極化していました。「全部任せれば動いてくれる」という楽観と、「結局プロンプトを書く手間が増えるだけ」という落胆——現場で試すと、その中間に着地することがほとんどで...
AIプロダクト

コードが映す「国力」——オープンソースデータで見えてきた技術的複雑性の地図

GitHubのデータが、国家の技術力を測る新しい尺度になりつつあるHow researchers are using GitHub Innovation Graph data to reveal the "digital complexit...