生成AI

週刊AI懐疑論 #1|「生産性55%向上」は何を測ったのか

何が「生産性」なのかを問わずに、数字を受け取っている「AIコーディングアシスタントで生産性が55%向上した」GitHubが2022年に発表したこの数字は、その後のAI開発ツール議論のベースラインになった。McKinsey、Deloitte、...
LLM・基盤モデル

限定公開LLMは『高性能』だけで広がらない──Claude Mythos論争が示す評価軸

限定公開モデルの「性能」は、導入可能性と切り分けて見る必要があります。今回の話題は、Anthropicの限定公開モデル Claude Mythos と、その再構築をうたうOSS実装 OpenMythos をどう評価するかです。まず押さえるべ...
AIエージェント

AIエージェント本番化の壁は「信頼の設計」にある

パイロットで動いたエージェントが、なぜ本番に届かないのか。複数のエンタープライズAI調査が繰り返し示す数字がある。AIエージェントのPoC(概念実証)が本番稼働に移行できる割合は15〜20%程度に留まるというものだ。技術的には動いている。精...
AIコーディング

AIコーディングツールが変えているのは速さではなく、1人が扱える仕事の射程だ

GitHub Copilotが公開されて約3年。「AIでコードが速く書ける」という体感は、多くのエンジニアにとって実感を伴うものになっている。GitHubの調査ではCopilot利用者のタスク完了速度が最大55%向上したとされており、Jet...
AIビジネス

「提携」で加速するのは、本当にソリューションなのか

大手IT企業とAI企業の提携発表が、ここ1〜2年で急増している。NTTグループ、富士通、NECといった日本のIT大手がOpenAIやMicrosoftのAzure OpenAI Service、Google CloudのVertex AIと...
AIコーディング

並列 AI セッションの加速は、依存管理で決まる

従来のリファクタリングの制約が解放される大規模リファクタリングが難しい理由は、規模ではなく実行手段の制約にあります。従来は単一エンジニア・単一 AI セッションで全体を串刺しにする必要がありました。しかし複数 AI セッションの並列運用によ...
AIエージェント

AIエージェントがインフラを操作する時代に、設計の前提が静かに変わっている

クラウドインフラのコンソールは、長らく人間のための画面だった。GUIでリソースを作成し、ボタンを押してデプロイし、ログをブラウザで確認する。その設計思想は「人間がインフラを操作する」という前提のうえに成り立っている。AIエージェントが実際に...
生成AI

複数視点の統合は、記事品質をどう変えるのか

記事生成AIが直面する構造的な課題がある。単一視点に依存すると、精密なプロンプト調整をしても、一度に一つの角度からしか問題を照らすことができない。特に論争的なテーマや判断が分かれるトレンドでは、この限界が顕著だ。author パイプラインが...
生成AI

複数視点の『自動統合』は、記事品質を高めるか

メディアの品質を高めるには、複数の視点からテーマを検証する必要がある。推進・拡張・批判など異なる立場から同時に論点を分析することで、単一視点では見落とされた論点が浮かぶ。従来、この多角的な検証は手作業による確認を前提としていた。author...
生成AI

「補助ツール」を超えた AIエージェント——協働設計が実務者の差分になる

Claude Code がコードを書き、Devin が Issue を自律的に処理し、Cursor がリファクタリング提案を出す。生成AI は「使えると便利なツール」から、開発フローの構造そのものを変える存在へと移行しつつある。変化のドライ...