AIコーディング

Copilot CLI の「2つのモード」が使い分けられると、何が変わるか

GitHub Copilot CLI の interactive モードと non-interactive モードの違いが、公式ブログで初心者向けに整理された。GitHub Copilot CLI for Beginners: Intera...
コラム

「任せた」の先に見えるもの ─ AIエージェント実地観察記 第2話

前回の話では、AIエージェントを初めて実務に組み込んだときの違和感を書いた。今回は、その後しばらく使い続けて気づいたことを書く。エージェントに慣れてくると、面白いことが起きる。最初は「どこまでやってくれるんだろう」と恐る恐る委ねていたのが、...
コラム

「AI効果が出ています」を誰も検証しない問題

生成AIの「導入事例」が増え続けている。業務効率化、コスト削減、生産性向上——そうした成果が、各社の発表やメディアを通じて積み上がっていく。だが立ち止まって考えると、それらの多くは「体感として速くなった」「以前より楽になった」という感想に近...
コラム

「賢くなった」を誰が決めているか

週次でモデルリリースが積み重なるようになって久しい。「過去最高のスコアを達成」「推論能力が大幅に向上」という発表が届くたびに、一つ確認したくなることがある。その評価は、誰がやったのか、と。自己採点の構造生成AIの性能評価において、開発者が評...
AIコーディング

ツール選びより設計力——AIコーディングで差がつく場所が変わった

AIコーディングを巡る議論が、静かに変わりつつある。「どのツールがいいか」という問いが盛んだった時期はほんの少し前のことだが、2026年の春から、競争の軸がずれ始めている。AIコーディングは「ツール選び」から「実行基盤設計」へ移っている(h...
AIコーディング

「封印」は始まりだった ─ Claude Mythosの漏洩が示すAIコーディングの次の地平

2026年3月末、Anthropicの内部から予期せぬ形で情報が流れ出た。CMSの設定ミスが原因だった。だが「ミス」が暴いたのは、単なる未発表製品の存在ではなかった。【2026年4月最新】Claude Mythos(ミトス) Preview...
コラム

スコアが高くても「使えない」の正体

OpenAIがo3を発表したとき、ベンチマーク数字のインパクトは並外れていた。ARC-AGIで87.5%、GPQAダイヤモンドで87.7%、AIME 2024では96.7%——どの指標も、人間のトップパフォーマンスを射程に入れる水準だった。...
AIビジネス

「育成設計を組み直す」前に問うべきこと——AI研修改革の見えないコスト

ITmediaビジネスオンラインに掲載された「AI研修を1コマ追加」では変わらない 新入社員を戦力にする教育設計は、既存研修への単発追加では新人のAI活用力が育たない実態を整理し、オンボーディング・OJT・メンター設計を含むシステム的な再構...
生成AI

スコアが伸びるほど、見えなくなるもの

ベンチマークは何を測っているかまず、事実を認めるところから始める。ここ数年で主要な言語モデルのベンチマークスコアは大きく伸びた。MMLU、HumanEval、GSM8K──どの指標を取っても、2022年から2025年にかけての上昇幅は目を見...
生成AI

AIコーディング支援の生産性研究が測っていないもの

「Copilotを使うと開発速度が55%向上する」という数字を、一度は目にしたことがあるはずだ。GitHubが2022年に発表した調査結果で、以来この数字はAIコーディング支援ツール導入の根拠として営業資料や技術記事に広く引用されている。こ...