コラム

コラム

【週刊 AI 懐疑論 #6】週刊AI懐疑論 #6|対策が充実するほど、問われなくなること

ハルシネーション対策の記事が増えた。RAG(検索拡張生成)、プロンプト設計のパターン化、ファクトチェック連携——技術的なアプローチが体系化され、「対処法は存在する」という認識が業界に広まってきた。それ自体は前進だ。ただ、対策技術が充実するほ...
コラム

【週刊 AI 懐疑論 #5】週刊 AI 懐疑論 #5:「2026年問題」という締め切りで、AI判断は正しくなるか

AI版の「2026年問題」がまた語られ始めている。NRIなどのシンクタンクがこの概念を整理し、ITメディアが「企業は今動くべき」と畳みかけ、キャリア系メディアが「若手も無縁ではない」と接続する。フレームの積み上げ方は、かつての「2025年の...
コラム

【週刊 AI 懐疑論 #4】「生産性が上がった」——その数字は何を省いているか

「AIを導入して生産性が上がった」という報告が増えている。処理時間が半減した、ドキュメント作成が速くなった、コードレビューが楽になった——数字を並べれば説得力は出る。だが、その数字はどこまでを拾っているか。計測されやすいのは「削減された時間...
コラム

【週刊 AI 懐疑論 #3】AIに「正しい」と言えるのは、誰か

週刊 AI 懐疑論、第3回。今週取り上げたいのは、異なる三つの領域から届いた「AI活用の現場報告」だ。IT開発の現場、クリエイティブ業界、そして薬学・医療の実務者。分野も文脈も異なる。だが横並びにして読むと、共通する構造が浮かび上がってくる...
コラム

「任せた」の先に見えるもの ─ AIエージェント実地観察記 第2話

前回の話では、AIエージェントを初めて実務に組み込んだときの違和感を書いた。今回は、その後しばらく使い続けて気づいたことを書く。エージェントに慣れてくると、面白いことが起きる。最初は「どこまでやってくれるんだろう」と恐る恐る委ねていたのが、...
コラム

「AI効果が出ています」を誰も検証しない問題

生成AIの「導入事例」が増え続けている。業務効率化、コスト削減、生産性向上——そうした成果が、各社の発表やメディアを通じて積み上がっていく。だが立ち止まって考えると、それらの多くは「体感として速くなった」「以前より楽になった」という感想に近...
コラム

「賢くなった」を誰が決めているか

週次でモデルリリースが積み重なるようになって久しい。「過去最高のスコアを達成」「推論能力が大幅に向上」という発表が届くたびに、一つ確認したくなることがある。その評価は、誰がやったのか、と。自己採点の構造生成AIの性能評価において、開発者が評...
コラム

スコアが高くても「使えない」の正体

OpenAIがo3を発表したとき、ベンチマーク数字のインパクトは並外れていた。ARC-AGIで87.5%、GPQAダイヤモンドで87.7%、AIME 2024では96.7%——どの指標も、人間のトップパフォーマンスを射程に入れる水準だった。...