2026-05

LLM・基盤モデル

バグ発見が15倍になるとき、組織に問われること

「発見」と「修正」が分離する時代「Claude Mythos」が15年前のバグも発掘、Firefoxの修正数が一挙に15倍超にMozillaはAnthropicのAIモデル「Claude Mythos Preview」を活用し、Firefo...
生成AI

MoEの「専門化」は形だけだった——EMOが示す、本当のモジュール分化

Allen AIが公開したEMOは、既存MoEアーキテクチャの「専門化」に、静かに根拠を問い直す。EMO: Pretraining mixture of experts for emergent modularity(Allen AI)は、...
生成AI

【AIエージェント実地観察記 第4話】「任せる設計」が実用段階に入った——AIエージェント実地観察記 第4話

今回の観察テーマは「委任の粒度」です。半年前まで、AIエージェントへの期待は二極化していました。「全部任せれば動いてくれる」という楽観と、「結局プロンプトを書く手間が増えるだけ」という落胆——現場で試すと、その中間に着地することがほとんどで...
AIプロダクト

コードが映す「国力」——オープンソースデータで見えてきた技術的複雑性の地図

GitHubのデータが、国家の技術力を測る新しい尺度になりつつあるHow researchers are using GitHub Innovation Graph data to reveal the "digital complexit...
生成AI

年齢確認法が「設計の前提」を変える理由

GitHub ブログに「Why age assurance laws matter for developers」が公開されました。米英を中心に進む年齢確認(age assurance)義務化が、なぜ開発者の問題になるのかを整理した記事です...
AIプロダクト

予算ではなく「物語」で勝負できる時代が来た

広告制作の品質格差は、長い間「予算の問題」とされてきた。スタジオ、制作チーム、著名なクリエイティブディレクター——それらを揃えられるのは大企業だけという前提があった。Googleが今月発表したThe Small Briefは、その前提に正面...
LLM・基盤モデル

「学習」と「保護」は対立しない——ChatGPTのプライバシー設計が示す構造

How ChatGPT learns about the world while protecting privacy(OpenAI)は、ChatGPTがどのようにプライバシーを守りながらモデル改善を続けるかを解説したドキュメントだ。ユーザ...
AIエージェント

Codexを組織で安全に動かす──OpenAIが公開した4つの設計原則

AIコーディングエージェントの導入を検討する組織が今ぶつかる問いは、「使えるか」ではなく「どう制御するか」だ。Running Codex safely at OpenAI は、OpenAIが自社内でCodexを安全に運用するために構築した設...
コラム

【週刊 AI 懐疑論 #3】AIに「正しい」と言えるのは、誰か

週刊 AI 懐疑論、第3回。今週取り上げたいのは、異なる三つの領域から届いた「AI活用の現場報告」だ。IT開発の現場、クリエイティブ業界、そして薬学・医療の実務者。分野も文脈も異なる。だが横並びにして読むと、共通する構造が浮かび上がってくる...
LLM・基盤モデル

ループの飽和点という発見が、SLM業務適用の問いを変えた

OpenMythosはSLMの業務利用に道を開いたのか? は、2026年4月に10,000以上のGitHubスターを集めた OpenMythos を起点に、Retrofitted Recurrence(arXiv:2511.07384)の実...