Claude Code

AIに渡せない暗黙知——設計哲学の外部化が、大規模AI開発のインフラになる

巨大フレームワークをAIと作って気づいた、開発哲学を『明文化』する技術 は、30クレート・70万行規模のRust製フレームワークをClaude Codeとともに開発してきたエンジニアによる実録記事です。セッションをまたぐたびに「昨日と違う書...
AIエージェント

AIを実行者にしない設計が、変更管理を超えて広がる理由

【Agent Hackathon】DNS変更作業をAIエージェントで証跡化する ChangeProof Agent を作ったDNS変更のリスク評価から承認文、実行手順、ロールバック手順、Evidence Bundleの保存まで、AIが一括し...
AI規制・政策

サイバーAIの「特化」は、防御力の証明ではない

「特化型」という言葉は強い。汎用モデルより優れている、そういう印象を自然に与える。だが、何がどう特化しているのかが示されないまま、その言葉だけが先行するとき、判断の質は下がる。OpenAI、日本政府とサイバーセキュリティで協力 最新AI「G...
生成AI

「8週間で動く」——AI学習ツール開発の速度が変わった

日本語を暗記ではなくAI生成ストーリーで学ぶ。手話練習中に、リアルタイムでフォームの指摘を受ける。これらはすでに動いている。Students prototype learning tools with AI at University of...
LLM・基盤モデル

推論と生成が一体化した日——GeminiがAI活用の前提を変える

Google I/O 2026で発表されたWatch 9 Google videos of Gemini Omni and Gemini 3.5 Flashは、9本のデモを通じて2つのモデルの実力を公開した。Gemini Omniは画像・音...
生成AI

「コードが書けない」は言い訳にならなくなった

コードを書けなければアプリは作れない——その前提が、具体的な事例によって崩れた。Take Google's vibe coded I/O 2026 quiz は、Google I/O 2026 の発表内容を問うクイズアプリだ。制作したのはコ...
AIビジネス

AIの信頼は、誰がどう評価するかで決まる——OpenAIが示した第三者評価の共通基盤

AIが業務判断の中核に入るほど、「本当に信頼できるのか」という問いは避けられなくなる。だが、その問いに答える評価の枠組み自体が、これまで各社バラバラに存在していた。OpenAI が公開した A shared playbook for tru...
LLM・基盤モデル

実験サイクルを変えるCodex——顧客リクエストからコードへの距離が縮まった

顧客のフィードバックがリアルタイムでコードになるとしたら、エンジニアリングチームの動き方はどう変わるだろうか。AIエバリュエーション基盤を手がけるBraintrustが、その実例を示した。How Braintrust turns custo...
生成AI

「診断できなかった」に届くAI——ボストン小児病院の事例が示す転換

稀少疾患は、診断がつくまでに平均7年かかると言われる。その理由の一つは、医師が知らない病気は診断できないという、医療の構造的な限界にある。Boston Children's uses AI to unlock new diagnosesボス...
LLM・基盤モデル

最適化の「当て感」をなくす——torch.profilerで始めるPyTorchプロファイリング入門

HuggingFace が公開した Profiling in PyTorch (Part 1): A Beginner's Guide to torch.profiler は、PyTorch 公式のプロファイリングツール torch.pro...