AIエージェント

AIエージェント

CNC製造の「30秒判断」が問うもの——MachinaCheckが示すオンプレAIの必然

MachinaCheck: Building a Multi-Agent CNC Manufacturability System on AMD MI300X2026年5月、AMD Developer Hackathonで発表されたマルチエ...
AIエージェント

クラウドに頼らない医療AIが、なぜ56倍速で動けるのか

医療AIが直面する制約の一つは、「患者データをクラウドに送れない」という現実だ。だが、クラウドAPIを使わなければ性能はどこまで確保できるのか。その問いに、一つの答えが出た。OncoAgent: A Dual-Tier Multi-Agen...
AIエージェント

Codexを組織で安全に動かす──OpenAIが公開した4つの設計原則

AIコーディングエージェントの導入を検討する組織が今ぶつかる問いは、「使えるか」ではなく「どう制御するか」だ。Running Codex safely at OpenAI は、OpenAIが自社内でCodexを安全に運用するために構築した設...
AIエージェント

AIのPRをレビューするとは、何を判断することか

エージェントが出したPRを、あなたはどう読むか。GitHub のブログ記事 Agent pull requests are everywhere. Here's how to review them. は、AI エージェントが PR を出す...
AIエージェント

トークン効率がエージェントの実用性を分ける

AIエージェントが複数のツールを呼び出しながらタスクをこなす場面では、1回の完了に膨大なトークンが消費される。これは単なるコストの問題ではない。トークン消費が増えるほど速度は落ち、精度の安定性も揺らぐ。GitHub は Improving ...
AIエージェント

「また話したい」と思われるAIに、何が足りなかったか

AIカスタマーサービスは長年、「仕方なく使うもの」だった。メニューを繰り返し読み上げるボット、意図を理解しない応答、最終的に人間へのエスカレートで終わる体験。顧客にとってそれは選択肢ではなく、障害だった。Parloa builds serv...
AIエージェント

エージェント推論をローカルへ——Gemma 4 がオープンモデルの上限を塗り替えた

Google DeepMindがGemma 4: Our most capable open models to dateを公開した。Gemini 3と同等の研究基盤に基づき、パラメータあたりの性能において過去最高水準を実現。高度な推論とエ...
AIエージェント

ローカルで動くエージェントが現実になる——Gemma 4が開いた扉

オープンモデルが「使えるレベル」を超えて「選ぶ理由がある」段階に来た、そう感じさせるリリースが届いた。Google DeepMindは4月2日、Gemma 4: Our most capable open models to date を発...
AIエージェント

正解が一つじゃないエージェントを、どう検証するか

Validating agentic behavior when "correct" isn't deterministic(GitHub Blog)は、Microsoft/GitHubの研究者がAIエージェントの評価設計について論じた記事...
AIエージェント

「エージェントが遅い」を終わらせるTPUの設計思想

AIエージェントに求められる計算の性質は、モデル訓練とは根本的に異なる。Googleはその違いを、ハードウェアの設計に持ち込んだ。Google introduces new TPUs at Cloud Next '26 によると、Googl...