AIエージェント

CLIをエージェント向けに設計する——6倍のトークン差が示す転換点

コーディングエージェントは今や、CLIの設計仕様を書き換えるほどの存在になっている。Designing the hf CLI as an agent-optimized way to work with the Hubは、Hugging F...
生成AI

AIエージェントを「業務現場」で評価する物差しが届いた——EVA-Bench Data 2.0

EVA-Bench Data 2.0: 3 Domains, 121 Tools, 213 Scenarios(ServiceNow AI / HuggingFace)航空カスタマーサービス・ITサービス管理・医療人事の3ドメインをカバー1...
生成AI

AI安全対策は、企業ごとの設計対象になっていく

NVIDIA は Hugging Face の記事 Nemotron 3.5 Content Safety: Customizable Multimodal Safety for Global Enterprise AI で、Nemotro...
AIエージェント

GitHub Universe が「エージェント時代」の幕を開ける

開発者とAIの関係が、また一段階変わろうとしている。GitHub Universe is back: All together now, in the agentic era - The GitHub BlogGitHubの年次カンファレン...
生成AI

生物脅威の「早期警戒」が変わる——AIが防衛の時間軸を動かす

パンデミックや生物兵器への対応で、最も致命的なコストは「時間」だ。感染拡大の初期段階で何が起きているかを把握できなければ、どれだけ優れた治療薬があっても間に合わない。OpenAIが公開した Biodefense in the Intelli...
LLM・基盤モデル

ChatGPTが「夢を見る」——記憶の量より構造化が次のパーソナライズを決める

記憶をたくさん持つAIと、記憶を上手に使えるAI。この二つは別物だ。OpenAIはDreaming: Better memory for a more helpful ChatGPTで、ChatGPTに新しい記憶システムを導入した。「Dre...
AIエージェント

AI活用の差は、ツールではなく設計にある

「AIを使いこなしている」と言える組織は、どこが違うのか。Microsoftのブログ記事「How Frontier Firms are rebuilding the operating model for the age of AI」は、2...
LLM・基盤モデル

AIエージェントを「前提」にする——Endavaが問い直す開発プロセスの骨格

ソフトウェア開発にAIを使っている企業は多い。だが「AIを使いながら開発する」と「AIを前提に開発プロセスを設計し直す」は、同じように見えてかなり異なります。OpenAIが公開したケーススタディ「How Endava is redesign...
AIエージェント

「ロボットをMCPツール化する」——エージェントが物理世界に手を伸ばす一歩

AIエージェントがロボットを「ツール」として呼び出す——その構成が実動する形で示された。Hugging Faceが公開したAdding MCP Tools to Reachy Miniは、小型ロボット「Reachy Mini」にMCPツール...
LLM・基盤モデル

好みを教える技術は、領域を選ばない

DPOという手法がある。Direct Preference Optimization——人間の「好み」の比較ペアをもとに、モデルの出力分布を直接調整する技術だ。チャットボットの応答品質を高める目的で広まったが、Hugging Face に公...