AIエージェント

「エージェントに使えるか」が新しい品質基準になる

コーディングエージェントがライブラリを呼び出し、自らデバッグする。そのとき、APIの設計次第でエージェントの作業量が大きく変わるとしたら——ツールの「良さ」はどう測るべきか。Hugging Face の Is it agentic enou...
LLM・基盤モデル

LoRAは定番、だが最善ではないかもしれない

LLMのファインチューニングといえばLoRAが標準だ。だが標準と最善は同じではない。HuggingFaceのブログBeyond LoRA: Can you beat the most popular fine-tuning techniqu...
AIエージェント

リサーチエージェントのクエリは「漏洩口」になる

エージェントが何を「検索しているか」に注目したことがあるか。ServiceNow が HuggingFace で公開した研究 MosaicLeaks: Can your research agent keep a secret? は、ディー...
AIエージェント

「完璧なAI」を前提にしない——DeepMindが示すエージェント時代の安全設計

AIエージェントを本番環境に投入するとき、どこまで信頼してよいのか。その問いに対し、Google DeepMindが実践的な答えを出した。Securing the future of AI agentsでは、内部システムへのAI導入における...
生成AI

専門家が解けなかった症例に、AIが18の答えを出した

希少疾患の診断を妨げているのは、専門知識の不足ではない。知識の「連結」が間に合わないことだ。OpenAIの研究チームが推論モデルを用いた希少疾患診断支援の成果を報告した。Using AI to help physicians diagnos...
LLM・基盤モデル

「医師の推論」をAIが学ぶとき——ヘルスケア情報の使い方が変わる

健康に関する質問を ChatGPT に投げると、以前はほぼ決まった結末があった。「医療専門家にご相談ください」という文句で締めくくられる、情報とも助言とも言えない回答だ。なぜそうなるか。ヘルスケア領域には誤りの代償が大きく、曖昧な情報提供が...
LLM・基盤モデル

支出制御が整ったとき、企業はAI活用の「様子見」を終えられる

OpenAIが公開したNew usage analytics and updated spend controls for enterprisesは、ChatGPT Enterpriseに利用分析ダッシュボードと支出上限設定を追加したものだ...
AIエージェント

「発見」をエージェントに渡す——ARD仕様が解く次の課題

MCP、Skill、A2A。エージェント連携の土台は急速に整ってきた。しかし一つだけ、まだ人間が担っている工程がある。「どのツールを使うか」を決める、発見のプロセスだ。Hugging Face のブログ Agentic Resource D...
生成AI

「なぜ動くか」を予測に組み込む——言語ガイド3D動作予測の射程

人はロボットに「棚のカップを取って」と伝えることができる。しかし従来の3D動作予測は、言語を無視して軌道データだけを学習してきた。AllenAIが発表したMolmoMotion: Language-guided 3D motion fore...
AIコーディング

コンテキスト設計が、AIコーディングの次の競争軸になる

GitHub が Copilot の内部設計改善を公開した。記事が示す方向は、AIコーディングツールの競争がどこへ向かうかを読む上で注目に値する。Getting more from each token: How Copilot impro...