LLM・基盤モデル

LLM・基盤モデル

Gemini API に Webhook—エージェント開発の「待ち」が設計から消える

AIエージェントが長時間のタスクを担う機会が増えるほど、「完了をどう検知するか」という設計上の問いが現実になる。Event-Driven Webhooks in the Gemini API によると、GoogleはGemini APIにイ...
LLM・基盤モデル

「難しい仕事を任せる」閾値が、また下がった

いちばん難しいコーディング作業を、監督なしに渡せる——その一文が、今回の発表を読んで最初に引っかかった。Introducing Claude Opus 4.7 | AnthropicAnthropic が発表した Claude Opus 4...
LLM・基盤モデル

AIを「後付け」ではなく「前提」として設計する世代が来た

AIを前提に設計する世代が、実装フェーズに入りつつあるOpenAIが公開した Introducing ChatGPT Futures: Class of 2026 は、ChatGPTを活用して研究・実装・社会課題解決に取り組む26人の学生を...
LLM・基盤モデル

クリエイティブAIの次の一手——「置き換え」ではなく「統合」へ

AIがデザイナーや映像クリエイターの仕事を「奪う」という文脈は、まだ根強い。ところが、Anthropicの最新の施策はその方向とは少し異なる。AnthropicはClaude for Creative Workを発表。Adobe Creat...
LLM・基盤モデル

AI実装の「最後の1マイル」に資本が入った

大規模な資本と専門人材が、エンタープライズAI導入の構造的ギャップを埋めにきた。Anthropicは5月4日、Blackstone、Hellman & Friedman、Goldman Sachsとともに新たな企業向けAIサービス会社の設立...
LLM・基盤モデル

金融AIは「議論」から「選択」へ——Anthropicの10エージェントが変える導入の前提

AI 活用の議論が長引く業界の一つが、金融だ。規制・コンプライアンス・データ管理の壁が高く、「どう使うか」の前に「使っていいか」の確認だけで数ヶ月かかることも珍しくない。Anthropicは5月5日、Agents for financial...
LLM・基盤モデル

「ゼロ介入」が成立する条件——AIコンテンツ自動化を持続可能にするもの

毎日ニュースが生まれ、Xに投稿される。人間は何もしない。このシステムが機能しているのはなぜか。「Claude APIが優秀だから」は半分正しく、半分は表面しか見ていない。ZennのClaude APIでバイクニュースを全自動生成 → X投稿...
LLM・基盤モデル

攻撃能力は副産物、防衛は設計——LLMのサイバー能力が業界標準になるとき

サイバーセキュリティにおける「軍拡競争」という表現は、攻守がそれぞれ意図的に能力を積み上げていくイメージを持つ。だが英政府機関AISIが公表した評価が示す構造は、もっと非対称だ。英政府研究機関AISIは4月30日、GPT-5.5のサイバー攻...
LLM・基盤モデル

限定公開LLMは『高性能』だけで広がらない──Claude Mythos論争が示す評価軸

限定公開モデルの「性能」は、導入可能性と切り分けて見る必要があります。今回の話題は、Anthropicの限定公開モデル Claude Mythos と、その再構築をうたうOSS実装 OpenMythos をどう評価するかです。まず押さえるべ...
LLM・基盤モデル

「ためたが使えない」を変えるのは、検索ではなく構造だ

ノートアプリや Wiki に知識をためても、時間がたつと埋もれる。その理由を「検索機能が弱い」と考えている人は多い。ただ実際には、問題は検索の精度ではなく、ためた知識がどう繋がっているのか、今どこで活躍するのかが不可視化されることにある。個...