LLM・基盤モデル

LLM・基盤モデル

「出すか出さないか」を超えて——Claude Fable 5が変えたAIリリースの設計

Anthropicが6月9日に公開したClaude Fable 5 and Claude Mythos 5は、単なるモデル更新ではなかった。Fable 5はほぼ全ての能力ベンチマークで最高水準を記録し、タスクが長く複雑になるほど他モデルとの...
LLM・基盤モデル

答えを教えるな——シエラレオネのRCTが示した教育AIの設計原則

生成AIが教室に入ってきたとき、最初に問われることがある。「生徒が考える前に、AIが答えを出してしまわないか」と。Gemini's guided learning: results from a randomized controlled ...
LLM・基盤モデル

翻訳が「待つ」のをやめた——Gemini 3.5 Live Translateが示す次の段階

Google DeepMindがGemini 3.5 Live Translate is hereを公開した。70言語以上に対応するリアルタイム音声翻訳モデルで、話者の抑揚・ペース・ピッチを保持しながら翻訳音声を連続生成する。従来のターン制...
LLM・基盤モデル

「崩壊が消えた」——5つのLLMが示した、設計されていない協調

誰もルールを変えていないのに、崩壊が消えた。The crash that vanished: control and emergence in a five-model economy は、木材資源をめぐる仮想経済シミュレーションの実験報告...
LLM・基盤モデル

「異質性」をプロダクトに変える——スモールモデル混在設計の逆転

マルチエージェントシステムで複数モデルを混在させることは「複雑化のコスト」として見られがちだ。その異質性をあえて価値として設計した事例がある。Five labs, five minds: building a multi-model fin...
LLM・基盤モデル

ChatGPTが「夢を見る」——記憶の量より構造化が次のパーソナライズを決める

記憶をたくさん持つAIと、記憶を上手に使えるAI。この二つは別物だ。OpenAIはDreaming: Better memory for a more helpful ChatGPTで、ChatGPTに新しい記憶システムを導入した。「Dre...
LLM・基盤モデル

AIエージェントを「前提」にする——Endavaが問い直す開発プロセスの骨格

ソフトウェア開発にAIを使っている企業は多い。だが「AIを使いながら開発する」と「AIを前提に開発プロセスを設計し直す」は、同じように見えてかなり異なります。OpenAIが公開したケーススタディ「How Endava is redesign...
LLM・基盤モデル

好みを教える技術は、領域を選ばない

DPOという手法がある。Direct Preference Optimization——人間の「好み」の比較ペアをもとに、モデルの出力分布を直接調整する技術だ。チャットボットの応答品質を高める目的で広まったが、Hugging Face に公...
LLM・基盤モデル

企業AIのスケール、鍵はLLMの性能よりエージェントロジックの設計にある

エンタープライズAIのパイロットが量産される一方で、本番化するプロジェクトが少ないという現象が続いている。モデルを切り替えても変わらない、という声は珍しくない。原因はLLMの性能ではなく、その先にある。IBM ResearchがBeyond...
LLM・基盤モデル

自社ツールで自社イベントを作る、という証明

AIツールは「発表される」ものから「使われる」ものへ、静かにフェーズが移りつつある。How Google used Gemini and other AI products to build I/O 2026(Google Blog, 20...