LLM・基盤モデル

LLM・基盤モデル

「見せない」では間に合わない — セキュリティ知識のデュアルユース問題が示す次の問い

Zennに掲載されたAIに「見せてはいけないもの」を、人類はもう見せ始めているは、AIがセキュリティ知識を学習することで「守る知識」が「壊す知識」に転化しうると指摘する。開発競争の中でルール作りが追いついていない現状を問題視し、「何を見せな...
LLM・基盤モデル

重みの差分だけ送ればいい——兆パラメータRL学習の転換点

Shipping a Trillion Parameters With a Hub Bucket: Delta Weight Sync in TRL(arXiv: 2602.03839)がHuggingFaceのTRLチームから公開された。...
LLM・基盤モデル

GPUを増やす前に、待ち時間を疑う

LLM推論の高速化は、モデルやカーネルの改善だけで決まるわけではありません。高価なGPUを使っていても、CPUとの受け渡しで待ち時間が残れば、その分だけ処理能力は眠ったままになります。Hugging FaceのUnlocking async...
LLM・基盤モデル

LLM推論の余白は、モデルの外側に残っている

GPUを増やす前に、まだ詰められる待ち時間があるのではないでしょうか。Hugging Face の記事 Unlocking asynchronicity in continuous batching は、LLM 推論における continu...
LLM・基盤モデル

多言語検索の選択肢は「大きいほど強い」から変わるのか

Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context — Best Sub-100M Retrieval Qu...
LLM・基盤モデル

多言語RAGは「大きな埋め込みモデル待ち」ではなくなる

Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context — Best Sub-100M Retrieval Qu...
LLM・基盤モデル

0.1Bのまま再ランクする——Ettin Rerankerが広げるRAG設計の選択肢

RAGパイプラインで「検索精度が足りない」と感じたとき、真っ先に候補に上がるのがRerankerだ。だが、既存の再ランクモデルはサイズが大きく推論コストが高い——そのジレンマが、実装判断を難しくしてきた。Hugging Face が公開した...
LLM・基盤モデル

リモートセンシングに基盤モデルの波——OlmoEarth v1.1 が広げる可能性

AllenAI が公開した OlmoEarth v1.1: A more efficient family of Earth observation models は、衛星・リモートセンシング画像に特化した基盤モデルファミリーの改善版だ。事...
LLM・基盤モデル

ChatGPTが「答える」根拠を変える——OpenAIとブラジル大手メディアの提携

ChatGPTは便利だ。だが「何を根拠に答えているのか」という問いは、使えば使うほど浮かび上がる。OpenAI, Grupo Folha and Grupo UOL announce strategic content partnershi...
LLM・基盤モデル

自己回帰の限界を超える──NVIDIAの拡散型LMが変える推論速度の構造

テキスト生成はどこまで速くなれるか。この問いに、最適化ではなくアーキテクチャで答えようとしているのがNVIDIAの新しい取り組みだ。Towards Speed-of-Light Text Generation with Nemotron-L...