Gemini Omniが示す、生成AIの次の評価軸

Watch 9 Google videos of Gemini Omni and Gemini 3.5 Flash は、Google I/O 2026で発表された Gemini Omni と Gemini 3.5 Flash のデモを紹介しています。Omni は画像・音声・動画・テキストを入力にして動画を生成・編集し、3.5 Flash は長い手順を伴うエージェント作業やコーディングを担うモデルとして位置づけられています。

注目すべきなのは、モデル性能の説明が「賢い応答」から「継続的に作業を進められるか」へ移っている点です。動画編集のデモでは、自然言語で指示を重ねながら、人物や場面の一貫性を保って編集していく様子が示されています。これは単発の生成ではなく、作業途中の文脈を保持しながら成果物を変えていく能力です。

Gemini 3.5 Flash のデモも同じ方向を向いています。非構造なアセットの分類、UI生成、検索内でのカスタム体験、Workspace と連動する個人エージェントなど、中心にあるのは「答えるAI」ではなく「業務の途中工程に入り込むAI」です。

開発チームやプロダクト担当者にとって、この変化は導入判断の軸を変えます。従来は、モデルを比較するときに正答率、速度、コスト、コンテキスト長が主な評価項目でした。しかし、生成AIが実作業へ入るほど、評価すべきものは「一度で正しいか」だけではなくなります。複数ターンで意図を保てるか、途中状態を壊さないか、人間が監督しやすいか、既存ツールのワークフローに自然に接続できるかが重要になります。

Gemini Omni と Gemini 3.5 Flash のデモは、Google製品の機能紹介であると同時に、基盤モデル競争の焦点が移っていることを示しています。モデルは単体の能力ではなく、編集、検索、開発環境、業務アプリの中でどれだけ作業単位を引き受けられるかで評価される段階に入っています。

導入側が見るべきなのは、派手なデモそのものではありません。自分たちの現場で、どの作業が「一問一答」ではなく「状態を持つ反復作業」になっているかです。そこに接続できるモデルほど、AI活用は補助ツールから実行基盤へ近づいていきます。


関連記事


参考文献

コメント

タイトルとURLをコピーしました