Gemini 読了 8 分

GoogleがNano Banana 2 LiteとGemini Omni Flashをリリース、高速低コスト画像・動画生成を実現

shiritomo | AI・SNS・話題のテック情報メディア by Hashout編集部 @shiritomoAI_jp 2026年7月1日 更新
GoogleがNano Banana 2 LiteとGemini Omni Flashをリリース、高速低コスト画像・動画生成を実現

4秒未満で画像が完成し、コストは1K解像度あたり0.034ドル——。
2026年6月30日、Googleはこの数字を現実にする2つのモデルを開発者向けに公開しました。
画像生成の「Nano Banana 2 Lite」と、動画生成の「Gemini Omni Flash」です。

スピードとコストの両立は、生成AI界隈では長らく”トレードオフ”の象徴とされてきました。
高品質を求めれば時間とお金がかかり、安く速くしようとすると品質が落ちる——そのジレンマに、Googleが一つの答えを出してきた形です。

「安くて速い」を証明したNano Banana 2 Lite

Nano Banana 2 Liteは、GoogleのNano Bananaイメージファミリー(テキストや参照画像から画像を生成・編集するモデルシリーズ)の中で、最も速く最もコスト効率に優れたモデルです。
正式なAPI(アプリケーション・プログラミング・インターフェース:外部サービスとソフトウェアを繋ぐ仕組み)名称は「Gemini 3.1 Flash-Lite Image」。

最大の特徴は、テキストから画像を4秒未満で生成し、1K解像度の画像1枚あたり0.034ドルという価格を実現していることです。

高速化を優先しながらも、プロンプト(指示文)への忠実性、キャラクターの一貫性、画像内テキストの可読性を維持していると公式は説明しています。
また「ワールドナレッジ」(世界の実際の場所や文化に関する知識)が強化されており、たとえばスコットランドのハイランドを舞台にした広告モックアップなど、地名固有の情景を正確に描写できるようになっています。

テキストから画像を生成するモデルのランキング「Text-to-Image Arena」では現在5位にランクイン。
EloスコアはPareto frontier(性能とコストのトレードオフ曲線上の最適点)に位置し、「フラッグシップ並みの品質をフラッグシップの何分の一かのコストで」という評価を受けています。

Xに広がった開発者の驚き

公式発表と同時に、Xでは開発者・AI研究者たちの反応が相次ぎました。

Googleは自社アカウントでこのように発表しています。
「本日、強力なコストパフォーマンスを持つ2つの生成メディアモデルを開発者と企業向けにリリースします」と述べ、Nano Banana 2 Liteを「最速・最もコスト効率的な画像モデル」と位置づけました。

Googleのデベロッパーアドボケイト、Logan K氏も同日すぐに投稿し、両モデルの概要と使い方を紹介しています。

また、既存モデルとの連続性についても注目が集まりました。
マーク・クレッチュマン氏は発表前日の段階で「GoogleDeepMindから新しいNano Bananaが来そうだ。
Nano Banana 2の後継か、Gemini Flash Liteをベースにした軽量・廉価モデルの可能性がある」と予告していたことも話題になっています。

動画生成に会話を持ち込んだGemini Omni Flash

もう一方の主役「Gemini Omni Flash」は、動画生成・編集のモデルです。
テキスト・画像・音声・動画という4種類のモーダル(入力形式)を組み合わせて動画を生成できる、マルチモーダル(複数の入力形式に対応した)設計になっています。

最も注目されている機能が「会話形式の編集」です。
一度生成した動画に対して、テキストで自然に指示を出すと、キャラクターの入れ替え、カメラアングルの変更、シーンのライティング修正などをステップバイステップで行えます。
「もう少し夕日っぽくして」「背景を海岸にして」といった曖昧な指示にも対応できるため、映像制作の経験がなくても編集を進めやすいのが特徴です。

物理シミュレーション能力も向上しており、重力、運動エネルギー、流体の動きといった現実の物理現象を自然に再現できるようになっています。
生成される動画はGeminiが持つ世界知識を反映し、多回にわたる編集でもシーンの整合性が保たれます。

現時点では1クリップあたり最大10秒の動画を生成可能で、価格は1秒あたり0.10ドル(720p解像度)。
Googleによれば、10秒という制限は「モデルの限界ではなくデプロイ上の選択」であり、より長尺の動画はより高性能な「Omni Pro」が担うとしています。

安全対策として、静止した人物写真と音声クリップを組み合わせたディープフェイク(人物の顔や声を偽造したコンテンツ)の生成はブロックされており、すべての生成動画にはSynthID(Google独自の電子透かし技術)が埋め込まれます。

利用できる場所

両モデルはGoogle AI Studioと Gemini APIを通じて開発者がすぐに利用できます。
また、Gemini Enterprise Agent Platform(企業向けAIエージェント開発基盤)にも提供されています。
Gemini Omni Flashはさらに、GeminiアプリやGoogle Flow、YouTube Shorts Remix、YouTube Createでも順次展開予定です。

一般ユーザー向けにはAI Mode in Search(AI検索モード)、GeminiアプリのNotebookLM、Google Photos、Google Adsへの統合も進められています。

さらに深掘りしたい方へ

Google「Gemini Omni」登場——1フレームの会話で動画がみるみる変わるAIの正体Google「Gemini Omni」登場——1フレームの会話で動画がみるみる変わるAIの正体テキストを入力するだけで動画が生成される——Google I/O 2026で公開されたデモ映像を見たとき、思わず手を止めてしまいました。
Google、Gemini 3.5 Flashを発表——「Flashなのにフロンティア超え」に湧いたGoogle I/O 2026Google、Gemini 3.5 Flashを発表——「Flashなのにフロンティア超え」に湧いたGoogle I/O 2026「軽量モデルが最高性能を超える」——そんな逆転劇が、2026年5月19日に始まりました。

SocialReport編集部の考察

今回のリリースで最も注目すべきは、価格破壊の”場所”です。
これまで生成AIのコスト問題は「月額サブスク費用」の文脈で語られることが多かったのですが、Nano Banana 2 Liteが持ち込んだのは「1画像あたり0.034ドル」という従量課金の安さです。
SNS運用の現場では、1キャンペーンに数十〜数百枚のビジュアルが必要になることも珍しくありません。
これだけコストが下がると、A/Bテスト(複数のクリエイティブを比較検証する手法)に使う画像バリエーションを大量生成して最適なものを選ぶ「クリエイティブ最適化」が現実的な選択肢になります。

Gemini Omni Flashの「会話で動画を修正できる」機能も、SNSマーケターにとって意味合いが大きいでしょう。
従来は動画の修正のたびに外部の制作会社や動画編集担当者とのやり取りが必要でした。
それが自然言語で指示できるとなれば、SNS担当者が自ら細かいクリエイティブの調整を即日で行えるようになります。
特にリアルタイム性が求められるトレンド便乗型の投稿で、このスピード感は競合との差を生む可能性があります。

個人クリエイターにとっても「プロ品質をほぼゼロに近いコストで」という時代が始まった、そのシグナルとして今回のリリースは記憶されるかもしれません。

まとめ

Googleが6月30日に公開したNano Banana 2 LiteとGemini Omni Flashは、画像・動画生成AIの「速さ」と「安さ」の水準をまた一段引き上げました。
4秒・0.034ドルという数字が当たり前になるとき、SNSマーケティングの現場でのクリエイティブ制作のあり方は根本から変わっていくでしょう。