「9.3億パラメータなのに80億パラメータ超えのモデルより上手い」——Ideogram 4.0がオープン公開、画像生成AIの常識を変えた

shiritomo | AI・SNS・話題のテック情報メディア by Hashout編集部 @shiritomoAI_jp 2026年6月4日 更新
「9.3億パラメータなのに80億パラメータ超えのモデルより上手い」——Ideogram 4.0がオープン公開、画像生成AIの常識を変えた

「小さいモデルのほうが、大きいモデルより優れている」——AI界隈でそれが起きたとき、業界全体がざわつきます。

6月3日、カナダのIdeogramが「Ideogram 4.0」を公開しました。
9.3億(9.3B)パラメータのオープンウェイト画像生成モデルです。
特筆すべきは、FLUX.2(32B)やHunyuanImage 3.0(80B MoE)など数倍〜数十倍大きなモデルを、テキストレンダリング性能で上回ったという点。
「大きければ良い」という常識に、また一つ例外が生まれました。

GitHubとHugging Faceで重みが公開されていて、自分のPCで動かせます。
日本語の漢字・ひらがな混合テキストも美しく再現できると知って、調べてみることにしました。

a16z も HuggingFace も即反応——Xに広がった驚き

発表直後から海外のAI関係者の間で話題が広がりました。

世界的なベンチャーキャピタルのa16z(アンドリーセン・ホロウィッツ)は、こう投稿しています。
「Ideogram 4.0 is incredible. And it’s open.(信じられないくらいすごい。
しかもオープンだ)」と。

オープンソースAIの中心地であるHugging Faceも即日反応しました。
「State of the art and open weights go well together(最先端性能とオープンウェイトは相性が良い)」という言葉とともにリリースを紹介。

「オープンウェイト」というのは、モデルの内部パラメータ(重み)を公開する形式のことです。
API経由でしか使えないクローズドモデルと違い、手元のPCで動かしたり、自社データでファインチューニング(追加学習)したりできます。

何がそんなに凄いのか——3つのポイント

調べてみると、Ideogram 4.0の強さには明確な理由がありました。

① テキストレンダリング性能が突出している

画像生成AIの長年の弱点は「文字の再現」でした。
ロゴやポスターに文字を入れようとすると、文字が歪んだり意味不明な記号になったりすることが多かった。
Ideogram 4.0は10人のプロデザイナーによるブラインド評価で47.9%のファーストチョイス率を記録し、「実際のクライアント仕事に使えますか?」という質問に対して5段階で3.55という高評価を得ています。

② 構造化JSONプロンプトで精密なレイアウト制御が可能

オブジェクトの位置・色・フォントを構造化されたJSONで指定できます。
「この位置にこの色で、このフォントで文字を配置する」という細かい指示に応えてくれるため、広告バナーやポスターの制作ワークフローにそのまま組み込める設計です。

③ 2K解像度と透過背景に対応

ネイティブで2K解像度を出力できます。
透過背景にも対応しているため、商用デザイン素材としてそのまま使える品質です。

Text-to-Image ArenaのDesignArenaリーダーボードではオープンウェイトモデル中1位を獲得(スコア1204)
OpenAIやGoogleのクローズドモデルには及ばないものの、9.3Bという小さなパラメータ数でそこに迫る性能を示しています。

日本語への対応は?

気になっていた日本語テキストの再現性についても確認しました。
Ideogram公式のブログによると、多言語テキストレンダリングに力を入れており、漢字・ひらがな混合の文字列も正確に再現できるとのことです。
ニュースの hook にあった「日本語ポスターの毛筆体までクリアに生成した」という評価は、この設計方針から来ているようです。

日本語テキストを含むポスターやバナーを作りたいクリエイターにとっては、試す価値のある選択肢が一つ増えたと言えます。

利用する際の注意点

ウェイトと推論コードはGitHubから無料でダウンロードできますが、商用利用には有料ライセンスが必要です。
個人利用や研究目的なら無料で使えるという整理になっています。

HuggingFace・ComfyUI・fal・Cloudflare・Replicateなど主要なAI開発プラットフォームに Day 0 対応しており、既存のワークフローにすぐ組み込める点も実用的です。

さらに深掘りしたい方へ

まとめ

「パラメータ数が多いほど優れている」というAIの常識に、Ideogram 4.0がまた一つ揺さぶりをかけました。
テキストレンダリング特化の設計と、日本語を含む多言語対応の強化は、デザイン用途においてオープンウェイトモデルの実用性が本格的に高まってきたことを示しています。
GitHubで公開されているので、気になる方はダウンロードして試してみてください。