🕛 2026.4.22 16:22 文:かみくだきりく

ChatGPT Images 2.0 が全ユーザーに解放、テキスト描写も「ちゃんと読める」レベルに

ChatGPT Images 2.0 が全ユーザーに解放、テキスト描写も「ちゃんと読める」レベルに
X はてブ LINE Feedly

OpenAI が ChatGPT Images 2.0 を ChatGPT の全プラン向けに広げた。画像生成モデルとしての目玉は「テキストの描写がまともになった」という1点に尽きる気がしていて、これ、なかなかすごいんですよ。

要はこういうことですね。これまで AI 画像生成の泣きどころだった 「画像の中に埋め込まれる文字が読める」 という部分が、ようやくプロダクションで使えるレベルに届いた、と。

何が変わったか

OpenAI の告知を整理すると、今回の更新は中身が3層に分かれている。

  • 提供範囲: ImageGen 2.0 は ChatGPT の全プランで利用可能
  • ImageGen 2.0 Thinking(思考付き画像生成): 有料プラン向け
  • 知識カットオフ: 2025年12月まで更新

知識カットオフが上がったという話は地味ですが、画像生成にとって意外と効きます。新しい製品ロゴや最近のビジュアルトレンドへの追従度が変わるので、「ChatGPT に依頼したのに絵面が古い」みたいな違和感が減る方向に効く、という理解でいいかなと。

テキスト描写が「読めるレベル」

TechCrunch のレビュー記事が端的で、タイトルが 「surprisingly good at generating text」。ここが今回いちばん触ってみたいポイントです。

従来の画像生成モデルは、看板・タイポグラフィ・ポスター風の画像を頼むと、文字が崩れるか、似たような別の文字列に化けるかのどちらかになりがちでした。今回はそこを正面から詰めてきた、という立て付け。

実制作でいうと、SNS 投稿用のバナー、スライドのサムネ、プロダクト画像のモックなど、「文字が含まれる画像」をとりあえず AI に任せてみる選択肢が出てくる。プロのデザインを置き換えるかはまた別として、ラフ案を 1 分で作る目的では実用域に入った、と読めます。

Microsoft Foundry にも提供、APIルートも開く

Microsoft Azure の公式ポストで、GPT-image-2 が Microsoft Foundry に来ることも同日に告知されました。プロダクション向けの画像ワークフロー向けに、編集性能・画質・多言語・思考機能が強化されているとのこと。

OpenAI 側の Thinking は有料プラン向け、Azure 側では GPT-image-2 が Foundry に入る流れなので、ChatGPT で触る入口業務で組み込む入口が同時に整ってきた、と見るのがよさそうです。

「思考付き画像」って何をしているのか

Images with thinking という表現は、要はプロンプトから画像を描く前に、中間的な推論ステップを挟むことで、レイアウトや要素配置の整合性を上げる方向の機能、と理解しておくとよいと思います。

OpenAI は「コピーライティングから分析、デザインまでタスクをエンドツーエンドで扱える」と説明していて、単発のプロンプト一発生成ではなく、意図を汲んで組み立てる側に寄せている。一枚絵というより「中の要素が噛み合っている画像」を作るためのモードと捉えると腑に落ちます。

短い使い所

で、何が変わるかというと、

  • チラシ・告知画像など文字が入る素材を、ChatGPT で一次案を出せる
  • Azure Foundry 側でも扱えるので、業務ワークフローに組み込むルートも出てきた
  • 思考付きの方は有料プラン向け、精度が必要な仕事は有料側に寄せるのがいまの設計

「すごい」で終わらせず、読める文字を出せるようになったという事実を軸に組み立てるのが現実的な距離感だと思います。

個人的には腑に落ちる話で、ここまでの世代と地続きのアップデートでありつつ、テキスト描写という弱点を明示的に潰してきた点が今回の肝。触ってみてからですね。

OpenAI(X) — ChatGPT Images 2.0 is available starting today

OpenAI(X) — Real-World Intelligence / knowledge cutoff

OpenAI Help Center — ImageGen 2.0 in ChatGPT

Microsoft Azure(X) — GPT-image-2 is coming to Microsoft Foundry

TechCrunch — ChatGPT’s new Images 2.0 model is surprisingly good at generating text

みんなの反応

ぬるぽ
(システムエンジニア・30代男性)

文字崩れが本当に直っているなら、スライド用の図解生成がようやく実用に乗る。ここまでのモデルは誤字や意味不明な記号が混ざって、結局 Figma で作り直す羽目になっていた。思考付きのレイアウト整合性の話も、複数要素のバナーを頼んだ時のガチャ感が減るのなら素直にありがたい。Enterprise 提供のタイミングだけ気になる。
えかきのたまご
(フリーランスイラストレーター・20代女性)

商用ラフ案を出すのに AI 画像使う流れ、クライアント側でもう当たり前になってて、文字が崩れるたびに「これ直してください」って言われるのがしんどかった。文字が読めるならモックの工数がぐっと減る。ただフォントの指定までコントロールできないと、結局デザイナーが上から重ねる仕事にはなりそう。
島ぐらしCTO
(元 IT 企業 CTO・60代男性)

OpenAI が Foundry と Figma に同時ロールアウトしたあたり、もうツール単体の強さじゃなくて「どのプラットフォームに入れられるか」の勝負になっている。画像モデルは API 経由でバックエンドに組み込まれるのが主戦場で、UI から触るのはおまけだと思った方がいい。知識カットオフが2025-12 まで上がったのも、業務用途だと意外と効く。
みさきの美容室
(美容師・20代女性)

サロンの Instagram で宣伝画像作る時、今までは外注か Canva で頑張ってたけど、ChatGPT で文字入りの画像が出せるなら試してみようかな。「4月キャンペーン」とか書いた画像がちゃんと読める文字で出るなら、お客さんへの告知がもっと早く回せる。無料ユーザーでも使えるのが嬉しい。
町工場のおやじ
(精密部品製造・50代男性)

文字が読める画像が出るのは結構だが、製造現場で欲しいのは部品図や安全表示みたいな「正確な情報を誤差なく描く」方向。生成 AI は似せるのは得意でも、寸法通りに描くのはまだ苦手だろう。広告やスライドには効くが、図面や掲示物の代替にはしばらくならない、という線引きで見ている。
X はてブ LINE Feedly