
OpenAI が自分でチップを作る、という話はずっと噂されていました。それがついに形になりました。OpenAI が6月24日、半導体大手の Broadcom と組んで、初の自社設計となる推論チップ「Jalapeño(ハラペーニョ)」を公開しています。
名前のインパクトもさることながら、中身がけっこう尖っています。これは AI の「推論(インファレンス)」、つまり学習済みの AI が実際に答えを返す処理だけに特化して設計されたチップなんです。
で、気になる設計思想なんですが、ポイントは「専用」というところ。いま AI を動かしている GPU は、もともと画像処理から育った“なんでも屋”で、学習にも推論にも使える万能選手です。万能なぶん、推論だけをやらせると無駄になる部分も出ます。Jalapeño はそこを割り切って、LLM の推論という一品料理だけを出す専門店に振り切った、というイメージ。だから少ない電力で同じ仕事をこなせる、という狙いになります。
OpenAI は、この電力性能比(同じ電力でどれだけ処理できるか)が現行の最先端を大幅に上回るとしています。ただ、ここは正直に書いておくと、いまのところ OpenAI 自身の評価で、第三者がベンチで測った数字ではありません。鵜呑みは禁物。それでも「推論専用に作れば効率は上げられる」という発想自体は理にかなっています。
今回いちばん「ちょっと待って」となったのが、開発スピードです。設計からテープアウト(製造用の最終設計確定)まで約9か月。ASIC(特定用途向けの専用チップ)の開発でこの速さは、かなり異例です。ふつうは年単位かかる世界。
しかも、その設計最適化の一部に OpenAI 自身のモデルを使ったとしています。AI が、AI を速く動かすためのチップ設計を手伝った、という入れ子構造。SF っぽいですが、設計の試行錯誤を AI で回せば速くなる、というのは納得感があります。
じゃあ私たちユーザーに何が変わるのか。直接チップを買うわけではありません。効いてくるのは、回りまわっての部分です。AI を動かすコストの大半は、いまや推論にかかる電気代とハードウェア代。ここが下がれば、ChatGPT のような有料サービスの料金や、応答の速さ、無料枠の広さに跳ね返ってくる余地があります。
日本のユーザーにとっても無関係ではありません。AI チップは長く NVIDIA の GPU 一強で、調達コストも電力も悩みの種でした。主要 AI 企業が推論を自前チップに移す流れが進めば、業界全体の電力消費やコスト構造が変わり、国内のデータセンターや AI サービスの値付けにも波及していきます。
狙い目は2026年末の初期展開とのこと。まだ手元で動くものではないし、性能の真価は外部の検証を待つ段階です。それでも、AI の“賢さ競争”が、それを安く速く動かす“土台の競争”にまで広がってきたのは確か。今日のツボは、賢さの裏で静かに進む、この足まわりの勝負でした。
情報元: OpenAI and Broadcom unveil LLM-optimized inference chip(OpenAI)
※この記事の本文は生成AIが執筆しています。事実関係は公式一次情報で確認しています。