🕛 2026.5.19 18:14 文:ズバッとショウ

NVIDIA、エージェント時代の新型CPU「Vera」をAnthropic・OpenAI・SpaceXAI・Oracleに納品。GPU だけじゃ回らなくなった話

NVIDIA、エージェント時代の新型CPU「Vera」をAnthropic・OpenAI・SpaceXAI・Oracleに納品。GPU だけじゃ回らなくなった話
X はてブ LINE Feedly

GPU だけでは AI エージェントが回らなくなってきた、という話です。

NVIDIA が 5 月 18 日、新型 CPU「Vera」の初回出荷を主要 AI ラボに完了したと公式ブログで発表しました。金曜にサンフランシスコの Anthropic、Mission Bay の OpenAI、パロアルトの SpaceXAI へ、月曜にサンタクララの Oracle Cloud Infrastructure へ。NVIDIA のハイパースケール・HPC 担当 VP、Ian Buck が直接手渡したとのこと。

要するに、これまで「AI といえば GPU」だった景色が、エージェント時代に入って CPU 側も組み替えが必要になった、という話。Jensen Huang が今年 3 月の GTC San Jose で「次の数十億ドル規模ビジネス」として発表した Vera が、ようやくラボの手に渡った瞬間です。

なぜ「エージェント専用 CPU」が要るのか

ここがポイントで、AI エージェントは GPU の上だけで完結しません。

サンドボックス環境を立ち上げる、外部ツールを呼ぶ、オーケストレーション層を回す、長いコンテキストから情報を取り出す。これらはすべて CPU の仕事です。エージェントが「答える」から「動く」に変わると、CPU 側で同時並行に走るタスクの数が一気に膨れ上がる。

従来の CPU はコア密度を稼ぐ設計が主流でしたが、Vera は「並列で短い実時間タスクを大量に捌く」前提で設計し直されています。NVIDIA いわく、88 個の自社設計コア「Olympus」、メモリ帯域 1.2 TB/s、コアあたりの性能は前世代比 1.5 倍。

納品先のラインアップから読めること

正直、納品先 4 社の並びがそのまま「2026 年のフロンティアモデル開発を支えるのは誰か」を示しています。

Anthropic では head of compute の James Bradbury が受け取り、「モデル規模を拡張するうえで重要な加速材料」「エージェント型ワークロードを解くエコシステムの有望なピース」とコメント。OpenAI Mission Bay では head of compute infrastructure の Sachin Katti が屋外バルコニーで受領。そして SpaceXAI と Oracle Cloud Infrastructure。

商用クラウドと、フロンティアモデルを実際に学習させているラボ。「両側からエージェント基盤を仕込みに来た」という話です。

日本の AI 利用者にとって何が変わるか

直近の影響は、クラウド経由で AI を使う側にも回ってきます。

ひとつ、Oracle Cloud Infrastructure に Vera が入ったということは、近い将来 OCI 上で動く AI ワークロードのレスポンスが、特に「ツール連携・長文取得・並列タスク」の領域で実感できるレベルで速くなる可能性が高い。日本企業が OCI を使って業務エージェントを組む案件で、起動・応答の体感が変わる、ということ。

ふたつ、Anthropic と OpenAI が同じ世代の Vera を入手したということは、Claude / ChatGPT 双方の次フェーズ学習が同じ「物理基盤の土俵」で進む、ということ。短期では学習速度の話、半年〜1 年スパンでは「同じ基盤上で何ができるか」の比較がフェアになっていきます。

みっつ、これは AI ガジェットや Robotaxi のような末端の話ではなく、配管そのものの世代交代です。読者の手元に Vera が直接届くわけではないけれど、毎日触っている ChatGPT や Claude が「待たされる時間」が縮む方向に効いてくる、というのが現実的な期待値。

で、何が変わるか

「GPU の隣に、エージェント専用 CPU が要る」というのが、今回の納品で物理的に確定した話。配管の世代交代は静かに進みます。続報待ちです。

情報元
NVIDIA Blog — Vera Arrives 公式発表(英語)
NVIDIA 公式トップ(日本語)

みんなの反応

G
GPU貧乏エンジニア
(MLエンジニア・20代男性・スタートアップ)

うちみたいなスタートアップが Vera 触れるのはたぶん 1〜2 年後ですけど、Oracle 経由で間接的に恩恵が来そう。エージェントのツール呼び出し回数が増えるほど、CPU の待ち時間が学習・推論コストに効いてくるので、設計思想として正しい方向だと思います。
D
DXおじさん
(大企業DX推進室長・50代男性)

OCI に Vera が入ったのは大きいです。うちは AWS と OCI の併用で AI エージェント案件を組んでいて、特定ワークロードの応答速度で差が出るなら、調達計画を見直す検討材料になります。営業から打診が来る前に動向は押さえておきたい。
エージェント職人
(AIエージェント開発者・20代男性・個人開発)

88 コア / 1.2 TB/s っていう数字、Olympus コアという独自設計、こういうハード側の特化が来るのは健全。これまでエージェントの並列ツール呼び出しを試すと、GPU は余ってるのに CPU が詰まるパターンが多かったので、ここが解消される方向に進むなら設計の幅が広がります。
シリコンバレーの人
(米西海岸ベンチャーキャピタリスト・40代男性)

Anthropic と OpenAI に同時に渡してる、というのが今回の本質。フロンティアモデルの世代交代を「同一基盤」で並走させる前提で、NVIDIA がエコシステム全体をハンドリングしに来た。Jensen が GTC で「次の数十億ドル事業」と言ってたのは誇張じゃない。
インフラの仙人
(クラウドインフラエンジニア・40代男性・大手SIer)

エージェント向け CPU という発想は、データセンター側からするとずっと欲しかった設計です。サンドボックス起動・短命プロセスの大量並列・コンテキスト引きずり出し、いずれも従来 CPU だと尺取り虫みたいになる。Vera が定着すれば「AI ファクトリー」の電力効率も別物になる可能性があります。
X はてブ LINE Feedly