
Google Cloud が「Agents CLI」というものを出してきました。これ、なかなかすごいんですよ。
公開は 2026 年 4 月 22 日、Google Developers Blog 経由。AI エージェント(LangChain でいう Agent や、Anthropic の Claude Code みたいに「指示を分解して順に道具を呼ぶ AI」)を作る側の道具立てが、ここ 1 年ずいぶん散らかっていました。今回はその散らかりを「コマンドラインひとつにまとめる」という試みです。
要はこういうことですね。人間のエンジニアが Cursor や Claude Code を立ち上げる → そのコーディング AI が Agents CLI を叩く → Google Cloud のエージェント基盤までひとつながりで届く、という流れを公式に用意した、と。
Google 側の問題提起がそのまま現場の声でして、引用すると、コーディング AI に「ローカルとクラウドの橋渡し」をさせるために、開発者は分厚いドキュメントをコンテキストに食わせていた、と書いてあります。トークンが無駄に消える上に、コンポーネント同士のつながりを AI が勘で組み立ててループに入る——これ、エージェント開発をかじったことがある方なら、たぶん 1 回はやっています。
で、何が変わるかというと、Agents CLI に同梱された「Agents CLI Skills」がコーディング AI のコンテキストに直接インジェクトされる、という設計になっています。
“`
uvx google-agents-cli setup<br>
<pre><code><br />このコマンドひとつで、Gemini CLI でも Claude Code でも Cursor でも、Google Cloud のエージェント基盤の正しい API リファレンスがその場で読める状態になる、というわけです。
<h3>「経費承認エージェント」が 1 コマンドで出てくる</h3>
ブログに載っていた例がわかりやすいので、そのまま使います。
> 50 ドル未満は自動承認、それ以上か怪しい支出は人間に承認させる、出張経費エージェントを作って
これをコーディング AI に投げると、Agents CLI 経由で次のような scaffolding が走るとのことです。
“`<br>
agents-cli create finance-agent -y –deployment-target agent_runtime<br>
cd finance-agent<br>
“`</p>
ちなみに、`–deployment-target agent_runtime` は Google Cloud の Agent Runtime に向けて骨組みを切る指示で、CLI のデフォルト挙動を AI 側に任せる `-y` フラグが入っているところがミソですね。
<h3>評価ハーネスもセットで</h3>
エージェントを書いたあとに必ずぶつかる「これ、本当に意図通り動いてるの?」という壁、ここまでセットで面倒見ます、という設計です。
“`<br>
agents-cli eval run<br>
agents-cli eval compare evals/run_v1.json evals/run_v2.json<br>
eval run は事前に用意した「正解データセット」に対して回答を回し、eval compare は 2 つの評価ランの軌跡(trajectory)スコアと指標を並べて比較してくれる、というもの。
で、何が変わるかというと、いままで Notion や Excel に評価結果を貼って手で比べていた工程が、CLI コマンド 1 行になる、ということです。
ブログの主張で象徴的だったのが、「ローカルプロトタイプからグローバル分散サービスまでに 70 日もかからない」というフレーズです。これ自体は社内ベンチマークではなく「これくらいかかってましたよね?」というあるあるの話なので、数字そのものを真に受けすぎないほうがいいです。
ただ、Agents CLI が IaC(Terraform 等のインフラのコード化)と CI/CD パイプラインを自動でセットアップして、Agent Runtime / Cloud Run / GKE に直接デプロイできる、というところは事実として書かれています。1 ファイル書いてからデプロイまで CLI で完結する設計ですね。
リポジトリは github.com/google/agents-cli として公開済みで、uvx で叩ける、という導入の軽さは確かに体験として効きそうです。
一方で、これは当然のことながら Google Cloud のエージェント基盤に寄せたツールで、AWS の Bedrock や Azure AI Foundry の世界では使えません。マルチクラウドで揃えたい組織には、まだ各社の CLI を別々に動かす期間が残ります。料金体系も「Agent Platform / Cloud Run / GKE の従量課金」になるため、稟議では別シートが必要になります。
日本の SIer・社内 DX チームにとっては、評価ハーネスがコマンドで回る、というのが地味に効きます。これまで「PoC は動いたけど本番にしていいか判断できない」で止まっていた案件、評価コマンドの差分を見せれば稟議の最後の 1 手として使える。
それから、Gemini CLI と Claude Code がどちらも呼べる、と書かれていることは、社内で「Anthropic も Google も触ってる」という日本の現場の実態と合っています。コーディング AI を選ぶフェーズで囲い込みされなくて済む、というのは、地味ですが大事な設計判断ですね。
エージェントを「個人プロジェクト」から「本番サービス」に持ち上げる勾配が、今回でかなりなだらかになりました。次は他社が同じレイヤーをどう設計してくるか、続報待ちですね。
情報元
– Google Developers Blog — Agents CLI in Agent Platform: create to production in one CLI(2026-04-22)
– GitHub — google/agents-cli
– Google Cloud Blog — Introducing Gemini Enterprise Agent Platform(英語)