
Google Developers Blog から、Gemma 4 を使ってエッジデバイス上でエージェンティックなワークフローを走らせるための実装ガイドが公開されました。Gemma 4 自体は 2026-04-02 に公開された開モデル(Apache 2.0)ですが、今回はその “実装者向け版” という位置付けです。これ、個人的に刺さったので中身を整理しますね。
Gemma 4 のラインナップはこんな感じ。エッジ向けとサーバ向けで 4 サイズが揃っています。
前モデル Gemma 3 が 1B / 4B / 12B / 27B の Dense 構成だったので、今回 MoE が 1 枠入ってきたのが大きな変化点。MoE はアクティブパラメータだけ動くので、総パラ数は大きいのにレイテンシは小さいサイズ並み、という”お得な”挙動をします。
実装ガイドと DeepMind 公式ページの一番の訴求は、「スマホ・Raspberry Pi・Jetson Nano 級の端末で完全オフライン動作する」 というところ。ネット接続なしで多段のエージェント処理が回るようになった、というのが今回のポイントです。
できるようになったのはこのあたり。
個人的に刺さったのは、function calling がネイティブ対応していること。追加のファインチューニングなしで、ツール呼び出しを伴うエージェントが書けるという設計です。
前モデル Gemma 3 との比較で一番わかりやすいのは、エッジ向け E4B の”実効 4.5B” という設計。総パラメータと実効パラメータを分けて示すようになったのが Gemma 4 の流儀で、メモリに乗る重みとアクティブ時の計算量を別管理しやすくなっています。
他社の立ち位置も簡単に整理しておきます。
Gemma 4 の強みは、Apache 2.0 という商用利用しやすいライセンスで、エッジハードの選択肢が広いこと。Raspberry Pi や Jetson Nano 系で動かせる、というのは、試作段階の IoT エージェントを作りたい人にとってはかなり大きいです。
さすがに全サイズを自分でまだ触りきれていないですが、Raspberry Pi や Jetson Nano のような軽量エッジ環境まで公式が射程に入れてきた のは大きいです。家の IoT ハブに AI を載せるという用途が、いよいよ現実的な消費電力帯に降りてきた印象があります。
エージェントを完全ローカルで動かせると、クラウド往復のレイテンシがゼロ、かつ データが外部に出ないという運用が両立します。プライバシー要件が厳しい用途(医療・社内文書検索・家庭向けアシスタント)で、Gemma 4 のエッジ運用はかなり検討候補になりそうです。
同じ Google Developers Blog から今日もう一本、ADK SkillToolset を使ってエージェンティックなスキルを組む実装ガイドが出ています(2026-04-20)。Gemma 4 の推論側と、ADK のスキル設計側を組み合わせると、オンデバイスでスキル切替しながら動くエージェントが組めます。この合わせ技は、ハード屋がプロトを作るうえで刺さるセット。
即レビューしたいですね、これは。
Google Developers Blog — Bring state-of-the-art agentic skills to the edge with Gemma 4(公式)
Google DeepMind — Gemma 4(公式モデルページ)
Google AI for Developers — Gemma 4 モデルカード