🕛 2026.6.23 21:42 文：ズバッとショウ

オープンモデルが、また一段上へ。MiniMax M3は画像・動画ネイティブでSWE-Bench Pro 59%

オープンモデルの底上げが止まらない。MiniMax が新モデル「M3」を、重みごと公開した。中国発のオープン勢が、また一段、上のラインに来たという話。

数字を見よう。総パラメータは約428B（4280億）。ただし1回の処理で実際に動くのは約23B（230億）だけ。専門家混合（MoE）という、知識は大きく持ちつつ計算は一部だけ走らせる方式だ。要するに、図書館の蔵書は膨大でも、毎回読むのは数冊、という設計。だから巨大なのに、動かすコストは抑えられる。

テキスト・画像・動画を、最初から一緒に学習している

M3の売りは「ネイティブ・マルチモーダル」。後付けで画像認識をくっつけたのではなく、テキストと画像と動画を最初から混ぜて学習している、と説明されている。ここがポイントで、扱えるのは一種類のモデルで文章も写真も動画も、という一台何役のつくり。MiniMax 自身は、フロンティア級のコーディング性能・100万トークンの文脈・画像と動画の入力、この3つを単一構成で同時に満たした初のオープンウェイトモデルだ、としている。

性能の物差しも置いておく。プログラミングの実務的なベンチマーク SWE-Bench Pro で59.0%。報道では、GPT-5.5の58.6%をわずかに上回った、という位置づけだ。正直、オープンモデルが商用フラッグシップと小数点で競る時代になったのか、というのが冷静な感想。

1Mトークン文脈で、前世代比デコード15倍超

速さの数字も効く。新しく入れた MiniMax Sparse Attention（MSA）という仕組みで、100万トークンという長い文脈でも、前世代の M2 と比べてプリフィル9倍超・デコード15倍超まで速くなった、とされる。長い資料を丸ごと放り込んでも、待たされにくい。長文処理のコストは、これまでオープンモデルの泣きどころだった。そこを一段で詰めてきた格好だ。

価格も見ておこう。公式価格表では、標準ティアの入力は512K以下なら現行割引後で100万トークンあたり0.30ドル、512K超の長文入力は0.60ドルだ。日本円でおよそ45〜90円（1ドル=約150円で換算）。トークンの量感はつかみにくいが、長文を大量に処理する用途では、この水準は効く。賢さの競争から、安さと速さの競争へ。勝ち筋はそこにある。

ただし、過熱は禁物。ベンチマークの数字は条件で動くし、商用モデルと完全に横並びというわけではない。日本にとっての意味で言うと、ここが大きい。重みが公開されているから、社内サーバーや国内のクラウドに自前で載せられる。データを外に出しにくい医療・金融・自治体でも、手元で動かして検証する余地が広がる。「使うかどうか」ではなく「どこに置いて、何に効かせるか」を、現場で試せる段階に入ったという話。

情報元: MiniMax M3: Frontier Coding, 1M Context, Native Multimodality — All in One Model（MiniMax）

みんなの反応

え

えかきのたまご
（フリーランスイラストレーター・20代女性）

画像も動画も最初から混ぜて学習してる、というのが正直ちょっと複雑な気持ちです。便利なのは分かるし使うと思う。でも『見て覚える』ものに自分たちの絵がどう関わってるのか、オープンに公開されるからこそ気になる。期待と不安が半々です。

み

みさきの美容室
（美容師・SNSインフルエンサー・20代女性）

動画まで一つのAIで扱えるの、コンテンツ作る側としてはかなり大きいです。サロンの施術動画にコメント付けたり、ショート作ったり。料金も思ったより安そうだし、まず触ってみたい。流行るのこういうの早いので乗り遅れたくない。

人

人権弁護士れん
（弁護士・人権系NPO・30代男性）

重みを誰でも使える形で出すのは技術の民主化として歓迎したい一方、学習データの中身と権利処理は別の論点として残ります。安く速く誰でも、は良いことですが、その『誰でも』には作り手も含まれるべき。便利さと公正さは両立させたいところです。

長

長距離ドライバー
（長距離トラック運転手・50代男性）

速い安いは結構なことだが、で、おれの仕事に何が変わるんだ、ってのが正直なところ。日報や運行記録の整理を写真撮るだけでやってくれるなら助かる。難しい理屈はいいから、現場で使える形に落ちてくるのを待ってます。

く

くちなしさん
（スーパーパート勤務・主婦・50代女性）

百万字あたり何十円、って言われてもピンとこないんですけど、要は前よりだいぶ安くなったってことですよね。家計の感覚で言うと、高かったものが特売になった感じ。無料や格安で試せる範囲が広がるなら、孫に教わりながら使ってみようかしら。

※この記事の本文は生成AIが執筆しています。事実関係は公式一次情報で確認しています。

オープンモデルが、また一段上へ。MiniMax M3は画像・動画ネイティブでSWE-Bench Pro 59%

テキスト・画像・動画を、最初から一緒に学習している

1Mトークン文脈で、前世代比デコード15倍超

いいね:

関連

目次Toggle Table of ContentToggle

フォロー

人気記事

カテゴリー

最新記事