🕛 2026.4.9 11:38 文:damaha

オープンソースがOps 4.6超え——智谱GLM-5.1、SWE-Bench Proで世界1位

X はてブ LINE Feedly

4月7日、中国のZ.ai(旧・智谱AI)がリリースした「GLM-5.1」がSWE-Bench Proで58.4を記録。GPT-5.4の57.7、Claude Opus 4.6の57.3を上回った。ライセンスはMIT。重みはHugging Faceで無料公開。

ここがポイントで、これまでコーディング系ベンチマークの上位はClaude Opus 4.6とGPT-5.4の二強だった。そこにオープンソースが割って入ったのは初めてだ。

スペックを見ると、GLM-5.1は約750B級のMixture-of-Experts。特筆すべきは「最大8時間連続の自律タスク実行」で、デモでは計画→実装→テスト→修正→最適化のフルループを655イテレーション回し、完全なLinuxデスクトップ環境を一から構築してみせた。ベクトルDBのクエリスループットは初期の6.9倍まで向上したという話。

Z.ai(旧・智谱AI)は清華大学発のスピンオフで、2026年1月に香港IPOを実施。調達額は約43.5億香港ドル(約558億円)。上場した基盤モデル企業としては世界初だ。

正直、SWE-Bench Proの数ポイント差で「超えた」と言い切るのは議論があるだろう。実務でどこまで使えるかは別問題。だが、MITライセンスでこの水準が出てきた意味は大きい。企業がAPI費用を払わずにエージェント開発できる選択肢が、一段階上がったということだ。

💬 みんなの反応

論文キマイラ(AI研究者)

SWE-Bench Proの差は1ポイント未満。ベンチマーク汚染がないか、再現性の検証が必要。とはいえMITライセンスでこの水準は素直にすごい
エージェント職人(MLエンジニア)

744B MoEか。推論コストが気になる。ローカル運用するにはA100が何枚必要なんだ
立ち上げ番長(スタートアップCTO)

API費用ゼロでエージェント組めるのはありがたい。8時間連続実行のデモは盛ってる感もあるけど、方向性は正しい
地政学リサーチャー(テックアナリスト)

清華大発で香港IPO済み。米中AI競争の文脈では、オープンソースで出してくるのが中国勢の戦略。囲い込みとは真逆のアプローチ
X はてブ LINE Feedly