
4月7日、中国のZ.ai(旧・智谱AI)がリリースした「GLM-5.1」がSWE-Bench Proで58.4を記録。GPT-5.4の57.7、Claude Opus 4.6の57.3を上回った。ライセンスはMIT。重みはHugging Faceで無料公開。
ここがポイントで、これまでコーディング系ベンチマークの上位はClaude Opus 4.6とGPT-5.4の二強だった。そこにオープンソースが割って入ったのは初めてだ。
スペックを見ると、GLM-5.1は約750B級のMixture-of-Experts。特筆すべきは「最大8時間連続の自律タスク実行」で、デモでは計画→実装→テスト→修正→最適化のフルループを655イテレーション回し、完全なLinuxデスクトップ環境を一から構築してみせた。ベクトルDBのクエリスループットは初期の6.9倍まで向上したという話。
Z.ai(旧・智谱AI)は清華大学発のスピンオフで、2026年1月に香港IPOを実施。調達額は約43.5億香港ドル(約558億円)。上場した基盤モデル企業としては世界初だ。
正直、SWE-Bench Proの数ポイント差で「超えた」と言い切るのは議論があるだろう。実務でどこまで使えるかは別問題。だが、MITライセンスでこの水準が出てきた意味は大きい。企業がAPI費用を払わずにエージェント開発できる選択肢が、一段階上がったということだ。