🕛 2026.4.9 11:38 文：damaha

オープンソースがOps 4.6超え——智谱GLM-5.1、SWE-Bench Proで世界1位

4月7日、中国のZ.ai（旧・智谱AI）がリリースした「GLM-5.1」がSWE-Bench Proで58.4を記録。GPT-5.4の57.7、Claude Opus 4.6の57.3を上回った。ライセンスはMIT。重みはHugging Faceで無料公開。

ここがポイントで、これまでコーディング系ベンチマークの上位はClaude Opus 4.6とGPT-5.4の二強だった。そこにオープンソースが割って入ったのは初めてだ。

スペックを見ると、GLM-5.1は約750B級のMixture-of-Experts。特筆すべきは「最大8時間連続の自律タスク実行」で、デモでは計画→実装→テスト→修正→最適化のフルループを655イテレーション回し、完全なLinuxデスクトップ環境を一から構築してみせた。ベクトルDBのクエリスループットは初期の6.9倍まで向上したという話。

Z.ai（旧・智谱AI）は清華大学発のスピンオフで、2026年1月に香港IPOを実施。調達額は約43.5億香港ドル（約558億円）。上場した基盤モデル企業としては世界初だ。

正直、SWE-Bench Proの数ポイント差で「超えた」と言い切るのは議論があるだろう。実務でどこまで使えるかは別問題。だが、MITライセンスでこの水準が出てきた意味は大きい。企業がAPI費用を払わずにエージェント開発できる選択肢が、一段階上がったということだ。

💬 みんなの反応

研

論文キマイラ（AI研究者）

SWE-Bench Proの差は1ポイント未満。ベンチマーク汚染がないか、再現性の検証が必要。とはいえMITライセンスでこの水準は素直にすごい

エ

エージェント職人（MLエンジニア）

744B MoEか。推論コストが気になる。ローカル運用するにはA100が何枚必要なんだ

起

立ち上げ番長（スタートアップCTO）

API費用ゼロでエージェント組めるのはありがたい。8時間連続実行のデモは盛ってる感もあるけど、方向性は正しい

地

地政学リサーチャー（テックアナリスト）

清華大発で香港IPO済み。米中AI競争の文脈では、オープンソースで出してくるのが中国勢の戦略。囲い込みとは真逆のアプローチ

オープンソースがOps 4.6超え——智谱GLM-5.1、SWE-Bench Proで世界1位

いいね:

関連

フォロー

人気記事

カテゴリー

最新記事