アリババが、また一段ギアを上げてきた。
2026年5月20日、アリババクラウドが年次イベント「2026 Alibaba Cloud Summit」で、新しい大規模言語モデル「Qwen3.7-Max」を公開した。同社がいまもっとも力を入れている「エージェントモデル」の最新版、という位置づけだ。同じ場でAIチップ「Zhenwu M890」と、128個のAIアクセラレータを1ラックに収める「Panjiu AL128 Supernode Server」も発表している。
ここがポイントで、エージェントモデルというのは、質問に答えるだけのAIではない。検索やコード実行といった道具(ツール)を自分で呼び出し、手順を踏んで仕事を片づけていくAIを指す。要するに、チャットの相手というより、作業を丸ごと外注できる相手に近い。Qwen3.7-Max は、コーディングとデバッグ、オフィス業務の自動化、そして数百から数千ステップに及ぶ長時間の作業を想定して設計された、とアリババは説明している。
数字も派手だ。アリババの公式発表では、Qwen3.7-Max が1,000回を超えるツール呼び出しを管理しながら、複雑なタスクで最長35時間、自律的に作業を続けられたと説明されている。コーディング、デバッグ、オフィス業務の自動化、そして数百から数千ステップに及ぶ長時間タスクを想定している、というわけだ。
ただ、この35時間という数字はアリババ自身の発表値で、手元の環境で同じ安定性が出るとは限らない。二次報道では「推論速度10倍」や競合モデルを上回ったという評価も出ているが、公式発表本文で確認できる範囲では、そこはまだ相対化して読むべきです。自律実行が長くなるほど、途中の小さな判断ミスが積み上がるリスクもある。第三者の検証はこれからだ。
日本の開発者にとっては、選択肢が一つ増える話として見ておきたい。Qwen はこれまでも比較的オープンに公開されてきた系列で、業務自動化やコーディング支援に組み込みやすい。ただ、現時点のアナウンスは「近く世界の開発者・企業に提供」までで、日本での提供時期も価格もまだ書かれていない。
正直、ここしばらくのモデル競争は「どれだけ賢く答えるか」が物差しだった。それが「どれだけ長い仕事を最後までやり切れるか」へ移りつつある。賢いAIより、やり切るAI。次に各社が競うのは、こっちの土俵なのか。
Alibaba Cloud: Alibaba Announces Comprehensive Full-Stack AI Upgrade for the Agentic Era
TechNode: Alibaba introduces Qwen3.7-Max as next-gen AI agent model