🕛 2026.5.10 18:16 文:ナナまどか

Google DeepMind の「AI Co-Mathematician」、群論の未解決問題でも前進。数学者と協働する新ワークベンチ

Google DeepMind の「AI Co-Mathematician」、群論の未解決問題でも前進
X はてブ LINE Feedly

「AI が数学者の隣に座って、いっしょに難問を解く」という光景が、すこしずつ現実になってきました。

Google DeepMind 系の研究チームが 2026 年 5 月 7 日に arXiv へ出した論文で、AI Co-Mathematician という数学者向けワークベンチが紹介されました。最難関クラスの数学 AI ベンチマーク FrontierMath Tier 4 で 48% を記録し、新しいハイスコアを出しただけでなく、オックスフォードの数学者 Marc Lackenby が群論の未解決問題をこのシステムで前進させた、と一次ソースで確認できます。

何のニュースか

ふと考えてしまうんですが、AI が数学を「解く」と言ったとき、これまでは入試問題やコンテスト問題のレベルが多かったんですね。たしかに人間より速く解ける、という主張はあったけれど、現役の研究数学者が日々向き合っている未解決問題に踏み込んだ報告は、まだ稀でした。

今回の発表で目を引くのは、ベンチマーク更新だけでなく、オックスフォードの数学者 Marc Lackenby が AI を相棒として使い、群論の悬案にアプローチしている点です。論文によれば対象は Kourovka Notebook の Problem 21.10。問いは「すべての有限群が just finite presentation を持つか」で、答えは affirmative になった、と書かれています。AI が全部を書いたというより、数学者と往復しながら証明を詰めた、という協働の形です。

なぜ重要か

これ、見方を変えると、日本のユーザーや産業にとっても無関係な話ではありません。

第一に、国内の数学・物理・暗号学の研究室が、こうした AI を使えるかどうかで研究のスピードが大きく変わる可能性があります。日本は AI for Math の研究投資が欧米に比べてゆっくりですが、Google の API や OSS 公開がいつ・どの形で来るかで、国内アカデミアの動きが追従しやすくなる、しにくくなるが分かれます。

第二に、AI が研究レベルの問題に踏み込めるなら、創薬の分子設計、材料科学のシミュレーション、暗号方式の安全性証明など、隣接領域に波及する可能性が出てきます。歴史を振り返ると、純粋数学の進展は半世紀かけて応用に降りてくることが多いので、すぐ生活に効く話ではありませんが、長期で見ると地味に効く方の話です。

仕組みをやさしく

中学生でもわかる比喩で書くと、こんな感じになります。

数学者が未解決問題を考えるとき、頭の中ではたくさんの「もしこの方向に進んだら、こうなるはず」という枝分かれを試しています。人間の研究者がこの枝分かれを全部試すのは、寿命が足りません。これまでは、勘と経験で「筋がよさそうな枝」だけを掘っていく、という戦略を取ってきました。

AI for Math は、この枝分かれ探索の補助役として働きます。今回の AI Co-Mathematician は、単発の問答モデルではなく、非同期で複数 workstream を走らせ、失敗した仮説も保存し、reviewer agent が穴を指摘する ワークベンチです。群論のケースでも、最初の証明案はそのまま通らず、reviewer agent が欠陥を見つけ、その指摘を見た Lackenby が「ここなら埋められる」と気づいて完成へ進んだ、と論文は説明しています。

面白いのは、AI が出してくる「筋がよさそうな道」が、人間の数学者が直感では見落としていた角度から来ることがある点です。

いまの実力と限界

正直なところ、完全な定理証明を AI が単独で書いたわけではない、というのが現状です。今回の研究で達成されたのは、ベンチマークでのハイスコア更新と、研究者との協働による進展です。

これは、研究現場にとってはありがたい一歩ですが、過剰に「AI が数学者を超えた」と語るのは早計です。数学のフロンティアでは、定理を「証明する」だけでなく、「面白い問題を選ぶ」「適切に定式化する」「数学的に意味のある一般化を見つける」といった、判断系の仕事が大量にあります。AI はまだその大部分を、人間に頼っている段階です。

これからどうなるか

半年〜1 年で見ると、Google・DeepMind・OpenAI・Anthropic を含めた AI for Math 競争はさらに激しくなるでしょう。今回の論文は、モデル単体の賢さより 編成された workbench の強さ を前に出しています。半年以内に、別の分野で同じような「研究者インザループ」型の成果が続く可能性は高そうです。

3 年で見ると、AI を相棒として使うのが当たり前の数学研究者が、欧米の主要大学から増えていきます。日本の大学院生にとっては、博士論文の研究設計に AI を組み込めるかどうかが、研究効率の差として見えてくる時代が、そう遠くなさそうです。

だから何が変わるか

要は、これまで「人間しかできない」とされた領域に、AI が共同作業者として隣に座る未来が、研究現場では先行して始まっているということなんですね。日本でも、研究室の選び方や、修士・博士の進路を考える人にとっては、AI for Math の進展が地味に効いてきます。AI が数学者と並んで歩く時代は、まだ始まったばかりですね。

みんなの反応

ろんぶん先生
(AI研究者・大学准教授・30代男性)

SOTA 更新と共著研究は性質が違う成果で、後者の方が学術的価値は大きいですね。Lean などの形式言語上での候補証明探索が、本当に未解決問題に効く局面まで来たなら、数学界の研究プロセスが構造的に変わる転換点になりえます

社会学D3
(大学院生・社会学・博士課程・30代女性)

AI が研究者と共著する時代の「著者性」は、社会学的にも興味深いテーマです。誰が責任を負い、誰が功績を主張するか、論文の謝辞欄では収まらない議論がこれから出てくる予感がします

深セン通信
(深セン在住テックライター・30代男性)

中国側でも DeepMind の AlphaProof と Google の AI for Math は並走している、という見方が定着しつつあります。中国の数学チームも自前のベンチで追走中で、半年以内に複数チームの SOTA 競争が見えるはず

町工場のおやじ
(精密部品製造経営・40代男性)

純粋数学が半世紀かけて現場に降りてくるのは、うちみたいな部品屋でも実感ある話。AI が数学者と組んだ研究が、いずれは加工精度のシミュレーションや材料計算に効いてくると思うと、長い目で見て無関係じゃないですね

JK
JK勉強垢
(高校 2 年・進学校・女性)

大学で数学やってみたいと思ってたところに、AI と共著の話。研究者を目指すなら AI を使いこなせるかどうかが大事になっていくのか、と進路の参考にしてます

X はてブ LINE Feedly