
AIに数学の難問を解かせた、という話は、このところ続けて耳にします。でも今回の研究は、少し毛色が違いました。
Google DeepMind を中心とする研究チームが、「AI co-mathematician(AIコ・マスマティシャン)」という研究ツールを発表しています。5月7日に arXiv へ初稿が投稿され、5月13日に改訂された23ページの論文です(arXiv:2605.06651)。数学者が AI エージェントと対話しながら、答えの決まっていない研究そのものを前へ進めていくための「作業台」だと説明されています。
これまで話題になってきたのは、たいてい「AIがある難問を解いた」という出来事でした。問題があって、答えが出る。わかりやすい話です。
これ、見方を変えると、研究という営みのほんの一部分でもあります。実際の数学研究は、思いつきを転がし、関連する論文を探し、計算で確かめ、定理を証明し、理論を組み立てる——その行きつ戻りつの全部を含んでいます。AIコ・マスマティシャンが面白いのは、この一連の過程そのものに AI を同席させようとしているところです。答えを出す機械というより、隣で一緒に考える相手。論文も「人間どうしの共同作業を映し取る」という言い方をしています。
仕組みの中心にあるのは、状態を持ち続ける作業空間です。
ふつうの対話型 AI は、一問一答で完結してしまい、前にどんな試行錯誤をしたかを忘れていきます。研究の相棒としては、そこが物足りない。AIコ・マスマティシャンは、不確かさを抱えたまま進み、利用者のあいまいな意図を少しずつ輪郭のあるものにし、うまくいかなかった仮説まで記録しておく。しかも複数の作業を同時並行で進められる、非同期の作りになっています。数学的な成果物も、そのまま使える形で書き出す。研究室のホワイトボードが、消されずに残り続けているようなもの、と考えると少し近いかもしれません。
実力の話もしておきます。論文によると、初期のテストで、研究者が未解決の問題を解いたり、新しい研究の方向を見つけたり、見落とされていた先行研究にたどり着いたりするのを助けたとされています。
数字としては、難問ぞろいのベンチマーク「FrontierMath」の最上位、Tier 4 で48%。評価された AI システムのなかで新たな最高スコアだと書かれています。FrontierMath の Tier 4 は、研究者でも手こずる水準の問題が並ぶ層です。そこで半分近くというのは、相応に重い数字だと思います。ただ、これは査読前のプレプリントで、初期テストで具体的にいくつの未解決問題に効いたのか、その細かい内訳まではこの記事では断定しません。そこは本文の精査待ちです。
日本の大学や研究の現場でも、研究者が何に時間を使うべきか、という問いは年々重くなっています。文献の調べもの、計算の下ごしらえ、書類づくり。もしその一部を「同僚」としての AI が引き受けられるなら、知的な仕事の時間配分は変わっていきます。
そしてこれは、数学だけの話ではないはずです。探して、試して、書く。その繰り返しでできている仕事は、研究のほかにも、分析にも、法律にも、たくさんあります。AIが答えを出す道具から、過程を共にする相手へ——その移り変わりが、いろいろな職種の人たちにとって、どんな景色になるのか。答えを急がずに、見ておきたいところです。
arXiv: AI Co-Mathematician — Accelerating Mathematicians with Agentic AI