🕛 2026.6.11

Alibabaの新コーダ『Qwen3-Coder-Next』、3B駆動で10〜20倍級の性能に並ぶ

数字を見よう。SWE-Bench Verified 70.6%。動かしたのは、80Bのうちたった3B。 AlibabaのQwenチームがHugging Faceの公式モデルカードで公開している、コーディングエージェント特 […]
🕛 2026.6.9

『経験を積むほど賢くなるAI』が、逆に壊れる。自己進化エージェントの落とし穴

結論から言うと、「使えば使うほど賢くなる AI」を素朴に作ると、賢くなるどころか壊れることがある、という研究です。 arXiv に出た「Rethinking Continual Experience Internaliz […]
🕛 2026.6.4

Windsurf 改め『Devin Desktop』。他社の AI エージェントまで一画面で走らせる設計

Windsurf というブランドが、消えた。 Cognition が 6 月 2 日、コードエディタの Windsurf を「Devin Desktop」に改名して出し直した。ただの名前替えではない。エディタの既定画面を […]
🕛 2026.5.29

「これ、動かして」で動くマウスカーソル。DeepMindが研究プレビュー公開

マウスのカーソルって、ここ 30 年くらい姿が変わってないんですよ。あの矢印が、ようやく次に進みそうです。 Google DeepMind が、AI を組み込んだ新しいマウスポインタの研究プレビューを公開しました。名前は […]
🕛 2026.5.23

数学者の隣に座るAI。DeepMindの「AIコ・マスマティシャン」が公開

AIに数学の難問を解かせた、という話は、このところ続けて耳にします。でも今回の研究は、少し毛色が違いました。 Google DeepMind を中心とする研究チームが、「AI co-mathematician(AIコ・マ […]
🕛 2026.5.21

Googleが「Antigravity 2.0」を公開。AIエージェントを並列で走らせる開発環境へ

結論から言うと、開発の道具立てが一段、エージェント寄りに動いた話だ。 Google が 2026 年 5 月 19 日、開発者向けイベント I/O 2026 で「Google Antigravity 2.0」を発表した。 […]
🕛 2026.5.19

Cursor の自社モデル「Composer 2.5」、Kimi K2.5をベースに「ちゃんと長丁場を走り切る」AIへ。値段は据え置きの話

コーディング AI が「途中で迷子にならずに長い仕事を最後までやる」方向に、また一段ぶん進んだ話です。 Cursor が 5 月 18 日、自社のコード生成モデル Composer 2.5 を公開しました。1 つ前の C […]
🕛 2026.5.18

Cursor 3.4 が「クラウドエージェントの作業部屋」をDockerfileで設定できるようにした。並列に走る AI を企業の中で安全に飼う話

結論から言うと、コードを書く AI を「企業の中でちゃんと飼える」状態に、また一段近づいた話です。 Cursor 3.4 が 5 月 13 日にリリースされました。今回の主役は クラウドエージェント用の開発環境。要するに […]
🕛 2026.5.18

ChatGPTアプリの中に「Codex」が引っ越してきました。スマホからコードを動かす時代、まずは触ってみる話

ChatGPT のアプリを開くと、「Codex」というメニューが増えていた、という方、いらっしゃるかもしれません。 OpenAI が 2026 年 5 月 14 日に発表しました。これまでウェブ版や、macOS の Co […]
🕛 2026.5.13

GitHub Copilot、6/1から「Pro 15ドル相当・Pro+ 70ドル相当・Max 200ドル相当」へ。実質値上げではなく「枠が増える」設計

GitHub Copilot の課金体系が、6 月 1 日からまた一段変わります。 GitHub Blog が 5 月 12 日付で公開したのは、「6 月 1 日から usage-based billing(使用量ベース […]