🕛 2026.6.25

AIが自分で画面を操作する。Geminiが『computer use』を主力モデルに標準搭載した意味

AIに「この画面、あとはやっといて」と任せられるかどうか。エージェントの勝負はそこに来ている。Google が6月24日、画面を操作する「computer use(コンピュータ操作)」を、主力の軽量モデル Gemini […]
🕛 2026.6.23

AIエージェントは『管理者権限つきの新入り』。DeepMindが乗っ取られる前提の防御地図を公開

AIエージェントに仕事を任せる前に、考えておきたいことが1つある。「もしこのエージェントが乗っ取られたら、どこまで暴走できるのか」だ。Google DeepMind が6月18日に公開した「AI Control Road […]
🕛 2026.6.23

AIに『長い仕事』を最後までやらせる。Z.aiがGLM-5.2を重みごと公開、1M文脈で迷子を防ぐ

AIに長めの作業を任せたことがある人なら、たぶん一度は経験しているはずです。最初は調子よく進むのに、後半になると「さっき決めたはずのこと」を忘れて、つじつまが合わなくなる。今回 Z.ai(智譜)が公開したオープンモデル「 […]
🕛 2026.6.16

AIに『その答え、ここが違う』と突き返して鍛える。正規表現づくりで最難タスクが3.2→38.1%に

これ、ジュニアに説明しづらいやつなんですが——AI を上達させるとき、正解を見せるより「その答え、ここが違うよ」と間違いを突き返したほうが速い、という話です。 6 月に arXiv へ出た「Counterexample […]
🕛 2026.6.11

Alibabaの新コーダ『Qwen3-Coder-Next』、3B駆動で10〜20倍級の性能に並ぶ

数字を見よう。SWE-Bench Verified 70.6%。動かしたのは、80Bのうちたった3B。 AlibabaのQwenチームがHugging Faceの公式モデルカードで公開している、コーディングエージェント特 […]
🕛 2026.6.9

『経験を積むほど賢くなるAI』が、逆に壊れる。自己進化エージェントの落とし穴

結論から言うと、「使えば使うほど賢くなる AI」を素朴に作ると、賢くなるどころか壊れることがある、という研究です。 arXiv に出た「Rethinking Continual Experience Internaliz […]
🕛 2026.6.4

Windsurf 改め『Devin Desktop』。他社の AI エージェントまで一画面で走らせる設計

Windsurf というブランドが、消えた。 Cognition が 6 月 2 日、コードエディタの Windsurf を「Devin Desktop」に改名して出し直した。ただの名前替えではない。エディタの既定画面を […]
🕛 2026.5.29

「これ、動かして」で動くマウスカーソル。DeepMindが研究プレビュー公開

マウスのカーソルって、ここ 30 年くらい姿が変わってないんですよ。あの矢印が、ようやく次に進みそうです。 Google DeepMind が、AI を組み込んだ新しいマウスポインタの研究プレビューを公開しました。名前は […]
🕛 2026.5.23

数学者の隣に座るAI。DeepMindの「AIコ・マスマティシャン」が公開

AIに数学の難問を解かせた、という話は、このところ続けて耳にします。でも今回の研究は、少し毛色が違いました。 Google DeepMind を中心とする研究チームが、「AI co-mathematician(AIコ・マ […]
🕛 2026.5.21

Googleが「Antigravity 2.0」を公開。AIエージェントを並列で走らせる開発環境へ

結論から言うと、開発の道具立てが一段、エージェント寄りに動いた話だ。 Google が 2026 年 5 月 19 日、開発者向けイベント I/O 2026 で「Google Antigravity 2.0」を発表した。 […]