AIエージェント - damahapress

🕛 2026.6.25

AIに「この画面、あとはやっといて」と任せられるかどうか。エージェントの勝負はそこに来ている。Google が6月24日、画面を操作する「computer use（コンピュータ操作）」を、主力の軽量モデル Gemini […]

🕛 2026.6.23

AIエージェントに仕事を任せる前に、考えておきたいことが1つある。「もしこのエージェントが乗っ取られたら、どこまで暴走できるのか」だ。Google DeepMind が6月18日に公開した「AI Control Road […]

🕛 2026.6.23

AIに長めの作業を任せたことがある人なら、たぶん一度は経験しているはずです。最初は調子よく進むのに、後半になると「さっき決めたはずのこと」を忘れて、つじつまが合わなくなる。今回 Z.ai（智譜）が公開したオープンモデル「 […]

🕛 2026.6.16

これ、ジュニアに説明しづらいやつなんですが——AI を上達させるとき、正解を見せるより「その答え、ここが違うよ」と間違いを突き返したほうが速い、という話です。 6 月に arXiv へ出た「Counterexample […]

🕛 2026.6.11

数字を見よう。SWE-Bench Verified 70.6%。動かしたのは、80Bのうちたった3B。 AlibabaのQwenチームがHugging Faceの公式モデルカードで公開している、コーディングエージェント特 […]

🕛 2026.6.9

結論から言うと、「使えば使うほど賢くなる AI」を素朴に作ると、賢くなるどころか壊れることがある、という研究です。 arXiv に出た「Rethinking Continual Experience Internaliz […]

🕛 2026.6.4

Windsurf というブランドが、消えた。 Cognition が 6 月 2 日、コードエディタの Windsurf を「Devin Desktop」に改名して出し直した。ただの名前替えではない。エディタの既定画面を […]

🕛 2026.5.29

マウスのカーソルって、ここ 30 年くらい姿が変わってないんですよ。あの矢印が、ようやく次に進みそうです。 Google DeepMind が、AI を組み込んだ新しいマウスポインタの研究プレビューを公開しました。名前は […]

🕛 2026.5.23

AIに数学の難問を解かせた、という話は、このところ続けて耳にします。でも今回の研究は、少し毛色が違いました。 Google DeepMind を中心とする研究チームが、「AI co-mathematician（AIコ・マ […]

🕛 2026.5.21

結論から言うと、開発の道具立てが一段、エージェント寄りに動いた話だ。 Google が 2026 年 5 月 19 日、開発者向けイベント I/O 2026 で「Google Antigravity 2.0」を発表した。 […]