🕛 2026.6.23

AIエージェントは『管理者権限つきの新入り』。DeepMindが乗っ取られる前提の防御地図を公開

AIエージェントに仕事を任せる前に、考えておきたいことが1つある。「もしこのエージェントが乗っ取られたら、どこまで暴走できるのか」だ。Google DeepMind が6月18日に公開した「AI Control Road […]
🕛 2026.6.23

550Bのうち動くのは55Bだけ。NVIDIAが『必要な専門家だけ呼ぶ』オープンAIを公開

巨大な AI モデルなのに、動かすときは一部しか使わない——そんなモデルが、重みごと公開されました。NVIDIA が出した「Nemotron 3 Ultra」です。総パラメータは550B(5500億)あるのに、1回の処理 […]
🕛 2026.6.23

量子コンピュータの『間違い』を800倍直せた。2年越しの実機データが、Natureの査読を通った意味

量子コンピュータの話になると、「すごい」と「まだ無理」が同じ口から出てくることがよくあります。今回の知らせは、その両方を少しだけ前に進めるものでした。Microsoft と Quantinuum が、量子計算の「間違い」 […]
🕛 2026.6.23

AIに『長い仕事』を最後までやらせる。Z.aiがGLM-5.2を重みごと公開、1M文脈で迷子を防ぐ

AIに長めの作業を任せたことがある人なら、たぶん一度は経験しているはずです。最初は調子よく進むのに、後半になると「さっき決めたはずのこと」を忘れて、つじつまが合わなくなる。今回 Z.ai(智譜)が公開したオープンモデル「 […]
🕛 2026.6.23

オープンモデルが、また一段上へ。MiniMax M3は画像・動画ネイティブでSWE-Bench Pro 59%

オープンモデルの底上げが止まらない。MiniMax が新モデル「M3」を、重みごと公開した。中国発のオープン勢が、また一段、上のラインに来たという話。 数字を見よう。総パラメータは約428B(4280億)。ただし1回の処 […]
🕛 2026.6.20

『即答する1兆』と『じっくり考える1兆』、モデル重みを公開。中国発AIが二刀流で来た

巨大なAIモデルの話は、たいてい「どこそこが新しい最強モデルを出した、ただし使えるのはAPI越し」で終わる。今回はそこが少し違っていて、1兆パラメータ級のモデルを、しかも2種類、重み(モデルの中身そのもの)ごと配ってきた […]
🕛 2026.6.20

AIの『考えすぎ』を、走りながら間引く。推論を短くしても正答を保てるか、という実験

結論から言うと、これは派手さはないが、毎月の請求書に効いてくるタイプの研究だ。推論型のAI——答える前に頭の中で長く考えるタイプのモデル——が抱える「考えすぎ」を、どう抑えるか、という話です。 6 月 16 日に arX […]
🕛 2026.6.20

ロボAIの推論を最大55倍高速化。『立体の勘』を行動につなぐGAM

ロボットを賢く動かすAI、最近すごく増えてるんですが、中身はけっこう力技なんです。「カメラで見る係」「次に何が起きるか予想する係」「じゃあ手をどう動かすか決める係」を別々のモジュールで作って、それを繋いで動かす。役者を3 […]
🕛 2026.6.20

AI主導の自動ラボが約1万反応を検証。薬のもとの『作りにくい反応』を改善

新しい薬が私たちの手元に届くまで、その裏側でどれだけの試行錯誤が積まれているか、ふだんはあまり想像しませんよね。今日はその試行錯誤の一部を、AI主導の自動ラボが大規模に回した、という話です。 OpenAI と創薬向け A […]
🕛 2026.6.20

生命科学の実務750題、専門AIでも評価スコア36.1%。数字で見えた現在地

数字を見よう。生命科学の実務をどこまでこなせるか、AIに750題を解かせた。専門家ルーブリックによる評価スコアは、GPT-Rosalindで36.1%。これが今の現在地だ。 OpenAI が LifeSciBench と […]