🕛 2026.6.20

『即答する1兆』と『じっくり考える1兆』、モデル重みを公開。中国発AIが二刀流で来た

巨大なAIモデルの話は、たいてい「どこそこが新しい最強モデルを出した、ただし使えるのはAPI越し」で終わる。今回はそこが少し違っていて、1兆パラメータ級のモデルを、しかも2種類、重み(モデルの中身そのもの)ごと配ってきた […]
🕛 2026.6.20

AIの『考えすぎ』を、走りながら間引く。推論を短くしても正答を保てるか、という実験

結論から言うと、これは派手さはないが、毎月の請求書に効いてくるタイプの研究だ。推論型のAI——答える前に頭の中で長く考えるタイプのモデル——が抱える「考えすぎ」を、どう抑えるか、という話です。 6 月 16 日に arX […]
🕛 2026.6.20

ロボAIの推論を最大55倍高速化。『立体の勘』を行動につなぐGAM

ロボットを賢く動かすAI、最近すごく増えてるんですが、中身はけっこう力技なんです。「カメラで見る係」「次に何が起きるか予想する係」「じゃあ手をどう動かすか決める係」を別々のモジュールで作って、それを繋いで動かす。役者を3 […]
🕛 2026.6.20

AI主導の自動ラボが約1万反応を検証。薬のもとの『作りにくい反応』を改善

新しい薬が私たちの手元に届くまで、その裏側でどれだけの試行錯誤が積まれているか、ふだんはあまり想像しませんよね。今日はその試行錯誤の一部を、AI主導の自動ラボが大規模に回した、という話です。 OpenAI と創薬向け A […]
🕛 2026.6.20

生命科学の実務750題、専門AIでも評価スコア36.1%。数字で見えた現在地

数字を見よう。生命科学の実務をどこまでこなせるか、AIに750題を解かせた。専門家ルーブリックによる評価スコアは、GPT-Rosalindで36.1%。これが今の現在地だ。 OpenAI が LifeSciBench と […]
🕛 2026.6.20

AIに『本番前のリハーサル』をさせる。過去130万件の会話で、公開前のふるまいを読む試み

ふと考えてしまうんですが、新しい道具を世に出す前に、人はどうやって「だいじょうぶ」を確かめてきたんでしょうか。舞台なら本番前のリハーサル、料理なら味見。では、毎日何千万人と話す AI の場合は——という問いに、ひとつの答 […]
🕛 2026.6.16

量子の誤りを直す『係員』を作り直す。FPGA消費を最大8.2倍そぎ落とした新復号器

量子コンピュータの話になると、たいてい「量子ビットを何個並べた」に注目が集まる。でも、現場で本当に効いてくるのは、並べたあとに誤りをどう直すかの部分だったりする。今回はその「直す係」を作り直した、地味だけど筋のいい論文を […]
🕛 2026.6.16

AIに『自分でメモを取らせる』。長考を要約させたら賢くなって18.6%短くなった話

ふと考えてしまうんですが、人が長く考え込むほど良い答えにたどり着くかというと、必ずしもそうではないですよね。途中で論点を見失ったり、最初の思い違いを引きずったまま遠くへ行ってしまったり。今の「考えるタイプ」の AI も、 […]
🕛 2026.6.16

2本指ロボの脳を5本指に引っ越し。器用ハンドを少ないお手本で動かす「InDex」

ロボットの「手」、ずっと気になってるんです。腕や移動はどんどん賢くなってるのに、肝心の手先が二本の爪で挟むだけ、みたいなロボが多くて。そこを正面から殴りに行った論文を6月に見つけたので置いておきます。 arXiv に出た […]
🕛 2026.6.16

ロボに『日本語で頼む』は、まだ分が悪い。非英語の指示で成功率が30〜50%落ちた

ロボットに日本語で「これ取って」と頼む。近い将来それが当たり前になると、なんとなく思っていた。だが数字を見ると、そう甘くはなかった。 6 月に arXiv へ出た「When Does Language Matter?」と […]