🕛 2026.5.27

電力グリッドにも「小さな基盤モデル」が来た話。Microsoft GridSFMが数時間→ミリ秒へ

電気って、毎日コンセントから出てくるあいだは、あまり意識しないものなんですね。でも、その裏側でいま、面白い変化が起きています。 Microsoft が、電気を全国に届けている送電網のための AI、「GridSFM」を公開 […]
🕛 2026.5.27

Starletteに「BadHost」発覚。週3.25億DLが効くAIエージェント直撃

この記事は、会社で AI ツールを作っている開発者や、自分でちょっとした AI アプリを動かしている方に向けた話です。普通に ChatGPT や Claude を使っているだけの方には直接の影響はほぼありませんが、「自分 […]
🕛 2026.5.25

「消す」と「書く」を別のつまみに。NVIDIAの線形アテンションがMamba超え

線形アテンション、という地味だけれど効く研究が、また一歩進みました。 NVIDIA の Ali Hatamizadeh・Yejin Choi・Jan Kautz の 3 氏が arXiv で公開した「Gated Delt […]
🕛 2026.5.24

DeepSeekが旗艦「V4-Pro」を75%値下げ。期間限定割引を恒久化、料金は4分の1へ

DeepSeek が、また値段で殴りに来た。旗艦モデルの料金を、4分の1に固定する話。 中国の DeepSeek が、主力モデル「DeepSeek V4-Pro」の API 料金を恒久的に75%引き下げる、と発表していま […]
🕛 2026.5.23

「カメラ越しに答え続けるAI」を、速さも含めて採点する。Appleが物差しを公開

スマホのカメラを何かに向けて、「これ何?」と話しかける。あの使い方を、まじめに採点する物差しが出てきました。 「VSAS-Bench」というベンチマークが、arXiv に出ています(arXiv:2604.07634)。2 […]
🕛 2026.5.22

アリババが「Qwen3.7-Max」公開。AIが35時間自走、ツール呼び出しは1000回超

アリババが、また一段ギアを上げてきた。 2026年5月20日、アリババクラウドが年次イベント「2026 Alibaba Cloud Summit」で、新しい大規模言語モデル「Qwen3.7-Max」を公開した。同社がいま […]
🕛 2026.5.21

Cohereが「Command A+」をオープンソース公開。H100が2枚で動く企業向けAI

ふと考えてしまうんですが、「AI を使う」と「AI を持つ」は、似ているようでずいぶん違う言葉ですよね。 カナダの AI 企業 Cohere が、2026 年 5 月 20 日、新しい大規模言語モデル「Command A […]
🕛 2026.5.20

Gemini 3.5 と「Omni」が登場。Google が一気に作りに来た、という話

Google I/O 2026 で、Gemini 3.5 ファミリーが出ました。同時に「Gemini Omni」というシリーズも発表されています。要はこういうことですね、Google が「対話モデルと生成モデル、両方こっ […]
🕛 2026.5.13

何恺明、初めて言語モデルを書く。GPT流の「次の単語予測」を捨てた拡散LM「ELF」

GPT を作った人たちと、別の道を歩いてきた研究者がいます。 そのひとり、Kaiming He(何恺明)がはじめて「言語モデル」を出した、というニュースが arXiv に出ました。論文タイトルは ELF: Embedde […]
🕛 2026.5.11

LLMを「穴あきチーズ」に変えて30%速くする。Sakana AIとNVIDIAの新スパース化技術

LLM を「穴のたくさん空いたチーズ」みたいに作り直すと、もっと速くて軽くなる——。Sakana AI と NVIDIA が、その実証論文を公開しました。 東京の Sakana AI が、機械学習トップ会議 ICML 2 […]