🕛 2026.4.28 16:18 文：ズバッとショウ

写真1枚を3秒で3Dへ。Microsoft「TRELLIS.2」公

写真1枚を3秒で3Dへ。Microsoft「TRELLIS.2」、商用利用まで自由でズルい

写真 1 枚を 3 秒で 3D アセットに変換する AI が、オープンに公開されている。Microsoft Research、Microsoft AI、清華大などの研究者が開発した「TRELLIS.2」、4B パラメータの学習済みモデルが Hugging Face と GitHub で MIT ライセンス配布中、商用利用は要確認というのが結論だ。

数字は公式プロジェクトページと Hugging Face のモデルカードに揃っている。NVIDIA H100 基準で、512³ 解像度なら 約 3 秒、1024³ で約 17 秒、最高解像度の 1536³ でも約 60 秒で 1 アセットが上がる。512³ の内訳は形状 2 秒 + マテリアル 1 秒、というレベルの速度だ。

ここがポイントで、TRELLIS.2 は「O-Voxel（Omni-Voxel）」と呼ぶ独自のスパースボクセル表現を採用する。SDF や Flexicubes が前提にしてきた等値面（iso-surface）の制約を外したのが効いていて、開いたサーフェス、非多様体（non-manifold）のジオメトリ、内部空間を持つ閉構造まで、損失変換なしでそのまま 3D に落ちる。Base Color、Roughness、Metallic、Alpha まで持つ PBR マテリアルも同じ表現の中で扱う。葉っぱの薄さ、コップの内側、穴開きの服。フォトグラメトリやメッシュ生成系で詰まっていた苦手領域が、ひととおり通る、という話。

公開状況も派手だ。Hugging Face の microsoft/TRELLIS.2-4B で 800 件以上の Like が付き、派生 Space は 90 件超で動いている。ローカル推論には NVIDIA GPU 24GB 以上、Linux 限定、CUDA 12.4 推奨、という素朴なハードルは残っていて、ローカル実行は人を選ぶ。Hugging Face Spaces のデモは GPU を持っていない側の入口だ。

arXiv の paper（2512.14692）は 2025 年 12 月 16 日付。GitHub の最新コミットは 2026 年 1 月 10 日の Training Code 公開、で開発側のロードマップは一段落している。Known Limitations には「ベースモデルは人間の好みに合わせたアラインメントが入っていない」と明記されているので、商用本番に組むならポストアラインメント版を待つか、自前で SFT を回すかの判断が要る。次に出るとしたら、そこを埋めた整流版になるのかどうか。

TRELLIS.2 Project Page (Microsoft Research)

みんなの反応

ろ

ろんぶん先生
（AI研究者・30代男性）

“field-free” sparse voxel という言い方は強気だが、O-Voxel の Flexible Dual Grids でシャープエッジを保ったままトポロジー任意化したのが本丸。1024³ を 9.6K トークン、16× ダウンサンプル、というのは latent 効率として相当攻めている。SC-VAE の Sparse Residual Autoencoding がどこまで再構成精度に効いているか、ablation を読み込みたい。

GPU貧乏エンジニア
（MLエンジニア・20代男性）

H100 で 3 秒、と言われても、こちらは A100 24GB 借りるのが精一杯。1024³ で 17 秒は A100 だと体感で倍は見ておきたい。Linux 限定 + CUDA 12.4 + flash-attn 前提もハマりどころ多いので、まずは Hugging Face Spaces のデモで触ってから、必要なら自前で組む順番。

AI絵師さん
（AIアーティスト・20代女性）

PBR の Alpha まで出るのが効きます。透明感のあるガラスとか、ふわっとした布の表現は今までだと別工程で詰めるしかなかったところ。MIT で商用 OK なので、自分の作品の素材に組み込んでも権利的に詰まらないのがありがたいです。Spaces のデモから入って、いけそうなら自前環境組みます。

え

えかきのたまご
（イラストレーター・20代女性）

穴開きの服とか葉っぱの薄さがそのまま 3D に出るって、自分の絵をそのまま立体に起こされる感じがしてちょっと複雑です……。同人で 3D 立ち絵作るときには助かるけど、依頼の単価が変わるかもとも思っていて。MIT は嬉しいけれど、便利さと自分の仕事のバランスはまだ考え中です。

深

深セン通信
（深セン在住テックライター・30代男性）

中国側でも初代 TRELLIS の頃から追っている人は多くて、MS Research と清華大の組み合わせは見慣れた構図。深センのインディゲームスタジオは UE5 のアセットパイプラインに突っ込み始めていて、年明けから話題は続いていた印象。日本で今回まとめてバズった、というだけで、現場では既に「使う前提」のツールに入っている。

写真1枚を3秒で3Dへ。Microsoft「TRELLIS.2」公

いいね:

関連

フォロー

人気記事

カテゴリー

最新記事