Stability AIがStable Diffusion 3.5 Large向けの3つの新ControlNetを発表、高品質な画像生成と商用利用が可能に

text: XEXEQ編集部
（記事は執筆時の情報に基づいており、現在では異なる場合があります）

記事の要約

Stability AIがStable Diffusion 3.5 Large用の新ControlNetを発表
Blur、Canny、Depthの3種類のControlNetを追加
商用・非商用で無料利用可能なライセンスを提供

Stable Diffusion 3.5 LargeのControlNet追加による画像生成の進化

英Stability AIは2024年11月26日、画像生成AIモデル「Stable Diffusion 3.5 Large」向けに3つの新しいControlNet機能となる「Blur」「Canny」「Depth」を発表した。これらの新機能はStability AI Community Licenseのもと、年間収益が100万ドル未満の組織であれば商用利用も含めて無料で利用できる仕組みとなっている。^[1]

新たに追加されたBlur機能は、低解像度の画像を8Kや16Kの高解像度にアップスケーリングすることが可能となり、画像の細部まで鮮明に表現できるようになった。一方、Canny機能は画像の輪郭線を抽出して構造を維持したまま生成を行うため、イラストから実写まで幅広いスタイルに対応している。

Depth機能は深度マップを利用して画像の奥行きや立体感を制御することができ、建築パースの作成や3Dアセットのテクスチャリングなど、正確な空間表現が求められる用途に特に効果を発揮する。開発者はHugging FaceからモデルのWeightを、GitHubからコードをダウンロードして利用することが可能だ。

Stable Diffusion 3.5 Largeの新機能まとめ

	Blur	Canny	Depth
主な機能	高解像度化	輪郭線抽出	深度制御
対応解像度	8K/16K	任意	任意
主な用途	画質向上	イラスト制作	建築パース

ControlNetについて

ControlNetとは画像生成AIモデルの出力を制御するための技術で、入力画像の特定の特徴を保持しながら新しい画像を生成することができる仕組みのことを指す。以下のような特徴が挙げられる。

既存画像の構造や特徴を維持しながら画像生成が可能
深度マップや輪郭線などの条件指定で精密な制御が可能
画像のアップスケーリングや変換を高品質に実行可能

Stable Diffusion 3.5 LargeのControlNetは、従来のバージョンと比較してより精密な制御と高品質な出力を実現している。ユーザー評価実験でも約150人の参加者による比較で最も高い評価を獲得しており、実用性の高さが証明されている。

Stable Diffusion 3.5 LargeのControlNetに関する考察

Stable Diffusion 3.5 LargeのControlNet追加は、AIによる画像生成の精度と実用性を大きく向上させる重要な進展となっている。特に商用利用も含めた無料ライセンスの提供は、スタートアップや個人クリエイターにとって画期的な機会となり、AIを活用したコンテンツ制作の普及を加速させるだろう。

今後の課題として、高解像度画像の生成に必要な計算リソースの最適化や、より多様な用途に対応するための新しい制御機能の開発が挙げられる。また、商用利用における年間収益制限の緩和や、より柔軟なライセンス体系の整備も期待される。

将来的には、3Dモデリングソフトウェアとの連携強化や、動画生成への応用など、より幅広い創作活動へのサポートが望まれる。特にリアルタイムでの画像生成や編集機能の実装は、クリエイターのワークフローを劇的に改善する可能性を秘めている。