公開:

Stability AIがStable Diffusion 3.5を発表、商用利用可能な画像生成AIモデルの提供が開始

text: XEXEQ編集部
(記事は執筆時の情報に基づいており、現在では異なる場合があります)


記事の要約

  • Stability AIがStable Diffusion 3.5を発表
  • 無料で商用・非商用利用が可能に
  • 複数のバリエーションモデルを提供

Stable Diffusion 3.5の新機能と特徴

英Stability AIは2024年10月22日、画像生成AIの新モデル「Stable Diffusion 3.5」を発表し、「Stability AI Community License」のもとでの提供を開始した。商用・非商用を問わず無料で利用できる画期的な仕様となっており、年間収益100万米ドルまでの営利目的での使用も可能となっている。[1]

Stable Diffusion 3.5には複数のバリエーションモデルが用意されており、80億のパラメーターを持つ最強力な「Large」モデルと高速処理に特化した「Large Turbo」モデルが提供されている。コンシューマー向けハードウェアでの実行に最適化された25億パラメーターの「Medium」モデルは10月29日にリリースされる予定だ。

新モデルは長大なプロンプトを必要とせず多様なアウトプットが可能で、3D・写真・絵画・線画など幅広いスタイルに対応している。カスタマイズ性を重視した設計により、同じプロンプトでも異なるシードを使用することで多彩なバリエーションを生成できるようになった。

Stable Diffusion 3.5の機能まとめ

Large Large Turbo Medium
パラメーター数 80億 80億 25億
主な特徴 最高性能 高速処理 軽量実行
リリース日 10月22日 10月22日 10月29日

画像生成AIモデルについて

画像生成AIモデルとは、テキストプロンプトから画像を生成する人工知能システムのことを指す。主な特徴として、以下のような点が挙げられる。

  • テキストの意図を理解して画像を生成
  • 複数のスタイルや表現方法に対応
  • パラメーター数が多いほど高品質な画像を生成

Stable Diffusion 3.5では、大規模なパラメーター数と効率的なアーキテクチャにより高品質な画像生成を実現している。特にLargeモデルは80億のパラメーターを持ち、プロンプトの意図を正確に反映した画像生成が可能になっている。

Stable Diffusion 3.5に関する考察

Stable Diffusion 3.5の発表は、AIモデルの民主化という観点で重要な一歩となっている。無料での商用利用を可能にしたことで、個人クリエイターやスタートアップ企業にとって高品質な画像生成AIへのアクセスが格段に容易になったと言えるだろう。

複数のバリエーションモデルを用意したことで、ユーザーは用途に応じて最適なモデルを選択できるようになった。高性能な画像生成が必要な場合はLargeモデルを、スピードが重要な場合はLarge Turboモデルを使用するなど、柔軟な選択が可能になっている。

今後は他社の画像生成AIモデルとの競争が激化すると予想される。Stability AIには継続的なモデルの改善と、より多くのユースケースへの対応が求められるだろう。特に、生成画像の品質向上とプロンプトの直感的な解釈能力の強化が重要な課題となる。

参考サイト

  1. ^ stability.ai. 「Stable Diffusion 3 API Now Available — Stability AI」. https://stability.ai/news/stable-diffusion-3-api, (参照 24-10-24).

※上記コンテンツはAIで確認しておりますが、間違い等ある場合はコメントよりご連絡いただけますと幸いです。

「AI」に関するコラム一覧「AI」に関するニュース一覧
ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。