Stable Diffusionとは？話題の画像生成AIを徹底解説！

Home
Stable Diffusion
Stable Diffusionとは？話題の画像生成AIを徹底解説！

2023.08.19

Stable Diffusionとは？話題の画像生成AIを徹底解説！

Stable Diffusion

Stable Diffusionとは

Stable Diffusion(ステイブル・ディフュージョン)とは、テキストや画像を入力するとそれに沿った画像を自動生成してくれる人工知能のシステムです。ステイブルは「安定した」という意味で、ディフュージョンは「拡散」という意味です。

このシステムは、2022年に公開されたオープンソースの画像生成AIで、ウェブサイトやアプリケーションなどで利用できます。

例えば、「a cat with white background」や「a dragon with green scales」などというテキストを入力すると、それに対応した画像が生成されます。

Stable Diffusionは、ミュンヘン大学のCompVisグループが開発した潜在拡散モデルであり、深層生成ニューラルネットワークの一種です。

このモデルは、EleutherAIとLAIONの支援を受け、Stability AI、CompVis LMU、Runwayの三者が共同で公開しました。

潜在拡散モデルとは、画像をノイズに変換してから元に戻すという過程を繰り返すことで、高品質な画像を作り出すアルゴリズムです。この過程は、拡散と逆拡散と呼ばれます。拡散では、画像に連続的にガウシアンノイズが付与されていきます。逆拡散では、ノイズを除去しながら画像を復元していきます。このとき、テキストや画像などの条件を与えることで、画像の生成結果を変えることができます。

Stable Diffusionは、非常に高度な人工知能モデルですが、「NMKD Stable Diffusion GUI」というソフトウェアや「Post Saint」というプラグインなどを使うことで、誰でも簡単に操作できるようになっています。これらのツールでは、GUI（グラフィカルユーザーインターフェース）でテキストや画像を入力し、画像を生成することができます。また、拡張機能や追加学習などを使って、さらにカスタマイズすることもできます。

Stable Diffusionとは？話題の画像生成AIを徹底解説！

Stable Diffusionとは

Related post

2023年最新！Stable Diffusion…

Comment