Stable Diffusionは自宅のPCで使える、すぐれた画像生成AIです。ウェブで公開されている様々なモデルをダウンロードして組み込むことで、表現力を拡張していくことができます。
2023年7月~8月もすばらしいモデルがいくつも公開されました。特にSDXL1.0のリリースは大きな話題となっています。
SDXL1.0では以前のStable Diffusionでは考えられないくらい単純なプロンプトで、質の高い画像生成ができるようになっています。
この記事では先月までに紹介できていない、Stable Diffusionの6つのモデルを分野別に紹介します。
- 実写全般のためのStable Diffusionのおすすめモデル
- 実写人物のためのStable Diffusionのおすすめモデル
- アニメ・イラストスタイルのStable Diffusionのおすすめモデル
- Stable Diffusionで生成した画像のライセンスについて
- Stable Diffusionにおすすめのグラフィックボード
- Stable Diffusionにおすすめのパソコン
- Stable Diffusionにダウンロードしたモデルをインストールする方法
- Stable Diffusion webuiでモデルを使用する方法
- Stable Diffusionで生成した画像をTopaz Photo AIで拡大
- まとめ
実写全般のためのStable Diffusionのおすすめモデル
SDXL1.0
今月のビッグニュースはなんといってもSDXL1.0です。Stable Diffusionを開発したStability AIが新しくStable Diffusion XL(SDXL)1.0をリリースしました。
実写系イラスト系ともにStable Diffusion1.5や2.1とはレベルの違う画像を生成できます。
プロンプトも単純な記述で品質の高い表現が可能になっているので、Stable diffusion1.5系のプロンプトは一度忘れてシンプルなプロンプトから試していくといいと思います。
※SDXL1.0は高いVRAM容量を必要とするため、VRAM12GB以上を推奨です。
License:creativeml-openrail++-m
+No generation services
+No selling models
このベースモデルからの派生でさらに高品質な画像が生み出されていくことと思われます。この記事の中でもBreakDomainXL_V01fというSDXL1.0派生モデルを紹介しています。
実写人物のためのStable Diffusionのおすすめモデル
minaduki_mix v1.0
minaduki_mix v1.0はepiCRealismというモデルをベースにして日本人の画像が生成できるようにチューニングされています。
yayoi_mix、kisaragi_mixなどでもおなじみのこたじろうさんが作られています。
epiCRealismは実写系全般に強いフォトリアリスティックモデルなので、minaduki_mixもリアルな日本人を生成するのに向いています。
生成の品質も非常に高いです。
License:creativeml-openrail-m
weddingImperial v2
weddingImperial v2は日本人の顔をベースに、欧米系のテイストをプラスしてあるモデルです。
目が大きめの、整ったきれいな顔のリアル系人物を生成することができます。
ChilloutmixやBRAとはまた一味違った美しい顔を生成することができ、衣服などの細部もとてもきれいに描写されます。
Stable Diffusion1.5の派生モデルです。
License:creativeml-openrail-m
+No generation services
+No selling models
アニメ・イラストスタイルのStable Diffusionのおすすめモデル
Blazing Drive V05a
Blazing Drive v04mは以前の記事でご紹介したBreakDomainシリーズと同じ作者のBDさんがリリースされた、アニメ塗り・ダイナミックな動きなどに強いモデルです。
こちらのモデルはStableDiffusion1.5をもとにしています。
Blazing DriveはVAEの使用を推奨されています。
License:creativeml-openrail-m
+No selling models
BreakDomainXL_V01f
BreakDomainXL_V1fもBDさん制作のモデルBreakDomainシリーズですが、新たにSDXL1.0の派生モデルとして制作されています。
SDXL1.0をもとにしているだけに高品質な生成ができます。かなり細かい描写、ドラマティックな絵作りができます。
License:creativeml-openrail++-m
+No generation services
+No selling models
このモデルはSDXL標準VAEの使用が推奨されています。
milktea v1
ゆるふわ系の白っぽいかわいい雰囲気が特徴的なイラスト系モデルです。筆者が試したときはクローズアップで使うとややリアルよりになる傾向がありました。
こちらはStable Diffusion1.5の派生モデルです。VAEの使用が推奨されています。
License:creativeml-openrail-m
+No generation services
+No selling models
Stable Diffusionで生成した画像のライセンスについて
この記事で紹介したモデルは「creativeml-openrail-m」または「creativeml-openrail++-m」というライセンスになっています。
creativeml-openrail-mの内容についてははせ@AI Photoさんが和訳してくださっています。
また個人利用以外の場合は個別に注意が必要です。こちらもはせ@AI Photoさんのnoteで詳しく説明されているので、参考にさせてもらうといいと思います。
creativeml-openrail++-mについては、おおむねcreativeml-openrail-mと同じと考えていいようですが商用利用の際は注意してください。
Stable Diffusionにおすすめのグラフィックボード
Stable Diffusionの画像生成に適しているのは、計算速度が速くVRAM容量が高いグラフィックボードです。
特にSDXL1.0はVRAM要件が厳しく、12GB以上の容量が求められます。
現在一般的に手に入る最も性能の高いグラフィックボードは「Nvidia GeForce RTX4090」です。
VRAM容量は24GBと、SDXL1.0でのAI画像生成にも十分に高い性能です。
しかしRTX4090は2023年8月現在で25~30万円前後と高価になってしいます。
もっと安くかつ、そこそこ高い性能を求める場合、「Nvidia GeForce RTX4070」であれば10万円前後で入手可能です。
RTX4070はVRAM容量12GBと低くはないスペックなので、VRAM4~8GBでSDXL1.0が使えずに不便を感じている方には魅力的な選択肢になると思います。
Stable Diffusionにおすすめのパソコン
G-Tune DG-I7G70は第13世代インテルCPUとRTX4070搭載の高性能ゲーミングデスクトップPCです。RTX4070を搭載していることで、Stable Diffusionの画像生成にも適したスペックとなっており、価格的にもおすすめのモデルです。
ゲーミングPCながら、Photoshopでの画像編集などクリエイティブ用途にもおすすめのPCです。
Stable Diffusionにダウンロードしたモデルをインストールする方法
ダウンロードした「.safetensors」や「.ckpt」ファイルを「stable-diffusion-webui」フォルダにある「models」フォルダの中の「Stable-diffusion」フォルダにドラッグしてコピーします。
\stable-diffusion-webui\models\Stable-diffusion
Stable Diffusion webuiでモデルを使用する方法
「.safetensors」や「.ckpt」ファイルをコピーできたら一度コマンドプロンプトとブラウザのUIは再起動してください。
再度起動できたらStable Diffusionのメイン画面の左上「Stable Diffusion checkpoint」のところからインストールしたモデルを選びます。
これでモデルの切り替えができるので、あとはいつもどおりプロンプトや生成の設定をして画像を生成するだけです。
Stable Diffusionで生成した画像をTopaz Photo AIで拡大
Topaz Photo AIはStable DiffusionやMidjourneyで生成した画像の拡大等にも適したアプリケーションです。
Stable Diffusionの機能である「Hires.fix」や「Tile diffusion」と、Topaz Photo AIを組み合わせることで、高解像度の画像作成も可能になります。
Topaz Photo AI 2についてのレビュー記事を書いていますので、参考にしてください。
まとめ
Stable Diffusionの2023年8月のおすすめモデルは、どれも高い品質の画像を生成できます。
なかでもSDXL1.0はStable Diffusionのベースモデルながら、高い精度で人物の肌の質感を再現できるようになりました。
SDXL1.0は高いVRAM容量が必要となるため、PCのスペックが追い付かない人も多いのではないでしょうか。
ComfyUIなど別のUIを使用することで、SDXL1.0やBreakDomainXLを利用することができるケースがあります。
Stable Diffusionのモデル紹介記事では、毎回別々のモデルを紹介していますので、過去の記事もチェックしてみてください。
画像アプリケーションについての情報はこちらのページにまとめています。
ぜひご覧ください。
コメント