【2024年】初心者の独学におすすめ!Photoshop本・Photoshop Elements本

Stable Diffusion【2023年8月】おすすめモデル6つを厳選紹介! SDXL1.0

Stable Diffusion【2023年8月】おすすめモデル6つを厳選紹介! SDXLも 画像アプリケーション
スポンサーリンク

<景品表示法に基づく表記>本サイトのコンテンツにはプロモーションが含まれる場合があります。

Stable Diffusionは自宅のPCで使える、すぐれた画像生成AIです。ウェブで公開されている様々なモデルをダウンロードして組み込むことで、表現力を拡張していくことができます。

2023年7月~8月もすばらしいモデルがいくつも公開されました。特にSDXL1.0のリリースは大きな話題となっています。

SDXL1.0では以前のStable Diffusionでは考えられないくらい単純なプロンプトで、質の高い画像生成ができるようになっています。

SDXL1.0で単純なプロンプトで生成した例
SDXL1.0でプロンプト「a photo of breakfast」のみで生成した例

この記事では先月までに紹介できていない、Stable Diffusionの6つのモデルを分野別に紹介します。

実写全般のためのStable Diffusionのおすすめモデル

SDXL1.0

SDXL1.0の画像生成結果

今月のビッグニュースはなんといってもSDXL1.0です。Stable Diffusionを開発したStability AIが新しくStable Diffusion XL(SDXL)1.0をリリースしました。

実写系イラスト系ともにStable Diffusion1.5や2.1とはレベルの違う画像を生成できます

プロンプトも単純な記述で品質の高い表現が可能になっているので、Stable diffusion1.5系のプロンプトは一度忘れてシンプルなプロンプトから試していくといいと思います。

※SDXL1.0は高いVRAM容量を必要とするため、VRAM12GB以上を推奨です。

License:creativeml-openrail++-m
+No generation services
+No selling models

このベースモデルからの派生でさらに高品質な画像が生み出されていくことと思われます。この記事の中でもBreakDomainXL_V01fというSDXL1.0派生モデルを紹介しています。

AUTOMATIC1111版WebUIのアップデート

SDXL1.0はStable Diffusion WebUIのメジャーな環境であるAUTOMATIC1111でも使うことができます。
WebUIのバージョン1.5.0以降で使用可能です。

AUTOMATIC1111のアップデート方法は以下です。

  1. 「stable-diffusion-webui」フォルダを右クリックして「その他のオプションを確認」→「ターミナルで開く」を選択
  2. 開いたターミナルで「git pull」と入力
  3. WebUIを起動してバージョンを確認

実写人物のためのStable Diffusionのおすすめモデル

minaduki_mix v1.0

Stable Diffusionでminaduki_mix v1.0の画像生成結果

minaduki_mix v1.0はepiCRealismというモデルをベースにして日本人の画像が生成できるようにチューニングされています。

yayoi_mix、kisaragi_mixなどでもおなじみのこたじろうさんが作られています。

epiCRealismは実写系全般に強いフォトリアリスティックモデルなので、minaduki_mixもリアルな日本人を生成するのに向いています。

生成の品質も非常に高いです。

License:creativeml-openrail-m

weddingImperial v2

Stable DiffusionでweddingImperial v2の画像生成結果

weddingImperial v2は日本人の顔をベースに、欧米系のテイストをプラスしてあるモデルです。

目が大きめの、整ったきれいな顔のリアル系人物を生成することができます。

ChilloutmixやBRAとはまた一味違った美しい顔を生成することができ、衣服などの細部もとてもきれいに描写されます。

Stable Diffusion1.5の派生モデルです。

License:creativeml-openrail-m
+No generation services
+No selling models

アニメ・イラストスタイルのStable Diffusionのおすすめモデル

Blazing Drive V05a

Stable DiffusionでBlazing Drive v04mの画像生成結果

Blazing Drive v04mは以前の記事でご紹介したBreakDomainシリーズと同じ作者のBDさんがリリースされた、アニメ塗り・ダイナミックな動きなどに強いモデルです。

Blazing Driveの生成結果

こちらのモデルはStableDiffusion1.5をもとにしています。

Blazing DriveはVAEの使用を推奨されています。

VAEとは

VAEは画像のコントラストや色調を調整する役割を担っています。.vaeファイルをダウンロードして下記のVAEフォルダに入れて使用します。

\stable-diffusion-webui\models\VAE

一般的によくつかわれるVAEはvae-ft-mse-840000-ema-prunedです。

Stable DiffusionのVAEのダウンロード

License:creativeml-openrail-m
+No selling models

BreakDomainXL_V01f

Stable DiffusionでBreakDomainXL_V01fの画像生成結果

BreakDomainXL_V1fもBDさん制作のモデルBreakDomainシリーズですが、新たにSDXL1.0の派生モデルとして制作されています。

SDXL1.0をもとにしているだけに高品質な生成ができます。かなり細かい描写、ドラマティックな絵作りができます。

License:creativeml-openrail++-m
+No generation services
+No selling models

このモデルはSDXL標準VAEの使用が推奨されています。

SDXL標準のVAE

VAEは画像のコントラストや色調を調整する役割を担っています。.vaeファイルをダウンロードして下記のVAEフォルダに入れて使用します。

\stable-diffusion-webui\models\VAE

SDXL1.0標準のVAE

https://civitai.com/api/download/models/137992?type=VAE

milktea v1

Stable Diffusionでmilktea v1の画像生成結果

ゆるふわ系の白っぽいかわいい雰囲気が特徴的なイラスト系モデルです。筆者が試したときはクローズアップで使うとややリアルよりになる傾向がありました。

こちらはStable Diffusion1.5の派生モデルです。VAEの使用が推奨されています。

License:creativeml-openrail-m
+No generation services
+No selling models

Stable Diffusionで生成した画像のライセンスについて

この記事で紹介したモデルは「creativeml-openrail-m」または「creativeml-openrail++-m」というライセンスになっています。

creativeml-openrail-mの内容についてははせ@AI Photoさんが和訳してくださっています。

また個人利用以外の場合は個別に注意が必要です。こちらもはせ@AI Photoさんのnoteで詳しく説明されているので、参考にさせてもらうといいと思います。

creativeml-openrail++-mについては、おおむねcreativeml-openrail-mと同じと考えていいようですが商用利用の際は注意してください。

Stable Diffusionにおすすめのグラフィックボード

Stable Diffusionの画像生成に適しているのは、計算速度が速くVRAM容量が高いグラフィックボードです。

特にSDXL1.0はVRAM要件が厳しく、12GB以上の容量が求められます。

現在一般的に手に入る最も性能の高いグラフィックボードは「Nvidia GeForce RTX4090」です。

VRAM容量は24GBと、SDXL1.0でのAI画像生成にも十分に高い性能です。

しかしRTX4090は2023年8月現在で25~30万円前後と高価になってしいます。

もっと安くかつ、そこそこ高い性能を求める場合、「Nvidia GeForce RTX4070」であれば10万円前後で入手可能です。

RTX4070はVRAM容量12GBと低くはないスペックなので、VRAM4~8GBでSDXL1.0が使えずに不便を感じている方には魅力的な選択肢になると思います。

Stable Diffusionにおすすめのパソコン

G-Tune DG-I7G70第13世代インテルCPUとRTX4070搭載の高性能ゲーミングデスクトップPCです。RTX4070を搭載していることで、Stable Diffusionの画像生成にも適したスペックとなっており、価格的にもおすすめのモデルです。

ゲーミングPCながら、Photoshopでの画像編集などクリエイティブ用途にもおすすめのPCです。

Stable Diffusionにダウンロードしたモデルをインストールする方法

Stable Diffusionにダウンロードしたモデルをインストールする方法

ダウンロードした「.safetensors」や「.ckpt」ファイルを「stable-diffusion-webui」フォルダにある「models」フォルダの中の「Stable-diffusion」フォルダにドラッグしてコピーします。

\stable-diffusion-webui\models\Stable-diffusion

Stable Diffusion webuiでモデルを使用する方法

.safetensors」や「.ckpt」ファイルをコピーできたら一度コマンドプロンプトとブラウザのUIは再起動してください。

再度起動できたらStable Diffusionのメイン画面の左上「Stable Diffusion checkpoint」のところからインストールしたモデルを選びます。

Stable Diffusionで使用するモデルを選ぶ

これでモデルの切り替えができるので、あとはいつもどおりプロンプトや生成の設定をして画像を生成するだけです。

Stable Diffusionで生成した画像をTopaz Photo AIで拡大

Topaz Photo AIとその他の画像拡大技術の比較

Topaz Photo AIはStable DiffusionやMidjourneyで生成した画像の拡大等にも適したアプリケーションです。

Stable Diffusionの機能である「Hires.fix」や「Tile diffusion」と、Topaz Photo AIを組み合わせることで、高解像度の画像作成も可能になります。

Topaz Photo AI 2についてのレビュー記事を書いていますので、参考にしてください。

まとめ

Stable Diffusionの2023年8月のおすすめモデルは、どれも高い品質の画像を生成できます。

なかでもSDXL1.0はStable Diffusionのベースモデルながら、高い精度で人物の肌の質感を再現できるようになりました

SDXL1.0の細部の再現性
SDXL1.0の画像生成例

SDXL1.0は高いVRAM容量が必要となるため、PCのスペックが追い付かない人も多いのではないでしょうか。

ComfyUIなど別のUIを使用することで、SDXL1.0やBreakDomainXLを利用することができるケースがあります。

Stable Diffusionのモデル紹介記事では、毎回別々のモデルを紹介していますので、過去の記事もチェックしてみてください。

画像アプリケーションについての情報はこちらのページにまとめています。
ぜひご覧ください。

画像アプリケーション
画像を取り扱うアプリケーションの情報をお知らせします。

コメント