Stabel Diffusionのモデルとは?
画像生成AI「Stable Diffusion」はモデルを変更することで、様々なイメージを生成することができます。
2023年9月現在Stable Diffusionには以下のモデル(Checkpointとも呼ばれます)が存在します。
- Stable Diffusion1.5系モデル:従来モデルでControlNetなど、生成ノウハウが蓄積されている
- SDXL系モデル:比較的新しいモデルで高品質だが、ハイスペックなグラフィックス性能が必要
SDXL系モデルは、高容量のVRAMが必要です。VRAM容量が足りなくてSDXLを使えない人も多いと思います。
この記事では先月までで紹介できていない2023年9月の最新のおすすめStable Diffusionモデル、SD1.5系、SDXL系の両方を紹介します。
実写人物のためのStable Diffusionのおすすめモデル
Copax TimeLessXL – SDXL1.0
SDXL
人物描写性能がめちゃくちゃ高いモデルです。生成結果は基本的に欧米系の顔になります。アジア系でもテストしてみましたが、あまり向いていない感じでした。
風景の描写力も高く、夜景を生成するのにも向いています。
リアルな人物生成のためには以下の設定が推奨されています。
- Steps: ~40-60,
- CFG scale: ~4-10
- Sampler: euler a / DPM++ 2M SDE Karras
- Negative prompt:painting, drawing, sketch, cartoon, anime, manga, render, CG, 3d, watermark, signature, label, long neck,
License:creativeml-openrail-m
+No selling models
+No sharing merges
+Same permission required
fuduki_mix v1.5
SDXL
fuduki_mixはyayoi_mixなどでもおなじみ、kotajiroさんのアジア系の人物画像生成に特化したモデルです。
SDXL対応のモデルになり、より安定して高い精度の人物生成が可能になっています。目、髪の毛などの描写力が非常に高いです。
現在、実写アジア系SDXLモデルでは最も品質が高いのではないかと思われます。
License:creativeml-openrail-m
VoidnoiseCoreR0829
SD1.5
イラスト調で人気のシリーズ、LastpieceMixのとーふさんが制作された実写系モデルです。
どこかイラストの雰囲気をもったような、目が大きめの絵的にきれいな実写人物が生成できます。
背景描写も実写感がありつつきれいな色彩でとてもきれいです。
他のモデルでの人物描写と一味変わったものが出せます。
License:creativeml-openrail-m
アニメ・イラストスタイルのStable Diffusionのおすすめモデル
BreakDomainXL V05g
SDXL
これまでの当サイトシリーズ記事でもおなじみBDさん制作のモデルです。
BreakDomainシリーズだけに細かくドラマチックな描写が得意なモデルです。イラスト調での背景描写は特に質が高く秀逸です。
BreakDomainシリーズは短いスパンで細かいアップデートが繰り返されているだけに、完成度の高さがうかがえます。
License:creativeml-openrail++-m
+No selling models
Blazing Drive V09i
SD1.5
こちらもBDさんのイラスト系モデルです。こちらはSD1.5系で、よりイラスト傾向が強いです。
動的なシーンで力強い描写を得意としています。
衣服のディテールや背景描写も細かくてきれいですね。
License:creativeml-openrail-m
+No selling models
LastpieceCoreXL
SDXL
こちらも人気のシリーズLastpieceMixのとーふさんが制作されています。色彩と発色が強めに出るよう調整されたモデルです。
色彩の美しい絵柄が出せます。
VAEはSDXL VAEが推奨されています。
License:creativeml-openrail++-m
Stable Diffusionで生成した画像のライセンスについて
この記事で紹介したモデルは「creativeml-openrail-m」または「creativeml-openrail++-m」というライセンスになっています。
creativeml-openrail-mの内容についてははせ@AI Photoさんが和訳してくださっています。
また個人利用以外の場合は個別に注意が必要です。こちらもはせ@AI Photoさんのnoteで詳しく説明されているので、参考にさせてもらうといいと思います。
creativeml-openrail++-mについては、おおむねcreativeml-openrail-mと同じと考えていいようですが商用利用の際は注意してください。
Stable Diffusionにおすすめのグラフィックボード
Stable Diffusionの画像生成に適しているのは、計算速度が速くVRAM容量が高いグラフィックボードです。現在一般的に手に入る最も性能の高いグラフィックボードは「Nvidia GeForce RTX4090」です。
VRAM容量は24GBと、AI画像生成にも十分な高い性能です。
しかしRTX4090は2023年9月現在で30万円前後と高価になってしいます。
もっと安くかつ、そこそこ高い性能を求める場合、「Nvidia GeForce RTX4060Ti」であれば10万円以内で入手可能です。
RTX4060Ti(16GBバージョン)はVRAM容量16GBとけっして低くはないスペックなので、VRAM4~8GBで不便を感じている方には魅力的な選択肢になると思います。
Stable Diffusionにおすすめのパソコン
G-Tune DG-I7G70は第13世代インテルCPUとRTX4070搭載の高性能ゲーミングデスクトップPCです。RTX4070を搭載していることで、Stable Diffusionの画像生成にも適したスペックとなっており、価格的にもおすすめのモデルです。
ゲーミングPCながら、Photoshopでの画像編集などクリエイティブ用途にもおすすめのPCです。
Stable Diffusionにダウンロードしたモデルをインストールする方法
ダウンロードした「.safetensors」や「.ckpt」ファイルを「stable-diffusion-webui」フォルダにある「models」フォルダの中の「Stable-diffusion」フォルダにドラッグしてコピーします。
\stable-diffusion-webui\models\Stable-diffusion
Stable Diffusion webuiでモデルを使用する方法
「.safetensors」や「.ckpt」ファイルをコピーできたら一度コマンドプロンプトとブラウザのUIは再起動してください。
再度起動できたらStable Diffusionのメイン画面の左上「Stable Diffusion checkpoint」のところからインストールしたモデルを選びます。
これでモデルの切り替えができるので、あとはいつもどおりプロンプトや生成の設定をして画像を生成するだけです。
Stable Diffusionで生成した画像をTopaz Photo AIで拡大
Topaz Photo AIはStable DiffusionやMidjourneyで生成した画像の拡大等にも適したアプリケーションです。
Stable Diffusionの機能である「Hires.fix」や「Tile diffusion」と、Topaz Photo AIを組み合わせることで、高解像度の画像作成も可能になります。
筆者が最新のTopaz Photo AI 2をレビューした記事を書いていますので、参考にしてください。
まとめ
Stable Diffusionの2023年9月は、これまでSD1.5系でモデル制作をされていた方々がSDXL系でも制作されることが多くなったシーズンでした。
SDXL系モデルは基本描画性能が高くなった一方、SD1.5系での安定した出力もまだまだ魅力で選択に迷うところです。
2023年5月~8月にもここで紹介できていない、すばらしいモデルをまとめています。ぜひご覧ください。
画像アプリケーションについての情報はこちらのページにまとめています。
ぜひご覧ください。
コメント