- Stable Diffusion・Stable Diffusion webuiとは?
- 実写人物のためのStable Diffusionのおすすめモデル
- アニメ・イラストスタイルのStable Diffusionのおすすめモデル
- 実写全般のためのStable Diffusionのおすすめモデル
- Stable Diffusionのモデルを探すには
- Stable Diffusionで生成した画像のライセンスについて
- Stable Diffusionにおすすめのグラフィックボード
- Stable Diffusionにおすすめのパソコン
- Stable Diffusionにダウンロードしたモデルをインストールする方法
- Stable Diffusion webuiでモデルを使用する方法
- Stable Diffusionのモデルまとめ
Stable Diffusion・Stable Diffusion webuiとは?
AIの進化は、私たちの世界に新たな変革をもたらしています。
その中でもStable Diffusionは、いまもっとも注目を集めている画像生成AIです。Stable Diffusionは画像生成のさまざまなタスクで驚くべき結果を生み出しています。
Stable Diffusion webuiとは、webブラウザでStable Diffusionが使えるシステムです。なかでもAUTOMATIC1111版と言われるシステムは特に人気があります。
Stable Diffusionは「使用するモデル」を変えることで、さまざまなものを高品質に生成することができます。
本記事ではStable Diffusionの画像生成にとても役立つ、おすすめモデル6選を徹底解説します。
実写人物のためのStable Diffusionのおすすめモデル
Chilloutmix
画像生成AIの世界では、多くのモデルが”欧米系の顔”を標準として作られています。Chilloutmixはアジア系の顔を高品質に出力できた、最初のメジャーなモデルといえます。
現在も完成度の高いモデルで、Chilloutmixはプロンプトを工夫することでかなりのバリエーションの画像を生成することができます。
後にも書きますが、Cilloutmixについては非常に高品質な反面、ライセンス上商用利用が禁止されています。個人利用にとどめておくのが安全だと思われます。
Licenses:creativeml-openrail-mdreamlike
+Creator credit required
+No selling images
+No generation services
+No selling models
+Same permission required
BRAv5
BRAv5もアジア系の顔を高品質に出力できます。BRAv5は簡単なプロンプトで高品質な人物を生成できるのが特徴です。
シンプルなプロンプトでも結果が出やすいBRAv5は、プロンプト作成に慣れていない人にもおすすめですが、Chilloutmix系よりは顔や体が崩れやすい傾向があります。
プロンプトには以下のワードを含めると出力が比較的安定します。作者推奨です。
Prompt:(Best quality, 8k, 32k, Masterpiece, UHD:1.2)
Negative Prompt:(Worst Quality:2.0)
License:creativeml-openrail-m
+No generation services
+No selling models
アニメ・イラストスタイルのStable Diffusionのおすすめモデル
Ageless V2
Ageless V2は美しい風景描写が特徴のモデルです。やわらかみを帯びた雰囲気ながらも高いコントラスト、あざやかな色調に特徴があります。
License:creativeml-openrail-m
+No generation services
+No selling models
+Same permission required
BreakDomain_m2150
※2023/6/24に公開が停止されています
BreakDomain_m2150は背景や細部の緻密な描写にこだわって生成されたモデルです。描きこみ度の高い画像を生成することができます。
現実的な風景描写も、幻想的な風景描写も両方得意です。
※こちらで紹介させていただいたBreakDomainシリーズですが、残念ながら公開が停止されています。
vae-ft-mse-840000-ema-prunedというVAEと同時使用することが推奨されています。VAEは画像のコントラストや色調を調整する役割を担っています。.ckptファイルをダウンロードして下記のVAEフォルダに入れて使用します。
\stable-diffusion-webui\models\VAE
License:creativeml-openrail-m
+No generation services
+No selling models
+Same permission required
Counterfeit-V3.0
Counterfeit-V3.0は汎用性の高い万能アニメ調モデルです。背景も人物もバランスのよい構図で配置してくれます。描写も細かくハイクォリティです。
基本的にこれ一つでも十分というモデルです。
License:creativeml-openrail-m
+No generation services
+No selling models
実写全般のためのStable Diffusionのおすすめモデル
ICBINP v7
ICBINP(I Can’t Believe It’s Not Photography)v7は様々なシチュエーションで高い品質の生成ができする写実系モデルです。また、欧米系の人物生成でも高い性能を発揮します。
またインテリアや建物、物体の生成など、全方位に高いクォリティを保つ汎用性が非常に高いモデルです。
実写系のモデルは、著作権関係に厳しいモデルが多い中、比較的使いやすいモデルです。
License:creativeml-openrail-m
Stable Diffusionのモデルを探すには
これらのモデルはCivitAIやHugging Faceという「AIモデルを公開しているサイト」で見つけることができます。
初心者の方はCivitAIの方が絵柄が並んでいるので探しやすいと思います。
Stable Diffusionで生成した画像のライセンスについて
ここで紹介した”Chilloutmix以外”のモデルは「creativeml-openrail-m」というライセンスになっています。
- creativeml-openrail-mについてははせ@AI Photoさんが和訳してくださっています。また個人利用以外の場合は個別に注意が必要です。こちらもはせ@AI Photoさんのnoteで詳しく説明されているので、参考にさせてもらうといいと思います。
- Chilloutmixについては「creativeml-openrail-mdreamlike」(末尾にdreamlikeがついている)というライセンスで商用利用ができないので、ご注意ください。こちらも詳しくは原典をご確認ください。
モデル | ライセンス |
---|---|
Chilloutmix以外 | creativeml-openrail-m |
Chilloutmix | creativeml-openrail-mdreamlike |
BRAv5の商用利用について
BRAv5の商用利用については、creativeml-openrail-mに準する範囲で利用OKのようです。Twitterで作者の@PleaseBanKaiさんがメンションにて言及されています。
Stable Diffusionにおすすめのグラフィックボード
Stable Diffusionの画像生成に適しているのは、計算速度が速くVRAM容量が高いグラフィックボードです。現在一般的に手に入る最も性能の高いグラフィックボードは「Nvidia GeForce RTX4090」です。
VRAM容量は24GBと、AI画像生成にも十分な高い性能です。
RTX4090は2023年5月現在で30万円前後と高価になってしいます。
もっと安くかつ高い性能を求める場合、「Nvidia GeForce RTX4070」であれば10万円前後で入手可能です。
RTX4070はVRAM容量12GBと低くはないスペックなので、VRAM8GBで不便を感じている方には魅力的な選択肢になると思います。
Stable Diffusionにおすすめのパソコン
G-Tune DG-I7G70は第13世代インテルCPUとRTX4070搭載の高性能ゲーミングデスクトップPCです。RTX4070を搭載していることで、Stable Diffusionの画像生成にも適したスペックとなっています。
ゲーミングPCながら、Photoshopでの利用などクリエイティブ用途にもおすすめのPCです。
Stable Diffusionにダウンロードしたモデルをインストールする方法
ダウンロードした.safetensorsファイルを「stable-diffusion-webui」フォルダにある「models」フォルダの中の「Stable-diffusion」フォルダにドラッグしてコピーします。
\stable-diffusion-webui\models\Stable-diffusion
Stable Diffusion webuiでモデルを使用する方法
.safetensorsファイルをコピーできたら一度コマンドプロンプトとブラウザのUIは再起動してください。
再度起動できたらStable Diffusionのメイン画面の左上「Stable Diffusion checkpoint」のところからインストールしたモデルを選びます。
これでモデルの切り替えができるので、あとはいつもどおりプロンプトや生成の設定をして画像を生成するだけです。
Stable Diffusionのモデルまとめ
この記事では”Chilloutmix以外”はライセンスが比較的自由なモデルで、高品質なものを選んで掲載させていただきました。
Chilloutmixはアジア系人物をリアルに生成するためには現状外せないレベルです。個人利用の範囲であれば特におすすめです。
Stable Diffusionのモデルも日々新しいものが生み出されているので、キャッチアップしていくだけでも大変だと思います。
また、好みに合ったものを生成するには、プロンプトやLora、画像拡大の技術も重要になってきます。
Topaz Photo AIはAIを用いた画像拡大・高画質化専用のアプリケーションです。
Stable Diffusionで高解像度の画像を生成しようとすると、画像拡大が必要になりますが、Topaz Photo AIを併用することで高精細な画像拡大が可能になります。
こちらも参考にしてください。
ここで紹介しきれなかったモデルや最新のおすすめモデルを2023年6月版で紹介しています。
今回紹介していないモデルばかりなので、こちらも見てみてください。
画像アプリケーションについての情報はこちらのページにまとめています。
ぜひご覧ください。
コメント