【初心者向け】Stable Diffusionの使い方【Google Colaboratory版】

【初心者向け】Stable Diffusionの使い方【Google Colaboratory版】

うぇぶとまと / 雑食系エンジニア

どうも、とまとです。最近はAI市場が熱いということで、画像生成AI「Stable Diffusion」を使ってみたので、やり方を備忘録として残しておきたいと思います。

この記事では、画像生成AI「Stable Diffusion」の使い方について解説しています。今回はGoogle Colaboratoryを使用しますのでグラボ未搭載の低スペPCでもOKです。誰でも簡単にAIイラストが作れます。

先に説明しておくと、「Stable Diffusion」とはテキストをもとに画像を生成する「訓練済のAIモデル(Diffusion Model)」を搭載した画像生成AIのこと。例えば、作成したい画像のイメージを「髪の長い女性、海岸、ワンピース」といった感じで英単語区切りで入力することで画像を作成を自動で生成してくれます。

Stable Diffusionの導入手順

Stable Diffusionの導入手順は下記の通り。

  1. Automatic1111の導入
  2. コマンドを叩いてセットアップ
  3. 学習モデルを設定する

①:Automatic1111の導入

Automatic1111の導入(Automatic1111ダウンロードページ)

まず最初に「Automatic1111」を用意します。ダウンロードページにアクセスしてOPEN IN COLABをクリックします。

Automatic1111の導入(ドライブにコピーする)

ドライブにコピーをクリックします、これでStable DiffusionをGoogle Colaboratory(以下:グーグルコラボ)環境下で利用することができます。

うぇぶとまと / 雑食系エンジニア

グーグルコラボを利用することで画像生成に必要なGPU性能をGoogleに委託することができる。要するに低スペックPCでもStable Diffusionを使ってイラストを作れるってこと。

②:コマンドを叩いてセットアップ

Google ColaboratoryでStable Diffusion Web UIのセットアップ手順

Automatic1111をドライブにコピーしたらセットアップしていきます。といっても、面倒な設定は全てコード化されているのでボタンをポチポチするだけ。上から順にRUNボタン「」を押して全てのPythonコードを走らせよう。

注意事項とポイント

  • RUNボタンは全部で5つ、一つずつ完了するのを待ってから次のボタンを押すようにしてください。
  • 4つ目のボタン(3 – Launch WebUI)は完了するまで7~10分かかるのでブラウザを閉じず気長に待ってください、途中で余計な操作をするとバグる可能性があります。
  • Googleドライブのアクセス権を求められた時はそのまま許可してください。

セットアップの確認

Google ColaboratoryでStable Diffusion Web UIのセットアップ手順

最後のRUNボタン(Run script)は完了することはありません、上記のようなリンクが二つ表示されたらとりあえずはセットアップ完了です。下の長い方のURLをクリックしてページを開いておいてください。

③:学習モデルを設定する

civitaiのトップページ

次に学習モデルを設定します、まずCivitaiにアクセスします。Civitaiは、Stable Diffusion用モデルファイルの共有サイトになります。Stable Diffusionを使うならここはマストです。

「chilloutmix」ダウンロードページ | Civitai

作りたい画像に近いモデルファイルをダウンロードします。例えば、アジア系のグラビア女優を作りたいならchilloutmixというモデルファイルが人気です。Twitter界隈で拡散されている過激なお姉さんの画像のほとんどはこのモデルファイルがベースとなっています、今回はこれを使ってみます。

Stable Diffusion automatic1111 モデルファイルをアップロードする

モデルファイルをダウンロードしたら、Googleドライブにアップロードします。アップロード先はマイドライブ > AI > automatic1111 > models > Stable-diffusion、上のような感じでファイルをアップ出来ればOKです。これで、Stable Diffusionを使う準備は整いました。使い方は次項目で解説します。

うぇぶとまと / 雑食系エンジニア

ちなみに、今回セットアップしたのはStable Diffusion web UIというもので、ブラウザ操作でStable Diffusionを使う事ができるツールになります。

Stable Diffusionの使い方

Stable Diffusion web UI 操作画面

Stable Diffusionを使う準備ができたという事で実際に使って画像を生成してみたいと思います。セットアップの確認で開いておいたページを使います、正常に動作していれば上記のような操作画面が表示されていると思います。

画像を生成する手順は下記の通りです。

  1. モデルファイルの適用(確認)
  2. プロンプトを入力する
  3. パラメータを設定する
  4. 画像生成ボタンを押す

それぞれ具体的に解説していきます。

①:モデルファイルの適用(確認)

Stable Diffusion web UI モデルファイルを適用する

今回はchilloutmixを使用するので赤枠の部分はchilloutmixにしておきます。選択肢にない場合は右にある更新ボタンを押すと表示されます、それでも表示されない場合はページを閉じてRUNボタン「」を押して再起動しましょう。それでも表示されない場合はモデルファイルのアップロード先が間違っている可能性があるので見直してください。

②:プロンプトを入力する

どんな画像を描いてほしいか英語で入力します、これを(ポジティブ)プロンプトと言います。逆に描いてほしくないものをネガティブプロンプトと言います。両方とも入力することで生成する画像の精度が上がります。

うぇぶとまと / 雑食系エンジニア

プロンプトに関しては試行錯誤するしかない、生成した画像の良し悪しに応じて減らしたり増やしたりして調整してみよう。豆知識として、この界隈ではプロンプトのことを「呪文」と呼びます。

③:パラメータを設定する

画像を生成する時のパラメータを設定します、パラメータを設定することで作りたい画像のイメージにより近づけることができます。設定できるパラメータは下記のとおりです。

Sampling method サンプリング方法
Sampling steps 生成処理回数(20がオススメ)
Restore faces 顔の補正(美人になるかも!?)
Tiling 生成した画像を並べる
Hires. fix 画像の解像度を上げる(高精細化)
Width, Height 画像の横幅、高さ
Batch count 画像生成のバッチ回数
Batch size 画像の枚数(1バッチあたり)
CFG Scale プロンプトの指示にどれぐらい従うかを示す値
Seed シード値(-1はランダム生成)
うぇぶとまと / 雑食系エンジニア

パラメータもよく分かんないんだよね、大体の人はめっちゃ良い画像を生成した時の設定を誰かに教えてもらって再利用しているパターンが多いです。ここは先駆者の設定を参考にした方がいいです。

④:画像生成ボタンを押す

プロンプト、パラメータを設定したら右上にあるGenerateボタンを押すと下のOutputに生成した画像が表示されます。

Stable Diffusionの使い方は以上になります。

終わりに:AIで作ったイラスト達

最後に、Stable Diffusionを使って生成した画像を紹介してこの記事を締めたいと思います。

出でよ!娘たち!

Stable Diffusionを使って生成したAIグラビア画像【Google Colaboratory使用】

もう一人!

Stable Diffusionを使って生成したAIグラビア画像【Google Colaboratory使用】

うぇぶとまと / 雑食系エンジニア

画像生成のクオリティ高杉。そこら辺の人にどっちがAIが作った画像かクイズだしたら間違えるんじゃね、どっちもAIでした~つって。そりゃお爺ちゃんも仰天よ。

こんな感じでStable Diffusionを使えばどんなイラストも簡単に作れるわけです。Google Colaboratoryなら環境構築も簡単なので興味がある方は試してみてね。

あ、言い忘れてた。

Google Colaboratoryの注意点

Google Colaboratoryは無料で使える代わりにGPU消費上限みたいなのがあって、使ってるうちにGPU制限がかかって動かなくなるからその時は月額課金してお金払わないとダメ。すぐ上限に引っかかるので無料枠でStable Diffusionを使うのは現実的じゃないんだよね。
うぇぶとまと / 雑食系エンジニア

なので、Stable Diffusionを使ってガッツリ画像生成AIをしたいならハイスペックPCを用意してローカルで動かすのがベスト。ガチでやってる人は皆そうしてます、はい。

画像生成に役立つサイト一覧

コメント (0)
うぇぶとまと|雑食系エンジニア
うぇぶとまと|雑食系エンジニア

飲食→派遣→IT系ベンチャーに転職。
本業をベーシックインカムとし、やりたい事に挑戦する雑食系エンジニア。