話題の画像生成AIとは？StableDiffusionを解説！

画像生成AIとは？

そもそも画像生成AIって何でしょうか？

画像生成AIはジェネレーティブAIの一つで、コンピューターが学習した知識やルールに基づいて、人工的に画像を生成するAIのことです。

大量の画像を学習データとして使用してその中からパターンや特徴を学習し、それを基に新しい画像を生成します。

近年、技術的ブレイクスルーから爆発的に性能が向上し、写真や人間が描いたイラストと生成画像の区別がつかないレベルにまで進化を遂げました。

以下のような本ブログのアイキャッチも全て私が画像生成AIで生成したものです。

2023年現在、画像生成AIを用いた代表的なサービスを表にまとめました。

サービス名	利用方法	価格	特徴
Midjourney	Discord	30$/月	25回までは無料。アーティスティックな絵柄が得意。
nijijouney	Discord	30$/月	Midjourneyの二次元イラスト特化版。日本語利用可能。
DALLE-2	ブラウザ	115クレジットで15$	フォトリアル調が得意。画像生成AIの元祖火付け役。
Novel AI	ブラウザ	15＄/月	二次元イラストが得意。Stable Diffusionをベースに開発。
Stable Diffusion	PCローカル	完全無料	内部モデルを変更することでフォトリアル調もイラスト調も様々な絵柄を出力可能。枚数制限がなく完全に無料。PCスペックに依存するが、良い環境では生成速度が最速。現状、最も高品質。

この中で私が１番オススメするのがStable Diffusionです。

何枚画像を生成しても完全無料で使用できます。さらに現状で最も生成速度が速く、最も機能性が高く、最も高品質な画像を生成できます。

他のAIサービスと違ってPCの知識が必要だったり、導入が多少手間だったりと少し敷居の高さはありますが、今本気で画像生成AIを極めたいなら、Stable Diffusion一択です！

StableDiffusionはソースコードが無償公開され、利用・改変・再配布が自由に許可されているオープンソースソフトウェアです。

「オープンソース？なんでそんなに気前がいいの？」と思うかもしれませんね…。

その理由は、StableDiffusionを開発した会社Stability AIが「一部の大企業や個人がAIを独占することは健全ではなく、AIは世界中の人々が平等にアクセスできるようになるべき」という理念に基づいて行動しているからなんです。応援したくなるピュアでカッコいい理念ですよね！

StableDiffusionがオープンソースであることのメリットは4つあります。

完全無料で利用できること。
画像生成の枚数に上限はなく、かかるのはPCの電気代だけです。
ローカル環境で実行できること。
ある程度PCのスペックは要求しますが、通信遅延や制限速度などの制約がないため最速で快適に画像生成ができます。
大人向けな画像も生成できること。
StableDiffusionは18禁セーフフィルターを解除できるので、アングラな画像も生成できます。
関連ツールやモデルの開発速度が速いこと。
誰もがソースコードにアクセスして自由に改良できるので、有志の開発者がより高機能なツールを作ったり、ハイクオリティなモデルを配布したりしてくれています。
世界中の人間が開発者になれるので、営利目的の企業が開発する速度をはるかに上回って毎日のように新しいアップデートがされているのです。

StableDiffusionには、主に2つの機能があります。

今回はText to Imageについて具体的に説明していきましょう。

プロンプトにはポジティブプロンプトとネガティブプロンプトの2種類があり、ポジティブプロンプトは作ってほしい画像を指定するもので、ネガティブプロンプトは逆に「こういうのは作らないで」と指示するものです。

早速次のような呪文を与えてみます。

Positive Prompt	masterpiece, best quality, masterpiece, asuka langley sitting cross legged on a chair
Negative Prompt	lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts,signature, watermark, username, blurry, artist name

この呪文はハローアスカベンチマーク(Hello Asuka Benchmark)と呼ばれるベンチマーク用の呪文で、新世紀エヴァンゲリオンのヒロインである惣流・アスカ・ラングレーに似た女の子が出力されます。

作られた画像は以下の通りです。StableDiffusionのモデルを変えると、同じプロンプトでもいろんな雰囲気の絵柄で出力できることが分かりますね！