Stable Diffusion

AI

本ページはプロモーションが含まれています




M
どうも管理人のMです。
こちらのサイトでは暗号資産・Web3・メタバース・生成AIに関連することを紹介しています。
今回はStable Diffusionついてご説明します。
Stable Diffusionの始まりから現在の状況まで簡潔に説明しておりますので、サクッと内容を理解したい方にオススメです。
もくじ

  • 1 Stable Diffusionとは
  • 1 Stable Diffusionの歴史
  • 1 Stable Diffusionの現状
  • 1 Stable Diffusionの今後
  • 2 Stable Diffusionの特徴
  • 3 Stable Diffusionのメリット
  • 4 Stable Diffusionのデメリット

Stable Diffusionとは?

イギリスのスタートアップ企業Stability AIが開発した画像生成AIです。

ユーザーが入力したテキストや画像を元にAIがオリジナル画像を作成するAI画像サービスとなります。

Stable Diffusionは深層学習モデルと潜在拡散モデル「Latent Diffusion Model(レイテントディフージョンモデル)」の技術を活用しており、text-to-imageモデルとして生成AIブームを作った画像生成AIの代表格になります。

Stable Diffusionは無料版と有料版があり無料で一般公開しておりますが、より快適に制限なく最新モデルを利用するには有料プランに加入やローカル環境で利用する必要があります。

Stable Diffusionの歴史

2019年にイギリス、ロンドンに「Stability AI(スタビリティーエーアイ」が設立されました。

設立当時は公的機関に有効なデータを提供するプロジェクトを行なっており、その後AIのオープンソース化を目指すプロジェクトを開始して生成AI市場に参入しました。

Stable Diffusionの現状

2022年にStability AIが無料で一般公開した「Stable Diffusion(ステーブル・ディフュージョン)」やMidjourney社のMidjourneyが世界中のユーザーが簡単に様々なクリエイティブな画像やイラストを作成できることで話題となり、SNSで様々な生成AIの画像やイラストが投稿され盛り上がり生成AI画像ブームを作りました。

↓うさぎのロボットを指示したイラスト

無料公開後アップデートを繰り返し利用ユーザー数も広げていたのですが、収益化のビジネスモデルを構築できておらずマネタイズに課題がありました。

その課題もあり2024年3月にはCEOのエマド・モスターク氏が退任しました。

6月には「Stable Diffusion 3(SD3)」モデルシリーズで有料の「Stable Diffusion 3 Large(SD3L)」モデルをリリースしたのですが、無料で利用できる「Stable Diffusion 3 Medium(SD3M)」モデルと差別化を図るため、SD3Mの性能を下げたことにより機能に課題が発見されユーザーから不評でした。

その後すぐ改修が入り新CEOにプレム・アッカラジュ氏が就任し新体制となり、9月には映画監督のジェームズ・キャメロン氏が取締役に就任しています。

10月には前回の改善点をカバーしたモデル「Stable Diffusion3.5(SD3.5)」をリリースしました。

今後無料版の性能も一定基準保ちユーザーの信頼を取り戻しながら、収益化のビジネスモデルを構築できるかが課題となります。

2022年

2022年8月にStability AIは、ドイツのミュンヘン大学のCompVisグループとアメリカのRunway ML社と共同開発して画像生成AIのStable Diffusionを無料で一般公開しました。

その後バージョンを1.1、1.2、1.3、1.4とアップデートしています。

10月にSD1.4をアップデートした「Stable Diffusion 1.5(SD1.5)」をリリースしました。

11月にSD1.5をアップデートした「Stable Diffusion 2.0(SD2)」をリリースしました。

12月にSD2.0をアップデートした「Stable Diffusion 2.1(SD2.1)」をリリースしました。

2023年

2023年1月に東京都に日本支社のStability AI Japan株式会社を設立しました。

7月に研究用に開発したSDXL0.9をアップデートした「Stable Diffusion XL1.0(SDXL)」をリリースしました。

11月にSDXLをアップデートした「Stable Diffusion XL  Turbo(SDXL Turbo)」をリリースしました。

2024年

2024年2月にSDXL Turboをアップデートした「Stable Diffusion 3.0(SD3)」をリリースしました。

6月にSD3シリーズの「Stable Diffusion 3 Medium(SD3M)」をリリースしました。

10月にSD3Mをアップデートした「Stable Diffusion 3.5(SD3.5)」をリリースしました。

Stable Diffusionの今後

経営陣が新体制となり今後最新モデルの運用とビジネスモデルの構築が重要になりますが、他社からも様々な画像生成AIが誕生しておりますので、競合他社との画像生成AIの覇権争いも激しくなります。

Midjourneyが「Midjourney(ミッドジャーニー)」、OpenAIが「DALL-E3(ダリスリー)」、Googleが「ImageFX(イメージエフエックス)」、Adobeが「Adobe Firefly(アドビファイアフライ)」、Black Forest Labsが「Flux.1(フラックス)」など多数の画像生成AIがあります。

現在Midjourneyがシェア1位ですが、Flux.1がシェアを伸ばしております。

Flux.1はStable Diffusionの開発に携わったメンバーが立ち上げており、Stable Diffusionが不評を受けたSD3Mモデルの課題をカバーし、その直後にリリースしたこともあり、ライバル関係として比較されています。

Flux.1はXの生成AI「Grok-2(グロックツー)」にも搭載されたことでより認知度が広がっています。

Stable Diffusionも既に多数の企業から採用されていますが、国内でもStable DiffusionとパートナーシップやStable Diffusionを採用しているサービスも誕生していますので、今後最新モデルの機能面が向上してユーザーの信頼を取り戻すことで、採用する企業やユーザー数が増加すると思います。

Stable Diffusionの特徴

利用方法

Webサービスで利用する

初心者向けでアカウントを登録するだけでWeb上で気軽に利用できます。

無料で利用する場合1日の利用制限がありますので、上限を超えて利用したい場合は有料プランに変更や課金が必要になります。

クラウドサービスで利用する

中級者向けでクラウドサービスを利用することで、サービス上で利用制限がなく利用できます。

利用するためにはサービスに登録する必要がありますので有料になりますが、PCスペックは特に気にせず利用できます。

ローカル環境で利用する

上級者向けでローカル環境にインストールすることで、利用制限がなく自由にカスタマイズして利用できます。

利用するためには自身のPCに利用ツールのインストールや一定基準のPCスペックが必要になるなど初期設定の準備が必要になりますが、無料で利用制限がなく利用できます。

Webサービス

Stable Diffusion Online

公式サイト:https://stablediffusionweb.com/ja

無料プラン

料金:無料

画像生成上限数:1日10回

同時生成数:2回

プロ

料金:7ドル/約1,100円※年契約 10ドル/約1,500円※月契約

画像生成上限数:月2,000回

同時生成数:4回

マックス

料金:14ドル/約2,200円※年契約 20ドル/約3,100円※月契約

画像生成上限数:月4,000回

同時生成数:4回

Dream Studio

公式サイト:https://beta.dreamstudio.ai/generate

クラウドサービス

Google Colaboratory

①Google Colabにログイン

②Colab Proにアップグレード

③Stable Diffusion web UI(AUTOMATIC1111)をインストール

ローカル環境

Stable Diffusion Web UI(AUTOMATIC1111)

①Pythonをインストール

②gitをインストール

③Stable Diffusion web UI(AUTOMATIC1111)をインストール

Stable Diffusionのメリット

状況に合わせて利用方法を選び無料でも利用できます

ユーザーの状況に合わせて利用方法を選択できますので、初心者でも無料で気軽に始めることができます。

カスタマイズ性が高く自由に機能を追加して利用できます

クラウドサービス、ローカル環境であれば、モデルデータを作成や拡張機能を追加などカスタマイズ性が高く自由に機能を追加して利用できます。

生成した画像は商用利用ができます

Stable Diffusionで生成した画像は企業が利用を了承していますので、基本的には商用利用ができます。

ただし一部モデルによっては商用利用できないものがありますので、利用する際は注意が必要です。

Stable Diffusionのデメリット

同じワードを入力・指示しても生成画像は異なります

同じワードを入力・指示をした場合、必ず同じ画像が生成されるとは限りません。

気に入った画像が生成された場合は、画像を保存しておくと良いです。

理想の画像を作成するためにはワードの入力・指示スキルが必要になります

理想の画像を作成するためには、一定のワードの入力・指示スキルが必要になります。

理想の画像を作成するためには、どのようなワードを入力すると理想の画像に近づくか操作に慣れる必要があります。

ローカル環境で使うためには、初期設定のハードルが高いです

無料で利用制限がなく利用するためには、ローカル環境のセットが必要になりますが、ローカル環境で使うためには、初期設定のハードルが高いです。

M
Stable Diffusionは画像生成AIの代表格の1つです。2022年に無料で一般公開して注目を集めていましたが、アップデートの不評で低迷していました。現状は新体制となり直近のアップデートで課題を改善しつつありますが、画像生成AIのシェアは競合他社を追う立場になりますので、今後の戦略やアップデートが重要になります。また日本法人も誕生していますので、日本人向けの仕様や使いやすさも向上することで、国内企業との連携も増加すると思います。