【SDXL Turbo】最強のリアルタイム画像生成AI!使い方や導入方法、機能比較まで

SDXL Turbo Stability AI リアルタイム画像生成AI

SDXL Turboは、2023年11月29日にStability AIより公開された最新のリアルタイムテキスト画像生成モデルです。

このモデルは、新しい蒸留技術によって画像生成必要なステップ数を50ステップからなんと1ステップに削減することで、超高速で画像生成が可能になり、文字を入力した瞬間に画像を生成できるようになりました。

実際に動作している様子です。

本当にプロンプトを入力した瞬間に画像が生成されていますね!

今回は、SDXL Turboの概要や使ってみた感想をお伝えします。

是非最後までご覧ください!

なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。
→無料相談で話を聞いてみる

目次

SDXL Turboの概要

SDXL Turboは、2023年11月29日にStability AIより公開された最新のリアルタイムテキスト画像生成モデルです。

このモデルの最大の特徴は、敵対的拡散蒸留(Adversarial Diffusion Distillation:ADD)と呼ばれる新しい蒸留技術を用いることで、1ステップでの画像生成を可能にし、画像の品質を維持しながらリアルタイムでテキストから画像への出力を生成することです。

SDXL Turboは、SDXL 1.0に敵対的拡散蒸留(Adversarial Diffusion Distillation)を組み込むことで、GAN(Generative Adversarial Networks)に共通するシングルステップの画像出力など多くの利点を獲得しました。

また、それらの利点に加えてADDを実装することで、他の蒸留手法でよく見られるアーチファクトやぼやけを回避することに成功しています。

ここまでSDXL Turboの特徴をお伝えしましたが、画像の品質を維持しながら1ステップで生成できるようになるなんてそんなうまい話が本当にあるのかと思った方もおられると思います。

以下の画像をご覧ください。

この画像は、SDXL TurboをStyleGAN-T++、OpenMUSE、IF-XL、SDXL、LCM-XLと同じプロンプトで出力を生成して、その結果を比較した結果です。

この実験の評価方式は、人間の評価者にンダムに 2 つの出力を表示して、プロンプトの指示に最も近い出力を選ぶという方式が取られています。

結果は、SDXL TurboはLCM-XLの4ステップ構成に1ステップで勝り、SDXLの50ステップ構成にもわずか4ステップで上回る品質の画像を生成できました。

同じく高速画像生成が可能なLCM-XLより高精度の画像をより少ないステップで生成できるようなので、技術の進歩の速さには驚かされます。

なお、SDXl TurboはA100GPUの場合、512×512の画像を207msで生成できます。

このように、魅力的な性能を持ったSDXl Turboですが、現段階では商用利用できないので、その点はご注意ください。

さて、ここからは実際にSDXl Turboを使用して、その性能を確かめていこうと思います。

まずは使い方から説明します。

SDXl Turboの使い方

SDXL Turboは、現在Stability AIの画像編集プラットフォームClipdropでSDXL Turboのリアルタイム画像生成のベータデモを使用することができます。

Clipdrop

上のリンクにアクセスすると、以下のような画面になるので、まずはアカウント作成とログインを行います。

ログインすると、以下の画面になりすぐにSDXL Turboが使用できるようになります。

それでは早速使っていきましょう!

なお、StabilityAIが開発した動画生成AIについて知りたい方はこちらの記事をご覧ください。
【Stable Video Diffusion】ローカルでの使い方や料金体系、商用利用について解説

SDXl Turboを実際に使ってみた

以下のプロンプトを入力して、リアルタイム画像生成してくれるのか見ていきます。

1girl, cute, smile

実行の様子は以下の動画をご覧ください。

最終的に生成された画像です。

プロンプト通りの画像を生成してくれていますが、黒目が大きくて少し不気味ですね笑

生成速度も非常に速く、本当にリアルタイムで画像を生成してくれます。

実際に使用できることが分かったので、ここからは同じくリアルタイム画像生成が可能なReal-Time Latent Consistency Modelとの比較を行っていきます。

SDXL Turboは本当に他のリアルタイム画像生成モデルを凌駕しているのか検証してみた

比較対象とするReal-Time Latent Consistency Modelは、以前記事にしてご紹介していますが、こちらのモデルもプロンプトを入力するとすぐに画像に反映されていました。

今回は、以前Real-Time Latent Consistency Modelで試したプロンプトをSDXL Turboでも入力して、どのような違いがあるか検証します。

まずは、以下のプロンプトを入力します。

1girl, collarbone, wavy hair, looking at viewer, blurry foreground, upper body, necklace, contemporary, plain pants, ponytail, freckles, red hair, dappled sunlight, smile, happy

生成の様子です。

SDXL Turbo

Real-Time Latent Consistency Model

結果は、SDXL Turboはベータ版ということもあり、プロンプトの文字制限があるようで途中までしか入力できませんでした。

しかし、生成スピードや品質はReal-Time Latent Consistency Modelとほぼ同等であり、どちらも超高速で高品質の画像を生成できることが分かりました。

生成の過程を見てみると、Real-Time Latent Consistency Modelは最初から一貫して女の子の画像を出力し続けているのに対して、SDXL Turboの方は、途中で犬の画像が出力されていたりするので、その点はReal-Time Latent Consistency Modelの方が優れています。

また、必要スペックについてもReal-Time Latent Consistency Modelは、家庭用のPCでも快適に動作するのに対して、SDXL TurboはA100GPUが必要とのことなので、実用性についても現段階ではReal-Time Latent Consistency Modelの方が優れていると言えます。

とはいえ、最終的に生成された画像を見てもわかるように、画像の品質は申し分ないので、今後のアップデートで実用性の面が強化されると、最強のリアルタイム画像生成モデルになると思います!

なお、Real-Time Latent Consistency Modelについて詳しく知りたい方は、下記の記事を合わせてご確認ください。
【Real-Time Latent Consistency Model】リアルタイムで入力したプロンプトがすぐに画像になる高速画像生成AIを使ってみた

まとめ

SDXL Turboは、2023年11月29日にStability AIより公開された最新のリアルタイムテキスト画像生成モデルです。

このモデルの最大の特徴は、敵対的拡散蒸留(Adversarial Diffusion Distillation:ADD)と呼ばれる新しい蒸留技術を用いることで、1ステップでの画像生成を可能にし、画像の品質を維持しながらリアルタイムでテキストから画像への出力を生成することです。

使ってみた感想は、同じリアルタイム画像生成モデルのReal-Time Latent Consistency Modelと比較して、性能面はほぼ同等ですが、実用性の面で劣っているところがあり、今後のアップデートで改善されることを期待しましょう。

このモデルを使用することで、思いついたアイデアをすぐに画像にできるようになるので、気になった方は是非試してみてください。

サービス紹介資料

【無料】2023年2月版生成系AIの業務活用なら!

・生成系AIを活用したPoC開発

・生成系AIの業務活用コンサルティング

・システム間API連携

サービス紹介資料

生成系AIの業務活用なら!

・生成系AIを活用したPoC開発

・生成系AIのコンサルティング

・システム間API連携

最後に

いかがだったでしょうか?

弊社では

・マーケティングやエンジニアリングなどの専門知識を学習させたAI社員の開発
・要件定義・業務フロー作成を80%自動化できる自律型AIエージェントの開発
・生成AIとRPAを組み合わせた業務自動化ツールの開発
・社内人事業務を99%自動化できるAIツールの開発
ハルシネーション対策AIツールの開発
自社専用のAIチャットボットの開発

などの開発実績がございます。

まずは、「無料相談」にてご相談を承っておりますので、ご興味がある方はぜひご連絡ください。

➡︎生成AIを使った業務効率化、生成AIツールの開発について相談をしてみる。

生成AIを社内で活用していきたい方へ

「生成AIを社内で活用したい」「生成AIの事業をやっていきたい」という方に向けて、生成AI社内セミナー・勉強会をさせていただいております。

セミナー内容や料金については、ご相談ください。

また、弊社紹介資料もご用意しておりますので、併せてご確認ください。

投稿者

  • ゆうや

    ロボット工学専攻。 大学時代は、対話ロボットのための画像キャプションの自動生成について研究。 趣味は、サウナとドライブ。

  • URLをコピーしました!
  • URLをコピーしました!
目次