2022年08月31日 09時00分 ソフトウェア

Intel製CPUでも画像生成AI「Stable Diffusion」を動かせる「stable_diffusion.openvino」が登場、誰でもダウンロード可能に



入力したテキストに合わせて自動でまるでホンモノの写真のようなクオリティの高い画像を生成することができる人工知能(AI)が「Stable Diffusion」です。そんなStable DiffusionはCreative ML OpenRAIL-Mライセンスの下でリリースされており商用利用も可能ですが、ローカル環境で利用するにはNVIDIA製GPUを搭載した端末が必要となっています。そんなStable Diffusionを、多くのWindows搭載PCが採用しているIntel製CPUで実行できるようにした「stable_diffusion.openvino」が登場しました。



GitHub - bes-dev/stable_diffusion.openvino

https://github.com/bes-dev/stable_diffusion.openvino





「Stable Diffusion」は、入力したテキストに沿った画像を生成できるAIです。 「ビーチで風船を持つ女の子」「エッフェル塔を眺めながら高級料理を食べるピカチュウ」「秋葉原で犬と戦うスパイダーマン」など、人間でも描くのが難しい画像であっても、想像以上のクオリティで生成してしまいます。



キーワードに沿ってまるで人間が描いたような絵や写真を生み出すAI「Stable Diffusion」が一般公開されたので使ってみた - GIGAZINE





Stable Diffusionはウェブ上で使えるデモ版の他、ローカル環境で実行することも可能。さらに、Stable Diffusionを低スペックPCでも無料かつ待ち時間なしで使うことができます。低スペックPCでもStable Diffusionを利用できるようにする方法は、以下の記事にまとめられています。



画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ - GIGAZINE





「stable_diffusion.openvino」はOpenVINOに対応したIntel製CPUを搭載したマシンで動作可能。OSはWindows・macOS・Linuxに対応しており、対応CPUとバージョン3.8以降のPython実行環境さえ用意すれば画像生成を実行できます。



以下の画像は「Street-art painting of Emilia Clarke in style of Banksy, photorealism(バンクシー風にエミリア・クラークのストリートアートをスーパーリアリズムで)」というテキストから、Stable Diffusionが生成した画像。





なお、エンジニアのkaraage0703さんがWindowsにWSL2をインストールし、Windows上でネイティブLinuxが動作する環境を構築し、pyenvおよびpyenv-virtualenvを使ってPython環境を構築し、「stable_diffusion.openvino」を利用する手順を公開しています。



Stable DiffusionをローカルのGPU無しのWindows PC(Intel CPU)で動かす方法

https://zenn.dev/karaage0703/articles/4901bf68536907



karaage0703さんによると、IntelのCore i7を搭載したゲーミングPCで「stable_diffusion.openvino」を利用した場合、2分弱ほどで1枚の画像を生成することができた模様。なお、以下の画像は「karaage(唐揚げ)」というテキストを入力して生成された画像です。





実行したコマンドは以下の通りです。



$ python stable_diffusion.py --prompt "karaage" ftfy or spacy is not installed using BERT BasicTokenizer instead of ftfy. 32it [01:41, 3.18s/it]