画像生成AI「Stable Diffusion」バージョン1.5のリリースが遅れている理由とは?



近年、文章を入力するだけで好みの画像を出力できる画像生成AIが大きな注目を集めています。数ある画像生成AIの中でもAIスタートアップのStability AIが開発した「Stable Diffusion」は、2022年8月のオープンソース化されたことを切っ掛けに複数のGUIアプリが開発されるなど非常に活発なコミュニティが生まれています。そんなStable Diffusionのバージョン1.5のリリースが遅れている理由について、Stability AIの最高情報責任者を務めるダニエル・ジェフリーズ氏が説明しています。



記事作成時点で公開されているStable Diffusionのバージョンは1.4で、機能強化を盛り込んだバージョン1.5のリリースが待たれています。しかし、バージョン1.4の公開から数カ月が経過してもバージョン1.5の情報が公開されないことから、コミュニティの中からは「Stable Diffusionがオープンソースではなくなってしまうのではないか」といった疑念の声も挙がっています。Stable Diffusionがソース非公開になるというウワサについて、ジェフリーズ氏は「それは真実ではありません。私たちはオープンソースをStable Diffusionの中心的な要素として取り組んでいます」と述べ、今後もStable Diffusionがオープンソースであり続けることを強調しています。





ジェフリーズ氏によると、Stable Diffusionは「医学研究目的の脳スキャン」「インテリアデザイン」「ハリウッド風のフィルムエフェクト」「ゲーム向けのシームレスなテクスチャ」「新しい種類の高速アニメーション」「PhotoshopやFigmaのプラグイン」など多様な分野に活用されているとのこと。ジェフリーズ氏はソース非公開で開発される他社製画像生成AIの活用範囲が限られている点を指摘しつつ「Linuxのような(オープンソースで開発されている)ソフトウェアが社会全体に価値を提供する最良の方法であり、革新の源であることは、歴史が証明しています」と述べ、Stable Diffusionがオープンソースであり続けることで広い分野で画像生成AIを用いたシステムを開発できることをアピールしています。



上記のようにStable Diffusionは多様な分野で利用されていますが、同時に露骨な性表現を含む作品が多く生み出されている問題や、Stable Diffusionの学習元となったデータセットの権利問題なども指摘されています。ジェフリーズ氏によると、Stability AIではオープンソース委員会を組織して、性的な表現に関するポリシーやモデルデータに関するガイドラインの確立に取り組んでいるとのこと。ジェフリーズ氏は「コミュニティからの指摘に対応しなければ、オープンソースのAIプロジェクトそのものがなくなりかねません」と述べ、画像生成AIにまつわる諸問題に対応するガイドラインを制定するためにバージョン1.5のリリースが遅れていると説明しています。



Stability AIはオープンソース委員会を設立してガイドラインの制定を進めているだけでなく、ディープフェイクに対応するための20万ドル(約3000万円)規模の報奨金プログラムも開設したとのこと。ジェフリーズ氏は「AIを名前だけでなく、真にオープンなものにするために協力してください」と述べ、コミュニティに協力を呼びかけています。