誰でも参加できるオープンソースの大規模言語処理モデル「Open Assistant」開発プロジェクトをLAION AIがスタート

画像生成AI「Stable Diffusion」の学習用データセット「LAION-5B」を開発したLAION-AIが、誰でもアクセスできるオープンソースの大規模言語処理モデル「Open Assistant」のデータ収集用フロントエンドを公開しました。
Open Assistant
https://open-assistant.io/ja
GitHub - LAION-AI/Open-Assistant: OpenAssistant is a chat-based assistant that understands tasks, can interact with third-party systems, and retrieve information dynamically to do so.
https://github.com/LAION-AI/Open-Assistant
ChatGPTのような対話型AIを学習するためには膨大なテキストで構成されるデータセットが必要です。そこでLAION-AIは、オープンソースの対話型AIを開発するプロジェクトを立ち上げる上で、「人間が生成した高品質なサンプル」としてAIへの入力テキスト(プロンプト)とそれに対する応答を有志から収集するフロントエンドを立ち上げました。
このフロントエンドはメールアドレスを登録することで使用できるほか、ローカルに開発環境を実行してアクセスすることも可能です。
なお、ローカルで開発環境を実行してアクセスする場合は、DockerをインストールしたPCでOpen Assistantのリポジトリをローカルにクローンし、リポジトリのルートディレクトリでビルドします。コマンドは以下の通り。
git clone https://github.com/LAION-AI/Open-Assistant.git
cd Open-Assitant
docker compose up --build
実際にフロントエンドにアクセスすると以下のような感じ。右上の「Sign In」をクリック。

フロントエンドにはメールアドレスかDiscordのアカウントを登録することでアクセス可能。今回はローカルにビルドした開発環境でアクセスしており、デバッグユーザーとしてもログイン可能だったので、「Continue with Debug User」をクリックしました。

Open Assistantの利用規約が表示されます。

最後まで目を通したら、「Accept」をクリック。

表示されるフロントエンドのダッシュボードはこんな感じ。「Grab a task!」の部分には、Open Assistantの学習用データを収集するためのタスクが複数表示されています。今回はランダムなタスクに挑戦する「I'm feeling lucky」をクリックしてみました。

今回与えられたタスクは、一連の会話の中でAIの返答としてどれが優れているかの序列を決めるというもの。3パターンの回答が表示されたので、優れていると思う回答を上に、微妙だと思う回答を下になるように並べ替えて、「Review」をクリックします。

次に与えられたタスクは、Open Assistantの学習データでの初期入力テキストを新規に入力するというもの。画面の右上にOpen Assistantの対応言語が表示されており、今回は「日本語」なので、日本語テキストを入力して「Review」をクリックしました。

また、初期入力テキストの内容評価を行なうタスクも。今回は自分で入力したばかりの初期入力テキストを評価することになりました。評価を入力したら「Review」をクリック。

左カラムの「Message」をクリックすると、フロントエンドでこれまで入力されたメッセージや新しく生成されたOpen Assitantの返答が表示されます。

Open Assistantは有志のモチベーションを向上させるために、参加者の実績を表示するシステムが採用されています。

ダッシュボードでは、より多くのタスクをこなした人がランキング経緯で表示されました。

LAION-AIはOpen Assistantの展望として、「私たちはChatGPTを複製することにとどまるつもりはありません。メールを書くだけでなく、有意義に業務をこなし、APIを使って情報を動的に調査し、さらに誰もがカスタマイズして拡張できるような、未来のアシスタントを作りたいと考えています。優れたアシスタントを作るだけでなく、コンシューマー向けハードウェアで動作するような小さくて効率的なものにしなくてはなりません」と語っています。
・関連記事
Googleが500億円超をOpenAIのライバル企業Anthropicに投資か、検索エンジンへの対話型AI導入を目指し - GIGAZINE
中国大手検索エンジンの百度がChatGPTのような対話型AIを2023年3月にリリースするという報道 - GIGAZINE
「ChatGPTを改善するためにOpenAIが時給300円以下でケニア人を雇った」と問題視する報道 - GIGAZINE
Microsoftが超強力なチャットAI「ChatGPT」を使った新機能を検索エンジンのBingで展開する予定だと報じられる - GIGAZINE
対話型チャットAI「ChatGPT」の精度をまざまざと実感させられる秀逸な回答例を集めた「LearnGPT」 - GIGAZINE
OpenAI開発のテキスト生成AI「GPT-3」がどんな処理を行っているのかを専門家が解説 - GIGAZINE
・関連コンテンツ
in レビュー, ソフトウェア, ネットサービス, Posted by log1i_yk
You can read the machine translated English article LAION AI starts an open source large-sca….