ソフトウェア

NVIDIAが音声認識追加や画像検索改善を行ったAIチャットボット「ChatRTX」を公開


NVIDIAが、AIチャットボット「ChatRTX」でサポートするLLMを追加して画像検索機能の改善や音声認識機能の追加を行ったことを発表しました。

Build a Custom LLM with ChatRTX | NVIDIA
https://www.nvidia.com/en-us/ai-on-rtx/chatrtx/


ChatRTX Adds New AI Models and Features | NVIDIA Blog
https://blogs.nvidia.com/blog/ai-decoded-chatrtx-update/

Nvidia’s AI chatbot now supports Google’s Gemma model, voice queries, and more - The Verge
https://www.theverge.com/2024/5/1/24146130/nvidia-chatrtx-google-gemma-ai-model-features-updates

NVIDIA's On-Device AI Chatbot Now Supports Google Gemma and ChatGLM3
https://www.howtogeek.com/nvidias-chatrtx-adds-google-gemma-chatglm3/

「ChatRTX」は、NVIDIAが2024年2月にRTXシリーズのGPUを生かしてWindows PCのローカルで動作するAIチャットボットとして発表した「Chat with RTX」をアップデートしたもの。

無料のチャットボットAI「Chat With RTX」をNVIDIAがリリース、GeForce RTX GPU搭載PCでローカル動作が可能 - GIGAZINE


当初からLLMとして「Mistral」「Llama2」をサポートしていましたが、新たに「Gemma」「ChatGLM3」「CLIP」が加わりました。

CLIPはOpenAIが開発した画像認識AIで、ChatRTXの画像検索能力を高め、ラベリングなしでもローカルの写真データを検索できるようになっています。どのように動作するか、デモ映像で確認することができます。

ChatRTX Update: New Models & Features | Voice & Image Data Support - YouTube


LLMで「CLIP」を選択。


そして、写真の入ったフォルダーを選択しました。


プロンプトに「Hiking in the mountain(山歩き)」と入力。


すると、先ほど選択したフォルダーの中から、山歩きの写真に該当すると考えられる3枚の写真を提示してくれます。


そのほかの候補もチェック可能。このように、撮影した写真に「山」「ハイキング」などのラベルを付けなくても、CLIPがプロンプトに該当すると考えられる画像を探してくれます。


また、高性能文字起こしAI「Whisper」を統合したことで、音声認識が可能になり、プロンプトの複数の言語で音声入力できるようになりました。

ChatRTXはNVIDIA公式サイトから無料で入手・利用が可能。なお、ファイルサイズは30GBあり、利用時には少なくとも8GBのVRAMを搭載したRTX30シリーズまたは40シリーズのGPUが必要です。

この記事のタイトルとURLをコピーする

・関連記事
NVIDIAのジェンスン・フアンCEOが「H200」搭載AIシステムをOpenAIのサム・アルトマンCEOに直接手渡す - GIGAZINE

NVIDIAと日本の産業技術総合研究所が提携して構築を進める量子スーパーコンピューター「ABCI-Q」とは? - GIGAZINE

日本とアメリカによる共同AI研究パートナーシップ発表、NVIDIA・Arm・Amazon・Microsoftなどが170億円相当の資金を提供 - GIGAZINE

「NVIDIA H100 GPU」を2万4576基搭載して「Llama 3」などのトレーニングに活用されているGPUクラスターの情報をMetaが公開 - GIGAZINE

NVIDIAがGPUリソース管理ツールの開発企業「Run:ai」を買収 - GIGAZINE

in ソフトウェア,   動画, Posted by logc_nt

You can read the machine translated English article here.