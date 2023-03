2023年03月10日 13時51分 ソフトウェア

「初代iPhoneと同等の衝撃」と評されるOpenAIの次世代言語モデル「GPT-4」が2023年3月発表予定、画像認識機能や多言語対応の強化が実現か



2023年3月9日にドイツで開始された「AI in Focus – Digital Kickoff」と題したイベント内で、Microsoftドイツ法人のアンドレアス・ブラウンCTOが、AI開発団体のOpenAIが開発した次世代大規模言語モデル「GPT-4」が来週にも発表されることを明らかにしました。ブラウン氏はGPT-4を「ゲームチェンジャー」と評しています。



ブラウン氏は2023年3月9日に行われたイベント内で「来週GPT-4を発表します。GPT-4は文章だけでなく、画像や動画など、従来のGPT-3とは全く異なる可能性を提供するマルチモーダルな言語モデルです」と発表しました。





ブラウン氏はGPT-4について「ゲームチェンジャー」になるとしています。具体的には、自然言語に関する理解力が向上し、これまで人間にしか読めなかった文章や、理解できなかった画像などをGPT-4は理解できるとのこと。また、ドイツ語で質問を行ってイタリア語で回答を返すなど、すべての言語で機能する可能性を秘めているとされています。



これらのマルチモーダルなGPT-4の機能についてブラウン氏は「従来の言語モデルと比べて総合的なものになる」と述べています。





OpenAIと長期的なパートナーシップを提携しているMicrosoftは、2023年初旬に文章だけでなく視覚的なコンテンツの理解が可能なAI「Kosmos-1」を発表しています。このことから、両社がマルチモーダルなAIを準備している可能性が示唆されていました。



Microsoftドイツ法人のマリアンヌ・ジャニックCEOは、AIによる価値創造の可能性を強調し「現在のAI開発環境におけるGPT-4の発表は、まるで初代iPhoneが発表されたときのようなターニングポイントです」と述べています。



また、高性能なAIの誕生による雇用の喪失を懸念する意見に対して、ジャニック氏は「AIの導入による混乱は必ずしも失業を意味するわけではなく、企業はAIを効果的に使用するために従業員のトレーニングに焦点を当てるべきです」と指摘しています。



さらにジャニック氏は、GPT-4の学習には顧客のデータが使用されておらず、ユーザーのプライバシーが強固に保護されていることを強調しています。





シニアAIスペシャリストのクレメンス・シーブラー氏や技術顧問のホルガー・ケン氏は、現在取り組んでいる実用的なGPT-4の使い方について紹介しています。シーブラー氏によると、GPT-4には「音声通話を録音して、自動的に会話内容を文章化できる文字起こし機能」が搭載されているとのこと。また、GPT-4を使用するユーザーに合わせた学習を行うことで、「従業員しかアクセスできない会社に関する質問への回答」や「AIによる文章処理」が可能とされています。



また、ケン氏は画像や音楽、動画のテキストを翻訳することが可能なマルチモーダルAIについて解説し、従来のGPT-3.5に加えて、モデル内のテキストの内部表現に使用される「埋め込み」について語っています。ケン氏は「これらの機能はすでにMicrosoft製品に組み込まれており、クラウドを介することで何百万ものクエリをAPIにマッピングできます」と述べています。





GPT-4における運用の信頼氏や事実の正確性についてシーブラー氏は「AIが必ずしも正しいとは限らないので、今後検証を行う必要があります。Microsoftは現在、信頼性に関する指標を作成しているところです」と述べています。