ソフトウェア

GPT-4のライバルと目されるGoogleの次世代マルチモーダルAI「Gemini」のリリースを延期するとスンダー・ピチャイCEOが決定か


GoogleのAI開発部門であるGoogle DeepMindが開発中といわれている次世代マルチモーダルモデル「Gemini」はOpenAIのGPT-4に匹敵する性能を持っており、2023年中にリリースされると報じられていました。しかし、IT系ニュースメディアのThe Informationによると、Googleのスンダー・ピチャイCEOによってリリースが来年に延期されたとのことです。

Google Postpones Big AI Launch as OpenAI Zooms Ahead — The Information
https://www.theinformation.com/articles/google-postpones-big-ai-launch-as-openai-zooms-ahead


Google delays its ChatGPT 4 rival 'Gemini' until next year
https://interestingengineering.com/innovation/google-delays-its-chatgpt-4-rival-gemini-until-next-year-over-language-issues

Google DeepMindが開発に取り組む「Gemini」は、Google DeepMindが誇る「AlphaGo」やその発展系「AlphaGo Zero」の技術と大規模言語モデルを組み合わせたもので、Google検索・YouTube・Googleブックス・Google ScholarなどのGoogleサービスで得られる膨大なデータでトレーニングされており、テキストや音声、画像、動画などの複数のデータを取り扱うことができる次世代マルチモーダルAIです。

ChatGPTのライバルと目されるGoogleのAI「Gemini」がリリース間近 - GIGAZINE


GoogleのチャットボットAIであるBardやGoogle Assistantの責任者を務めるシシー・チャオ氏は、Geminiについて「例えば、私がケーキを焼こうとする場合、Geminiは3層のケーキの作り方の手順の絵を3枚描いてくれるのです。インターネット上の写真ではありません。テキストだけではなく画像も使って、人間と会話することができるのです」とコメントしており、Geminiの性能の高さがうかがえます。

Gemini自体は2023年5月に開催されたGoogle I/O 2023の基調講演で、ピチャイCEOの口から存在が明らかにされました。ピチャイCEOは「GeminiはツールとAPIの統合において非常に効率的であり、メモリやプランニングなどのイノベーションを実現するように構築されています」と述べていました。

Opening | Google I/O 2023 - YouTube


2023年11月にピチャイCEOは「私たちはGeminiをできるだけ早くリリースすることに注力しており、Geminiの主要かつ最大のバージョンを完成させている段階です」とコメントしており、Googleも「私たちの開発するGeminiはいくつかの点でOpenAIのGPT-4と同等かそれを超える基準を満たしています」と述べていたとのこと。

しかし、ピチャイCEOが2023年12月上旬にカリフォルニア・ニューヨーク・ワシントンで予定されていた発表イベントを延期するように指示したとThe Informationは報じています。このイベントは政治家や政策立案者を対象としたものでしたが、ピチャイCEOは「AIが英語以外のクエリの一部を確実に処理できないことがわかった」として、リリースの延期を決定したそうです。


IT系ニュースサイトのInteresting Engineeringは「Geminiのリリースは、Googleの歴史の中でも最も重要なプロダクトのリリースの1つになるかもしれません。Geminiは従来の検索やワールドワイドウェブからチャットボットベースに移行する新しいインターネットを作り出し、さらにGoogleがOpenAIに対抗し得る、あるいは上回り得ることを意味します」と述べました。

この記事のタイトルとURLをコピーする

・関連記事
EVを1時間充電したときの航続距離や充電速度を統一基準でまとめたランキングを自動車情報サイトが公開 - GIGAZINE

GoogleのチャットAI「Bard」でYouTube動画の内容を要約させることが可能に、コンテンツ作成者に悪影響が及ぶ懸念も - GIGAZINE

Google DeepMindが音楽生成に特化したAIモデル「Lyria」を発表、口ずさむだけでメロディーが生成される - GIGAZINE

Google製チャットAI「Bard」の年齢制限が13歳以上に緩和&グラフ生成機能や途中式表示機能なども追加される - GIGAZINE

画像を見て質問に答えられるオープンソースなGPT-4レベルのAI「LLaVA-1.5」をGCP上で動作させてみた - GIGAZINE

Google DeepMindがAIツールを使って220万種類の新しい結晶構造を発見、これまで発見されてきた数の45倍以上 - GIGAZINE

in ソフトウェア,   動画, Posted by log1i_yk

You can read the machine translated English article CEO Sundar Pichai has decided to postpon….