「Grok-3」がリリースされる、GPT-4oやGemini 2.0 Proと比べて圧倒的に高性能とxAIはアピール

イーロン・マスク氏のAI企業「xAI」が2025年2月18日にGrok-3を発表しました。xAIは、Grok-3が前モデルの10倍以上の計算能力を備えており、GPT-4oやGemini 2.0 Proと比べて圧倒的に高性能だとアピールしています。
— xAI (@xai) February 18, 2025
grok 3 is the world’s smartest AI
— Grok (@grok) February 18, 2025
now available to all Premium+ subscribers
Grok-3には2つの推論モードがあり、リクエストを解決する際にGrokの推論を表示する「Think」と、より多くの計算能力を必要とする複雑なタスク用の「Big Brain」が用意されています。

以下は実際にGrokアプリで、Grok-3のThinkモードで質問してみたところ。答えは少し遠回りな計算をしているものの、ちゃんと証明はできていました。

Big Brainモードについてはボタンがありませんでしたが、Grok-3によればプロンプトで「big brainモードで回答して」と指定することで使えるとのこと。記事作成時点ではヘルプページなどは存在しておらず、Grok-3のアドバイスが正しいのかは不明です。

Grok-3はマルチモーダルモデルなので、テキストだけではなく、画像やPDFファイルなどを読み込ませることもできます。

また、xAIはインターネットとXをスキャンし、ユーザーの質問に対して詳細な回答を提供する「DeepSearch」もリリースしています。これは、ユーザーがGrok-3に質問を入力すると、まずその質問の意図やキーワードを解析し、質問が何を求めているかを理解し、適切な検索クエリを生成して、AIモデルがフィルタリングした上で回答を生成してくれる機能です。

DeepSearchも検索中の推論が可視化されています。ただし、実際にDeepSearchを使用して日本語で質問し、その推論を見てみたところ、全部ローマ字で考えていた模様。しかも漢字の読み方にところどころ誤りもありましたが、ひとまず目的となる情報はインターネットやX上から見つけ出せたようです。

Grok-3はGrok-3とGrok-3 miniという2つのモデルが存在するとのこと。xAIは以下のポストで、Grok-3とGrok-3 mini、Gemini-2 ProとDeepSeek V3、Claude 3.5 Sonnet、GPT-4oのベンチマーク結果を比較したグラフを提示しています。これによると、Grok-3とGrok-3 miniは、数学(AIME)、科学(GPQA)、コーディング(LCB)を含むいくつかのテストにおいて、Gemini-2 ProやDeepSeek-V3、Claude 3.5 Sonnet、GPT-4oを含む競合を上回ったとのこと。
nice to meet you pic.twitter.com/fk1EOtSVFm
— Grok (@grok) February 18, 2025
マスク氏はプレゼンテーションの冒頭で「xAIとGrokの使命は、宇宙を理解することです。何が起こっているのか、異星人はどこにいるのか、人生の意味は何か、宇宙はどのように終わるのか、宇宙はどのように始まったのか、そういった疑問に答えたいのです」と述べ、「もちろん、たとえその真実が政治的に正しいことと矛盾したとしても、Grokは最大限に真実を追究するAIになるでしょう」と付け加えました。
Grok-3は記事作成時点で、スマートフォン向けのGrokアプリから利用することが可能。ただし、Grok-3を利用するためには、有料サブスクリプションである「Xプレミアムプラス」以上に登録する必要があります。
なお、Xは、Grok-3をリリースした直後にアメリカでのXプレミアムプラスの価格が、月額は22ドル(約3340円)から40ドル(約6000円)に、年額は229ドル(約3万5000円)から395ドル(約6万円)に値上げしています。日本では記事作成時点だと、月額が税込2590円、年額が2万7300円となっており、2024年12月時点の価格が維持されています。
・関連記事
XのAI「Grok」に不快で不適切で攻撃的な「Unhinged(たがが外れた)モード」が追加される可能性 - GIGAZINE
すべてのX(旧Twitter)ユーザーが従来より3倍高速な「Grok-2」を利用可能に、「Grokボタン」がUIに追加されAPIも値下げ - GIGAZINE
無料でX/旧Twitterの全ユーザーがチャットボットAI「Grok」を利用できるように、2時間ごとに最大10件までOKで画像は1日3枚まで生成可能 - GIGAZINE
イーロン・マスクがチャットAI「Grok」提供範囲を「Xプレミアム」のユーザー全体に拡大すると発表 - GIGAZINE
XがEUのユーザーデータを使用して同意なくGrokをトレーニングしたとして告訴される - GIGAZINE
イーロン・マスクのチャットAI「Grok」は爆弾の作り方や麻薬の調合方法をジェイルブレイクしなくても教えてくるという指摘 - GIGAZINE
・関連コンテンツ