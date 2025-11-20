2025年11月20日 11時52分 AI

「Grok 4.1 Fast」が登場、200万トークンの入力に対応し前世代モデルより幻覚が半減



イーロン・マスク氏が率いるAI企業・xAIは、Grok 4.1を2025年11月18日(火)に公開しました。さらに、新しいAIモデルである「Grok 4.1 Fast」と、開発者がAIエージェントを構築するための「Agent Tools API」を同月20日(木)に発表しました。Grok 4.1 Fastは、AIが自律的に計画を立ててタスクをこなす「エージェント」としての能力に特化しており、200万トークンという非常に長い文脈を一度に処理できるコンテキストウィンドウを持っています。



Grok 4.1 Fast and Agent Tools API | xAI

https://x.ai/news/grok-4-1-fast



Models/Grok 4.1 Fast | xAI

https://docs.x.ai/docs/models/grok-4-1-fast-reasoning





Introducing Grok 4.1 Fast and the xAI Agent Tools API.



Grok 4.1 Fast is our best tool-calling model to date. With a 2M context window, it shines in real-world use cases like customer support and deep research.https://t.co/OZhzMxOsiA pic.twitter.com/dEDgCbVfXE — xAI (@xai) November 19, 2025



Grok 4.1 Fastは、特にAIが外部の機能やアプリを操作する「ツール呼び出し」の性能と処理速度、そしてコスト効率のバランスを重視して設計されており、実際の企業での利用を想定し、顧客サポートや金融などの分野で強化学習を行ったモデルだとのこと。Grok 4.1 Fastは、開発段階でシミュレーション環境を用いた強化学習を行い、数十もの分野にわたる多種多様なツールの操作を学習しました。



実際のカスタマーサポート業務を想定したシナリオにおいて、AIがどれだけ的確に「ツール(道具)」を使いこなせるかを評価するベンチマーク・τ2-bench Telecomにおいて、Grok 4.1 Fastは極めて高いパフォーマンスを発揮しており、複雑な顧客対応であっても自律的にツールを選んで解決する能力があることを示しているとxAIはアピールしました。



We built Grok 4.1 Fast specifically for real-world enterprise use cases.



Trained on diverse simulated environments across dozens of domains, it's SOTA on real-world agentic workflows like customer support. pic.twitter.com/aySiPVVYFK — xAI (@xai) November 19, 2025



また、AIのツール使用能力を測る「Berkeley Function Calling v4」というベンチマークテストでは72％の正解率を記録し、高い精度を示したとのこと。



Grok 4.1 Fast combines frontier tool-calling performance with blazing-fast inference and cost effectiveness. pic.twitter.com/ofogQZxEeB — xAI (@xai) November 19, 2025



X(旧Twitter)上の情報を検索して答えを導き出す能力を測る「X Browse」という内部テストでは、Grok 4.1 Fastがスコア56.3を記録したのに対し、GPT-5は24.2、Claude Sonnet 4.5は14.6という結果でした。さらに、詳細なリサーチ能力を測る「Research-Eval Reka」においても、GPT-5より高いスコアを出しつつ、コストは約半分に抑えられています。



Grok 4.1 Fast excels at real-time info retrieval and deep research. Paired with native X integration, code execution, and advanced web browsing, Grok 4.1 Fast + Agent Tools API tops agentic search benchmarks. pic.twitter.com/mnsIYOJzl8 — xAI (@xai) November 19, 2025



さらに注目すべき点は、Grok 4.1 FastはGrok 4.1よりも高速化を図ったモデルでありながら、より大規模なモデルであるGrok 4と比較しても、事実性を評価する指標であるFActScoreにおいて同等のパフォーマンスを維持していることです。これは、速度やコストを重視したモデルであっても、情報の正確さが犠牲になっていないことを示しているとxAIは述べました。



Grok 4.1 Fastは「徹底的な調査(Deep Research)」を得意とするエージェントとして設計されており、Xのエコシステムへの直接的な統合や、強力なウェブブラウジング機能によってリアルタイムで情報を検索・取得することが可能です。こうした外部の最新情報にアクセスし、裏付けを取りながら回答を生成できる能力が、幻覚の大幅な削減に寄与しています。



同時に発表されたAgent Tools APIは、開発者が数行のコードを書くだけで、Grokにウェブ検索やXの投稿検索、プログラミングコードの実行、アップロードされたファイルの解析といった機能を持たせることができます。これらはすべてxAIのインフラ上で動作するため、開発者はAPIキーの管理や実行環境の構築といった複雑な手間を省くことができます。





利用料金については、入力トークンが100万トークンあたり0.20ドル(約30.0円)、出力トークンが100万トークンあたり0.5ドル(約75.0円)と設定されています。また、一度読み込んだデータを再利用してコストを下げるキャッシュ入力は、100万トークンあたり0.05ドル(約7.50円)です。ツールを利用する場合の料金は、1000回の呼び出し成功につき5ドル(約750円)から。なお、リリース記念として2025年12月3日まではOpenRouterを通じて無料で試用することができます。

