AI

中国製AIモデル「GLM-5.1」が無料公開される、一部のテストでClaude Opus 4.6を打ち負かし数時間のエージェントタスクで威力を発揮


中国に拠点を置くAI企業のZ.aiがAIモデル「GLM-5.1」を2026年4月7日に公開しました。GLM-5.1はオープンモデルとしては世界最高クラスの性能を有しており、一部のベンチマークテストではGPT-5.4やClaude Opus 4.6といったクローズドモデルを上回るスコアを記録しています。

GLM-5.1: Towards Long-Horizon Tasks
https://z.ai/blog/glm-5.1

GLM-5.1 - Overview - Z.AI DEVELOPER DOCUMENT
https://docs.z.ai/guides/llm/glm-5.1


複数のコーディング性能ベンチマークテストの平均値を並べたグラフが以下。GLM-5.1はMiniMax M2.7やKimi K2.5といったオープンモデルを上回っただけでなく、クローズドモデルのGemini 3.1 Proよりも高いスコアを記録しています。


各種ベンチマーク結果は以下の通り。GLM-5.1は複数のテストでGPT-5.4やClaude Opus 4.6といった最先端モデルを上回っています。


既存のAIモデルには「タスクに長時間取り組んでも、最初の数回の試行で結果が頭打ちになる」という弱点がありました。GLM-5.1は長時間にわたるエージェントタスクで効果を発揮するように設計されており、試行回数が増えるごとに成果物の質も向上させることができます。

以下のグラフはGLM-5.1で「高速なデータベース管理システムを設計する」というタスクを実行した際の試行回数(横軸)とデータベースの処理速度(縦軸)を示したものです。GLM-5.1は600回以上の試行を繰り返しながら段階的にシステムの性能を向上させることに成功しています。


「GPUカーネルの最適化」というタスクの実行性能を測定するKernelBenchの結果が以下。GLM-5(赤)やClaude Opus 4.5(黄色)は200回前後の試行でカーネルの性能が頭打ちとなりましたが、GLM-5.1(青)は1200回の試行において一環して性能を向上させ続けることができました。ただし、このテストではClaude Opus 4.6(緑)の方が優れた結果を残しています。


GLM-5.1に「50個のアプリを含むLinuxデスクトップ風のウェブアプリ」を作るように指示した結果が以下。GLM-5.1は最初の1時間でUIの骨組を作ることに成功。


出力開始から2時間後にタスクバーやウィンドウの実装が完了。


4時間後にはブラウザ、5時間後にはインスタントメッセンジャーの実装に成功。そして「50個のアプリを作る」というタスクを8時間で完了しました。


GLM-5.1は以下のリンク先で公開されています。ライセンスはMIT Licenseです。

zai-org/GLM-5.1 · Hugging Face
https://huggingface.co/zai-org/GLM-5.1

この記事のタイトルとURLをコピーする

・関連記事
iPhone 17 Proでパラメーター数80億のAIモデル「1-bit Bonsai 8B」をローカル実行してみたよレビュー、無料アプリのLocally AIで簡単に実行できる - GIGAZINE

パラメーター数8Bなのにメモリ消費わずか1.15GBの省メモリAIモデル「1-bit Bonsai」が登場、メモリ消費量14倍のモデルと同等以上の性能を発揮 - GIGAZINE

GoogleがオープンAIモデル「Gemma 4」を発表、ライセンスをApache 2.0に変更 - GIGAZINE

3990億パラメータのオープンウェイトAIモデル「Trinity-Large-Thinking」リリース、複雑で長期的なエージェントと複数ターンにわたるツール呼び出しが得意 - GIGAZINE

中華AI企業がGemini 3.1 Proより高性能なAIモデル「MiniMax M2.7」を発表、自己進化によって性能向上&エージェントチームにネイティブ対応 - GIGAZINE

Z.aiがクローズドソース版GLM-5「GLM-5-Turbo」リリース、AIエージェント駆動型ワークフローとOpenClawスタイルのタスク向けに最適化 - GIGAZINE

Gemini 3.0 ProやGPT-5.2に匹敵する中国製AI「GLM-5」が登場、Word文書作成などの事務作業も可能でモデルを自由にダウンロード可能 - GIGAZINE

業界最高水準の文字認識AI「GLM-OCR」をZ.aiがオープンソースで公開、ローカル環境でも動作できるほど軽量 - GIGAZINE

in AI, Posted by log1o_hf

You can read the machine translated English article The Chinese-made AI model 'GLM-5.1' has ….