ソフトウェア

DeepSeek R1のパフォーマンスと価格に匹敵する新しいAIモデル「Hunyuan T1」をTencentが公開


中国の大手IT企業・Tencentが2025年3月22日に、大規模言語モデルの「Hunyuan T1」を公開しました。Hunyuan T1についてTencentは「AI推論におけるブレークスルー」と主張しています。

腾讯混元
https://llm.hunyuan.tencent.com/#/blog/hy-t1


Tencent’s Hunyuan T1 AI reasoning model rivals DeepSeek in performance and price | South China Morning Post
https://www.scmp.com/tech/big-tech/article/3303456/tencents-hunyuan-t1-ai-reasoning-model-rivals-deepseek-performance-and-price

2025年3月22日、Tencentは新たな大規模言語モデル「Hunyuan-T1」を発表しました。このモデルは、Tencentが3月初旬に公開した高速処理に特化していて1秒以内に回答を生成できる「Hunyuan TurboS」がベースとなっているとのこと。


2月中旬に公開されたプレビュー版の「Hunyuan T1-Preview」は中規模Hunyuanがベースだったため、TurboSをベースとした「Hunyuan-T1」は全体的なパフォーマンスが大幅に向上しています。特に、「Hunyuan TurboS」に搭載されていた長文処理能力により、Hunyuan-T1は長大なテキスト情報を入力した場合でも、文脈を正確に把握し、効率的に処理することが可能とのこと。正式版のHunyuan-T1は計算リソースの消費を大幅に削減できており、同じ条件下でのデコード速度はプレビュー版の2倍だそうです。

Hunyuan T1のトレーニングの際には、数学や論理推論、科学、コードなど世界中のあらゆる問題を収集しているほか、データの難易度を徐々に上げながら、モデルのコンテキストの長さを段階的に拡大していく「カリキュラム学習アプローチ」を用いて推論能力を向上させました。

この結果、MMLU-pro、CEval、AIME、Zebra Logic、その他の中国語と英語の知識、競技レベルの数学および論理的推論指標など、さまざまな公開ベンチマークでHunyuan T1はDeepSeek R1と同等またはわずかに優れた結果を残しただけでなく、人間による評価のデータセットでもDeepSeek R1と同等のパフォーマンスを発揮したことが報告されています。

以下が各ベンチマークでのHunyuan T1・DeepSeek R1・GPT-4.5・OpenAI o1を比較した結果。知識のベンチマークであるMMLU PROや推論のベンチマークのDROP F1ではHunyuan T1が最も高い成績を残しているほか、中国語の知識を問うCEvalやCMMLUではDeepSeek R1と同等のパフォーマンスを発揮しています。


また、Hunyuan T1はコストパフォーマンスの点でも優れており、T1のインプットレートは100万トークン当たり1元(約20円)、アウトプットは100万トークン当たり4元(約82円)です。なお、DeepSeek R1も同様のインプットレートを導入しているほか、アウトプットレートは日中で100万トークン当たり16元(約330円)、夜間は100万トークン当たり4元です。

なお、TencentはHunyuan T1のデモを公開しています。デモを利用するには以下のリンクにアクセス。

腾讯混元
https://llm.hunyuan.tencent.com/#/chat/hy-t1


まずは入力欄にプロンプトを入力し、「发送」をクリック。今回は「Write a short paragraph where the 1st letter of each sentence spells out the word 'CODE'. The message should appear natural and not obviously hide this pattern.(各文章の最初の文字が『CODE』になる短い文章を書いてください。メッセージは自然に見えるようにして、このパターンを隠さないでください)」と依頼しました。


わずか数秒で回答が生成されました。正しく「C」「O」「D」「E」を含む文章が生成されたほか、回答の際には推論の過程も中国語で表示されます。


一方で「what happened during the tiananmen square massacre(天安門事件で起こったこととは?)」と尋ねると、Hunyuan T1は「很抱歉,我还未学习到如何回答这个问题的内容,暂时无法提供相关信息(申し訳ありませんが、この質問に対する答え方について十分に学んでいないので、現時点では情報を提供することはできません)」と回答を拒否しました。


こうした中国政府にとってデリケートな話題を扱う質問に対しては、Hunyuan T1だけでなくDeepSeek R1も同様の回答を生成することが指摘されています。

「DeepSeek-R1」は中国に関するデリケートな話題の85%に回答することを拒否、ただし簡単に制限を回避できるとの指摘 - GIGAZINE

この記事のタイトルとURLをコピーする

・関連記事
テキストや画像から高精度な3Dアセットを作り出すAIシステム「Hunyuan3D 2.0」をTencentがオープンソースで公開 - GIGAZINE

Tencentが中国軍との関係が疑われる企業のブラックリストに追加され株価7%超の下落、企業の評判悪化のほか財務省による制裁の圧力にさらされる可能性も - GIGAZINE

DeepSeekのモデルは質問者の言語に忖度して回答を変えるとの指摘 - GIGAZINE

DeepSeek-R1の検閲回避版モデル「R1 1776」をPerplexityが公開、「天安門事件」「台湾独立」「ウイグル自治区」について詳しく回答可能 - GIGAZINE

in レビュー,   ソフトウェア, Posted by log1r_ut

You can read the machine translated English article Tencent unveils new AI model 'Hunyuan T1….