ソフトウェア

33言語の相互翻訳が可能な70億パラメータの軽量翻訳モデル「Hunyuan-MT-7B」と「Hunyuan-MT-Chimera-7B」をテンセントがオープンソース化、ベンチマークで既存のモデルに勝ったと主張


テンセントの大規模言語モデル「Hunyuan(混元)」開発チームが、文章を外国語に翻訳するのに特化したAI「Hunyuan-MT-7B」「Hunyuan-MT-Chimera-7B」をオープンモデルで公開しました。Hunyuanは、Hunyuan-MT-7Bが軽量な7Bモデルでありながら、ベンチマークではGPT-4.1のようなクローズドソースモデルに匹敵するパフォーマンスを示したとアピールしています。


tencent/Hunyuan-MT-7B · Hugging Face
https://huggingface.co/tencent/Hunyuan-MT-7B

GitHub - Tencent-Hunyuan/Hunyuan-MT
https://github.com/Tencent-Hunyuan/Hunyuan-MT/

Hunyuan-MT-7Bは、70億パラメータを持つ軽量な翻訳モデルです。その主な特徴は高い性能と効率性にあり、世界的な機械翻訳コンペティションであるWMT 2025において、参加した31の言語カテゴリのうち30で1位を獲得したとのこと。また、Flores200ベンチマークテストでは、クローズドソースのGPT-4.1に匹敵する結果を示し、同規模のオープン翻訳モデルの中で業界をリードする性能を持つとされています。


Hunyuan-MT-7Bは33言語の相互翻訳をサポートしており、その中には中国の5つの少数民族言語も含まれています。ただし、日本語に対応しているかどうかは明言されていません。Hunyuan-MT-7Bは効率的な設計により、少ないリソースで多くの翻訳リクエストを処理できるため、高性能なサーバーから小型のエッジデバイスまで、さまざまな環境で柔軟に利用できる利点があるとのこと。

Hunyuan-MT-Chimera-7Bは、業界初となるオープンソースの翻訳アンサンブルモデルです 。このモデルは、直接翻訳を行うのではなく、複数の翻訳結果を統合し、より洗練させることで、さらに高品質な翻訳を生成する役割を担います。これにより、翻訳の品質が新たなレベルに引き上げられ、特に専門分野において精度向上に貢献するとされています。


Hunyuan-MT-7BとHunyuan-MT-Chimera-7Bには、標準モデルの他に、FP8形式で量子化されたモデルも提供されています。これにより、推論の効率を高め、デプロイのハードルを下げることが可能です。

モデルのファインチューニングにはLLaMA-Factoryというフレームワークを使用する方法が紹介されています。デプロイに関しては、「TensorRT-LLM」「vLLM」「SGLang」といった主要な推論フレームワークに対応。すぐに利用できるDockerイメージも提供されており、開発者は比較的容易にモデルを自身の環境に導入し、運用を開始できます。

Hunyuan-MT-7BとHunyuan-MT-Chimera-7Bは、「Tencent Hunyuan Community License」という独自のライセンスのもとでオープンソースのモデルとして公開されています。このライセンスはApache 2.0をベースにしており、研究および商用利用が可能ですが、モデルを利用したサービスの月間アクティブユーザー数が1億人を超える場合は、別途Tencentからライセンスを取得する必要があります。また、欧州連合、イギリス、韓国など一部の地域では利用が制限されています。

Hunyuan-MT-7BならびにHunyuan-MT-Chimera-7BのモデルはHugging FaceとGitHub、ModelScopeで公開されており、無料でダウンロード可能です。

Hunyuan-MT - a tencent Collection
https://huggingface.co/collections/tencent/hunyuan-mt-68b42f76d473f82798882597

GitHub - Tencent-Hunyuan/Hunyuan-MT
https://github.com/Tencent-Hunyuan/Hunyuan-MT/

Hunyuan-MT合集详情-来自Tencent-Hunyuan · 魔搭社区
https://modelscope.cn/collections/Hunyuan-MT-2ca6b8e1b4934f

この記事のタイトルとURLをコピーする

・関連記事
DeepSeek R1のパフォーマンスと価格に匹敵する新しいAIモデル「Hunyuan T1」をTencentが公開 - GIGAZINE

テキストや画像から高精度な3Dアセットを作り出すAIシステム「Hunyuan3D 2.0」をTencentがオープンソースで公開 - GIGAZINE

中国全土で大学入試期間中にAIサービスが一斉停止 - GIGAZINE

Appleが中国でのAI機能提供に向けてTencentやByteDanceと交渉中との報道 - GIGAZINE

中国IT大手TencentがNVIDIAに頼らず自社製AIインフラのAI学習能力を20%強化 - GIGAZINE

in AI,   ソフトウェア, Posted by log1i_yk

You can read the machine translated English article Tencent has open-sourced the 7 billion p….