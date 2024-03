オープンソースAIモデルの開発を行うRecursal AIが、パラメーター数が70億(7B)帯のモデルの中では最も優秀な多言語パフォーマンスを示すというモデル「 EagleX 」をリリースしました。記事作成時点では、1.7兆トークンでトレーニングした「 EagleX 1.7T 」が公開されています。 🦅 EagleX 1.7T : Soaring past LLaMA 7B 2T in both English and Multi-lang evals (RWKV-v5) https://substack.recursal.ai/p/eaglex-17t-soaring-past-llama-7b EagleXはオープンソースのアーキテクチャ「 RWKV -v5」に基づいて構築されたモデルです。RWKVはコンテキストサイズが大きい他のTransformer(系列変換モデルのひとつ)と比較して推論コストが10倍から100倍低く、実行時およびトレーニング時のリソース使用量が削減されます。

2024年03月19日 23時00分00秒 in ソフトウェア, Posted by log1p_kr

