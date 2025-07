[2506.17298] Mercury: Ultra-Fast Language Models Based on Diffusion https://arxiv.org/abs/2506.17298 Mercury: Ultra-Fast Language Models Based on Diffusion https://arxiv.org/html/2506.17298v1 Inception Labsは次世代のdLLMとなるMercuryを発表しました。MercuryはGoogleが開発した深層学習モデルの Transformer を介してパラメーター化され、複数のトークンを並列して予測するようトレーニングされています。 拡散モデルは画像を生成するための最先端のアプローチとして登場した技術で、一貫して高品質かつ多様なコンテンツを制作することが可能です。拡散モデルが従来の 自己回帰モデル に対して持つ利点は、並列生成が可能であること(つまり、処理速度が速い)や、きめ細やかな制御・推論・マルチモーダルデータ処理能力を有している点にあります。しかし、拡散モデルを高いパフォーマンスを維持したまま、LLMの規模にスケーリングすることはこれまで大きな課題とされてきました。 これに対して、Mercuryは同等の自己回帰モデルと比較して最先端のパフォーマンスと効率性を実現したdLLMとなっています。Inception LabsはMercuryを「初の汎用チャットモデル」と表現しており、これまで以上に幅広いテキスト生成アプリケーションに対応できるようになっているとのことです。

スタンフォード大学、カリフォルニア大学ロサンゼルス校、コーネル大学の教授陣により設立された新世代の大規模言語モデル(LLM)を開発するAIスタートアップの Inception Labs が、 拡散モデル を取り入れた次世代LLMの拡散大規模言語モデル(dLLM)となる「 Mercury 」を発表しました。Inception Labsによると、Mercuryは世界初の商用規模のdLLMとのことです。 Introducing Mercury, our General Chat Diffusion Large Language Model https://www.inceptionlabs.ai/introducing-mercury-our-general-chat-model

2025年07月08日 19時00分00秒 in ソフトウェア, Posted by logu_ii

