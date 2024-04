Google Demonstrates Method to Scale Language Model to Infinitely Long Inputs https://analyticsindiamag.com/google-demonstrates-method-to-scale-language-model-to-infinitely-long-inputs/ AIには作業可能なトークン量を示す「コンテキストウインドウ」という枠があり、たとえばChatGPTの場合、AIとの会話量が「コンテキストウインドウ」を超過するとパフォーマンスが低下し、会話の先頭に含まれるトークンが破棄されます。

Googleの研究者が、大規模言語モデル(LLM)に無限の長さのテキストを処理させる手法だという「 Infini-attention 」に関する論文を発表しました。 [2404.07143] Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention https://arxiv.org/abs/2404.07143

