AI

AIエージェントの「記憶」は人間の記憶とどう異なるのか?


AI技術の進化によって、与えられた目標の達成に合わせて自分で考え、外部ツールやデータを自律的に操作・判断して行動する「AIエージェント」が実現しています。AIが人間のように複雑なタスクをこなすためには、与えられた情報を保存して必要に応じて引き出せる記憶(メモリ)が必要。ポーランドのエンジニアであるbrgsk氏が、AIエージェントの記憶が人間の記憶とどう違うかを解説しています。

agent memory: an anatomy
https://brgsk.xyz/agent-memory-anatomy/

AIエージェントのメモリシステムは、大きく分けると「抽出器」「保存先」「検索器」という3つの部品で構成されます。


「抽出器」は会話の記録を読み取り、後で役立つと判断した情報だけを短い文として取り出す役割を担います。この処理には多くの場合LLMが使われ、「ユーザーはTypeScriptを好む」「このプロジェクトでは○○を優先する」といった抽象化された記述が生成されます。ただし、毎回の発言後に抽出すれば雑談まで保存してしまい、逆に会話の最後にまとめて抽出すると長い文脈の中間にあった重要な情報を見落としやすくなるため、抽出のタイミングは難しいとのこと。

そして、抽出とは「具体的な出来事」を「文脈から切り離された事実」に圧縮する作業でもあります。例えば「火曜日にコーヒーを飲みながらTypeScriptが好きだと言った」という出来事は「ユーザーはTypeScriptを好む」という事実に変換できますが、その過程で日時や場面、強調の度合い、発言のニュアンスは失われてしまいます。


「保存先」は抽出した情報を入れておくデータベースです。実装としては、意味の近さで探せるベクトルインデックス、項目ごとに絞り込めるリレーショナルテーブル、情報同士の関係を表せるナレッジグラフなどが使われます。

保存先で最も難しいのはどこに保存するかではなく、古い情報と新しい情報が矛盾した時にどう扱うかです。例えばユーザーが4月までパリに住んでいて、その後アムステルダムに引っ越した場合、両方の情報をそのまま保存すると「パリ在住」「アムステルダム在住」のどちらも事実であるかのように見えてしまいます。この時、古い情報を上書きするのか、両方を残して検索側に判断させるのか、あるいは古い情報を「現在は無効」として残すのかという設計判断が必要になります。

「検索器」はユーザーが質問した時に現在の文脈に合う記憶を探し出し、LLMに渡す役割を担います。基本はベクトル検索で、そこにキーワード検索や再ランキングを組み合わせる構成が一般的です。この構造は、文書検索を使って回答を補強するRAG(検索拡張生成)とよく似ています。その違いは検索対象が一般の文書ではなく、ユーザーやタスクについて蓄積された短い記述である点です。


また、保存する記憶そのものは情報の種類に応じて「エピソード記憶」「意味記憶」「手続き記憶」「ワーキングメモリ」などに分類されます。なお、AIエージェントにおけるワーキングメモリはコンテキストウィンドウに相当するため、ここで扱われる長期的な記憶とは別の仕組みだとbrgsk氏は説明しています。

「エピソード記憶」は特定の時間や場所に結びついた出来事の記憶です。AIエージェントにおいては「ユーザーは2026年3月14日にベルリンに住んでいると言った」など、会話の記録に基づいたタイムスタンプ付きの記述として保存されることがあります。

「意味記憶」は特定の出来事から切り離された事実の記憶です。AIエージェントのメモリと呼ばれているものの多くはこの意味記憶に近く、「ユーザーはTypeScriptを好む」「ユーザーはこのプロジェクトで速度を重視している」といった事実として扱われます。


「手続き記憶」は体や行動で覚えている記憶。人間でいえば「自転車に乗る」「キーボードでショートカットを使う」といった行動に伴うものですが、AIエージェントのメモリライブラリではこの種類の記憶が十分に実装されているとは限りません。

例えばAIエージェントが長期的な記憶を管理できるようにするライブラリ「LangMem」はシステムプロンプトを改善して行動傾向を変える仕組みを持つため、手続き記憶に近い実装だといえます。一方で、AIエージェント向けのメモリ管理システムである「Mem0」は保存や検索の仕組みが意味記憶と同じで、AIエージェント向けの時間認識型ナレッジグラフを構築する「Graphiti」には手続き記憶の概念自体がないとのこと。

そして、前もって予定された行動を適切なタイミングで思い出すための「展望記憶」もAIエージェントには重要。現状の実装では時刻指定のトリガーはあっても、「条件が現れた時に思い出す」形の記憶は十分に実現されていないとbrgsk氏は指摘しています。

このように、エピソード記憶は抽出時に意味記憶へ圧縮され、手続き記憶はラベルだけの場合が多く、将来記憶はほとんど未開拓であることから、brgsk氏は「多くのエージェントメモリは、名前ほど幅広い記憶システムではない」と論じています。抽出は人間の睡眠中の記憶整理に似ており、保存先は長期記憶に似ており、検索は手がかりに基づく想起に似ていますが、実際のAIメモリは生物学的な脳ではなく、状態を管理するソフトウェアです。


AIエージェントの記憶機能は主にユーザーに関する事実を保存する「自伝的記憶」に近いものといえます。エージェント自身の人生を覚えているのではなく、「ユーザーがどこに住み、何に取り組み、誰を重視し、何を決めたのか」を代理で維持する仕組みとなります。

近年は人間の睡眠中の記憶整理に似た「統合」の仕組みも試みられています。AnthropicのDreamingや、バークレー大学やAI研究組織のLettaが提唱するsleep-time computeは蓄積された記憶や過去の会話をあとから見直し、重複をまとめたり矛盾を解消したりして、より整理された保存先を作る技術です。


一方で、人間の「感情的に強い出来事ほど記憶に残る」という性質はテキストだけで動くAIエージェントにはそのまま移植できません。LLMに重要度を採点させる方法はありますが、それは感情そのものではなく感情らしさを推定する代理指標にすぎません。

また、記憶は覚えるだけではなく適宜忘れるべきだという点にも注意が必要です。人間が忘れるのは脳がすべてを保存できないという制約のためですが、AIエージェントでは保存容量よりも「必要な情報を正しく見つけられるか」の方が重要になります。したがって、AIエージェントのメモリに求められるのは単に古い情報を消すことではありません。今有効な情報を古い情報より上位に出し、古くなった情報を削除せずに無効化し、必要な時に過去の状態も確認できるようにする設計が重要になるというわけです。

brgsk氏は、AIエージェントの記憶とは人間の記憶をそのまま再現したものではなく、会話や作業から得た情報を将来の文脈に持ち越すための工学的な仕組みだと指摘。重要なのは「メモリ」という言葉に惑わされず、それが何を保存し、何を失い、どのタイミングで思い出せるのかを見極めることだと主張しました。

この記事のタイトルとURLをコピーする

・関連記事
「AIも使い続けていると人間のように老化する」という指摘、セッションを重ねて記憶が蓄積されることで性能悪化 - GIGAZINE

「AIモデルには睡眠が必要」という研究結果 - GIGAZINE

人間の脳にはAIっぽいメカニズムの言語ネットワークがあるという主張 - GIGAZINE

記憶や学習といった能力は脳だけのものではないという研究結果、AIやロボット分野への応用も - GIGAZINE

ChatGPTは学習を速める一方で長期記憶には残りにくい可能性がある - GIGAZINE

死んだ人のアカウントを引き継いで投稿やチャットを続けるAIの特許をMetaが取得 - GIGAZINE

ゴミのようなデータを学習させることでAIがバカになってしまう「脳の腐敗(Brain Rot)」仮説とは? - GIGAZINE

in AI, Posted by log1i_yk

You can read the machine translated English article How does the 'memory' of an AI agent dif….