ソフトウェア

歴史から忘れ去られたAIプロジェクト「Cyc」


1980年代に誕生し、人間の質問に適切に答えられる性能を発揮するなどその頭角を現したものの、ディープラーニングなどの手法が流行するにつれて忘れ去られていったAIプロジェクト「Cyc」について、テクノロジー専門家のI・A・フィッシャー氏が紹介しました。

Cyc: history's forgotten AI project - by I. A. Fisher
https://outsiderart.substack.com/p/cyc-historys-forgotten-ai-project

1983年、AIの研究者グループがスタンフォード大学に集まり、「いかにして常識を備えた機械をプログラムするか」という議題について話し合いました。


会合の主催者であるスタンフォード大学のダグ・レナト教授は、1970年代にAM(Automated Mathematician)というシステムを開発した人物でした。AMは初歩的な数学の知識をあらかじめ覚えさせておいたもので、「面白い定理を発見するように」と指示すると人間がまだ見ぬ定理を出すようにプログラムされていました。実際はありふれた定理がほとんどでしたが、中には驚くほど独創的なものもあったそうです。

AMの最大の欠点は、その能力(ヒューリスティック)がハードコーディングされていることでしたが、レナト教授が次に開発した「EURISKO」は、ヒューリスティックそのものをプログラムで評価し、変更することができました。レナト教授がEURISKOを使って複雑な卓上ボードゲームで人間と対戦したところ、EURISKOは一見するとうまくいきそうにない極めて異例な戦略を提案したとのこと。しかし、EURISKOの型破りな戦略は功を奏し、レナートとEURISKOはそのトーナメントで優勝したそうです。

それでも、EURISKOもやがて人気がなくなっていきました。そこでレナト教授は、一般的な知識、つまり人間が「常識」と呼ぶものを大量に引き出せるマシンの方が、AMやEURISKOのような「賢いが単純なプログラム」よりも、本物の知能を獲得できる可能性が高いと考えたそうです。


当時、人工知能はいわゆる「エキスパート・システム」が主流でした。ハードコードされたフローチャートに沿って機械的に進む従来のプログラムとは異なり、エキスパート・システムは医療診断や有機化学などの分野の専門家によって書かれた一連の事実やルールから、推論や推論を行うものでした。理論的には、エキスパート・システムは初歩的な推論を行うことができ、複雑な状況にも柔軟に対応することができたのです。

しかし、各エキスパート・システムはそれぞれ独自のルールやデータベースを持っており、無駄な重複が生まれ、異なるエキスパート・システム同士が互いに接続できないという問題を抱えていました。この問題に直面したレナト教授は、「常識」という知識の共有こそが、さらに効果的な新世代のシステムの基礎になると考えました。

1984年、研究コンソーシアム「マイクロエレクトロニクス・コンピューター・テクノロジー・コーポレーション(MCC)」がアメリカ国内の10社によって設立され、レナト教授はMCCのチーフサイエンティストに就任しました。数百億円規模の予算と数百人の従業員を武器に、レナト教授は「機械が人間のように推論するために必要な膨大な知識ベース」の作成を目指しました。このプロジェクトは、encyclopedia(百科事典)から「Cyc」と名付けられました。

その名前とは裏腹に、Cycは百科事典そのものを意味するものではありませんでした。Cycがカバーするのは基本的なレベルの知識であり、例えば「人は一度しか生まれない」とか「動物はおとぎ話の中以外ではしゃべれない」といった、当たり前すぎて誰もわざわざ書き留めないような命題を含んでいました。

Cycに所属するエンジニアたちはもともと手作業で知識を入力していましたが、やがて手作業ではまかないきれない「推論」の仕組みをCycに覚えさせる必要が出てきました。

例えば「メアリーは、合格した5校のうちハーバードに行くことに決めた。彼女は化学の学位を取って卒業した」という文章があったとします。ここでCycを人間のように推論させたければ、メアリーがハーバードでおよそ4年間過ごしたこと、数十の科目を履修したこと、その多くは化学の科目であったと考えられることなど、文章に書かれていない多くのことを考えさせる必要があります。これらの課題をこなしつつ、MCCはCycの知識量を増大させていきました。

Cycは明確な知識とルールに基づいて推論を行うことを特徴としています。例えば「すべての木は植物である」と「植物はいずれ枯れる」という知識を持っているCycは、木が枯れるかどうかを尋ねられたときに、「木はいずれ枯れる」という答えを導き出すことができます。

他にも「親は子どもを愛している」「人は幸せなときに微笑む」「子どもの最初の一歩は大きな達成である」「愛する人が大きな達成をしたときに人は喜ぶ」「子どもを持つのは大人だけである」という知識を持っている場合、「『娘の一歩を見守る人』という題が付けられた写真に笑顔の大人が写っているか」と尋ねられたCycは、その答えがYesであると論理的に推論し、さらに前提となった5つの知識を用いて論理的な論拠を提示することが可能です。


MCCは10年間にわたり資金援助を受け、Cycに多くの知識を学ばせました。1994年にMCCが解散すると、CycはCycorpという新会社のもとに分離独立。Cycorpが行ったことの多くは公表されていませんが、研究論文や技術報告書を通じて明かされた情報からは、医療研究者からの質問に答えるためにCycを使い、1カ月もかかっていた時間を1時間以内に短縮したり、アメリカの諜報機関と提携してアナリストが照会できる「テロ知識ベース」の構築を支援したりしていたことがわかっています。

2000年代に入ると、Cycorpは知識データをOpenCycとして公開し、ResearchCycと呼ばれる拡張版を研究者に提供。数人の外部の研究者がCycシステムに基づいて論文を発表しましたが、中核となる製品はCycorpが独占していて、OpenCycも結局2012年に公開が停止されてしまいました。

Cycがゆっくりと、しかし着実に知識ベースを増やしている間、人工知能の分野は根本的に変化していました。ほとんどのエキスパート・システムは2000年代にはとっくに姿を消していて、大量のデータで訓練されたアルゴリズムに基づくニューラルネットワークが大きな飛躍を遂げつつありました。ニューラルネットワークは、論理的な推論を行い、明示的なルールの知識ベースを丹念に手作業で作り上げるCycのやり方とは実質的に対極にあるものでしたが、ニューラルネットワーク、ひいてはディープラーニング・アルゴリズムは、以前は困難だった課題で素晴らしい成功を収めたのです。このような機械学習が支配する分野では、Cycのルールベースのアプローチはますます時代錯誤のような存在になりつつありました。


しかし、設立から40年経った2024年時点でもCycは存在していて、2500万のルール、150万の概念、そして1000以上の専門的な推論エンジンからなる知識ベースにまで成長を遂げているとのこと。Cycorpは50人の技術スタッフを雇用していて、一部の商業契約によって経営をやりくりしています。

ChatGPTのような派手なプログラムの影に隠れてはいるものの、Cycはまだ活躍の道が残されているそうです。2023年に亡くなったレナト教授は、知識が豊富で自然だが一貫性がなく不正確なことが多いLLMと、自然言語を理解することは不得手なもののその結論は常に人間が監査できる推論の連鎖によって裏付けられたCycを統合させ、より強力なAIを生み出すことができるのでは、と話していたとのこと。

フィッシャー氏は「40年間も生き残ったことは特筆すべき成果ですが、Cycは革命的なインパクトを生み出すことはできませんでした。CycについてAIコミュニティが記憶しているのは、見当違いのアプローチで多大な努力を無駄にしたという教訓的な話くらいでしょう。とはいえ、CycのようなルールベースのシステムがAIの先駆けだったことは間違いなく、おそらく再びその時代がやってくるでしょう」と述べました。

この記事のタイトルとURLをコピーする

・関連記事
GPT-4が眼科の医療試験で人間の専門医に匹敵するスコアをたたき出したとの研究結果 - GIGAZINE

「AIは人間より高性能だが一部のテストでは人間の方が優秀」「高性能AIの学習コストは数百億円」などをまとめたスタンフォード大学のレポート「AI Index Report 2024」が公開される - GIGAZINE

既存のAIモデルを組み合わせて超高性能モデルを作る手法を日本のAI企業「Sakana AI」が開発、進化的アルゴリズムで膨大な組み合わせを試行し人間には発想困難な高性能LLMや画像生成モデルを作成可能 - GIGAZINE

30年近く秘密裏に進められていた人間と同等の推論が可能な人工知能開発プロジェクト「Cyc」 - GIGAZINE

in ソフトウェア, Posted by log1p_kr

You can read the machine translated English article here.