メモ

人類の知識・Wikipedia1GB分をできるだけ圧縮するヒュッター賞で114MBへの圧縮に成功


人工知能(AI)に関する研究の奨励を目的に、コンピューター科学者のマーカス・ヒュッター氏から資金提供を受けて2006年から行われている「ヒュッター賞」で、1GBのファイルを約114MBに圧縮することに成功したサウラブ・クマール氏が5187ユーロ(約82万円)の賞金を受け取りました。

500'000€ Prize for Compressing Human Knowledge
http://prize.hutter1.net/


「ヒュッター賞」は、「適切に圧縮できるということは賢い(インテリジェントな)動作と密接に関連している」という考えから、「賢さ(インテリジェンス)」というあいまいな概念をファイルサイズの数値に置き換え、AGI(汎用人工知能)への道として、できるだけ賢い圧縮プログラムの開発を奨励する目的でスタートしたものです。

賞金はコンピューター科学者のマーカス・ヒュッター氏が提供しており、当初は100MBのテキストファイル「enwik8」が題材で、賞金総額は5万ユーロ(約800万円)でしたが、2020年から1GBの「enwik9」が対象となり、賞金総額も50万ユーロ(約8000万円)に増額されました。


あくまで、普遍的な賢い圧縮プログラムの開発を促進することを目的としているということで、enwik9の中身は普遍的なデータのコーパスであるオンライン百科事典Wikipediaから抜粋されたデータとなっています。また、圧縮にあたってのテストマシンの環境は、CPUがシングルコア、メモリが10GB未満、HDDが100GB未満で、50時間以内に実行できることと定められています。

サウラブ・クマール氏はfast cmixを用いてenwik9を圧縮、全体を約114MB(1億1415万6155バイトに縮小して、賞を受賞しました。なお、賞金を受け取るにあたっては前の記録と比べて圧縮率が1%以上改善されている必要があり、賞金は1%改善ごとに5000ユーロとなっているため、前の記録を1.04%改善したクマール氏には5187ユーロ(約82万円)が贈られました。


次に賞を受賞するためには、少なくとも圧縮後のサイズが「1億1301万4593バイト」を下回る必要があります。

この記事のタイトルとURLをコピーする

・関連記事
AIを使った音声圧縮で従来の圧縮を超えた圧縮率と圧縮速度を「Encodec」が実現 - GIGAZINE

画像生成AI「Stable Diffusion」が実はかなり優秀な画像圧縮を実現できることが判明 - GIGAZINE

老舗圧縮解凍ソフト「WinRAR」でファイルを開くだけで任意コード実行を可能にする脆弱性が発見される、すでに修正版が配布済み - GIGAZINE

「非再帰的ZIP爆弾」は10MBのファイルが281TBに膨らむ - GIGAZINE

in メモ, Posted by logc_nt

You can read the machine translated English article here.