ノルウェー国立図書館が新聞・書籍・映画などあらゆる資料をデジタル化中で、一部は日本からもアクセス可能


ノルウェーの法廷納本法は、全てのメディアの全ての出版物をノルウェー国立図書館に納本するように定めています。そんなノルウェー国立図書館では、2006年から保管するあらゆる資料のデジタル化プログラムがスタートしており、ノルウェーの人々はこのデジタル化されたコンテンツにインターネット経由で自由にアクセスできるようになっています。

What is being digitized? - Nasjonalbiblioteket
http://www.nb.no/English/The-Digital-Library/What-is-being-digitized

ノルウェー国立図書館が資料のデジタル化に動き出したのは2006年で、デジタル化されるものの対象には新聞・写真・本・音・原稿(手書きの文章やノート)・雑誌・ビデオ・映画・ノルウェー議会の報告書など、中世から現在に至るまでのあらゆる資料が含まれています。なお、全収集物がデジタル化されるのには20~30年ほどかかると考えられています。

デジタル化されたデータのうち、著作権フリーのものは誰でもオンライン上からアクセス可能で、実際にアクセスするとこんな感じで表示できます。


また、著作権により保護されているコンテンツがアクセス可能になるのは、ノルウェーのIPアドレスを持つ端末から閲覧される場合のみ。さらに、全てのデジタル化されたコンテンツは、ノルウェー国立図書館内で閲覧および資料作成などに使用可能です。


ノルウェー国立図書館では複数種類の資料をデータ化する際、3つの行程を行っており、その行程を流れていくデータの量は1日当たり数テラバイトにも上るようです。行程の内容は以下の通り。

◆1:スキャンしてデジタル化
ノルウェー国立図書館にはドキュメントスキャナーやイメージスキャナーなど複数種類のスキャナーと資料をデジタル化するためのツールがあります。これらを使い、本・新聞・写真などの紙資料をデジタル化します。また、図書館にはムービーや音をデジタル化するための設備も完備されている、とのこと。

◆2:構造解析
いったんテキストを含む資料がデジタル化されたならば、それを光学文字認識(OCR)ソフトウェアで処理することで、画像の中の文書もテキスト化し、資料中の全テキストを検索可能にしています。

◆3:後処理
そして最後に、ファイルのチェックやメタデータの生成、データベースへの登録、さらに著作権フリーのデータを配布可能な形にして、最後にデータをアーカイブに保管します。印刷物はJPEG 2000もしくはTIFF形式で保存され、音声データはWAV形式、そしてムービーはMPEG-4H.264形式で保存されます。

ノルウェー国立図書館ではデジタルコンテンツをデータベースに保管することもしており、電子書籍や国の調査データ、サウンドブック、テレビ、ラジオ、ウェブ上で得られるさまざまなデータまでも保管しています。さらに、ノルウェー国立図書館では電子書籍における法廷納本法がカバーする範囲を拡張しようとしているとのこと。


なお、他にもノルウェー国立図書館では写真資料をFlickr上で公開で公開するという試みも行っています。

・関連記事
電子書籍の脅威から本屋を救うための10のアイディア - GIGAZINE

電子書籍は本嫌いの子どもの読書を促進する可能性を秘めている - GIGAZINE

ノルウェーの谷底の町を太陽で照らす51平方メートルもある3枚の巨大鏡 - GIGAZINE

個室に薄型テレビや冷蔵庫、シャワーも完備した超ラグジュアリーなノルウェーの刑務所 - GIGAZINE

記録的大きさの隕石がノルウェーを直撃 - GIGAZINE

108

in メモ, Posted by logu_ii