simpleA記

馬にふつまに 負ほせ持て

要約

『Alternative File Formats for Storing Master Images of Digitisation Projects』http://www.scribd.com/doc/2388286/Alternative20File20Formats20for20Storing20Masters202201

要約 2

要約

この論文は、オランダのハーグにある王立図書館が行った「電子化プロジェクトにおけるマスター・イメージの代替的ファイル・フォーマット」研究の最終報告である。この研究は、王立図書館のストレージ戦略を見直す一環として行われた。王立図書館の進めている電子化プロジェクトは、向こう4年間で4000万枚の画像を作成していくだろうと予測され、ストレージ戦略の見直しが必要である。現在、マスター・ファイルは非圧縮TIFFファイルとして保存されている。この非圧縮TIFFファイルで、4000万枚の画像を保存しようとすると、650TBのストレージ容量が必要となるだろう。この研究の目的は、必要となるストレージ・スペースを削減するため、代替的ファイル・フォーマットについてまとめることであった。望まれる画質、長期的な使用可能性、機能性などの項目が、考慮の対象となった。


以下の4つのファイル・フォーマットが検討された:

  • JPEG2000 パート1 (可逆及び不可逆)
  • PNG 1.2
  • JPEG(JFIF 1.02)
  • TIFFのLZW圧縮


それぞれのファイル形式に対して、以下の諸点を検討した:

  1. 必要となるストレージ容量
  2. 画質
  3. 長期的な使用可能性
  4. 機能性


王立図書館が、電子化されたマスター・ファイルを長期ないし永久的に保存しておきたい理由として、3つある。

  1. 原本の代替として残したいため(原本の劣化は避けられないが、高品質の保存媒体(例えばマイクロフィルム)などがないから)
  2. 電子化は膨大なコストがかかるので、やり直しが効かないため
  3. マスター・ファイルはアクセス・ファイルの元になるため


以上の3つの理由に基づいて、どのファイル形式を選択するべきなのかという推奨を作成した。


この研究は、王立図書館のR&D部門の知識と経験を活用した。王立図書館が作成した「ファイル形式評価の数値化による方法」を使い、各フォーマットの長期的な使用可能性が検証された。研究の結果は、国内及び海外から選ばれた、デジタル保存、ファイル・フォーマット、ファイル・マネージメントの専門家たちに見てもらった。彼らからもらったコメントを踏まえて、この最終報告を作成した。


この研究の主な結論は、次の通り。

  1. 原本の代替として残したい、という観点
    長期的な使用可能性という観点から、可逆のJPEG 2000とPNGが、非圧縮TIFFの代替ファイル・フォーマットとして、最も適している。ストレージの節約度合いが、PNGが40%に対して、可逆のJPEG 2000だと53%であり、機能性などもあわせて考慮すると、可逆のJPEG 2000に軍配が上がる。
  2. 電子化は膨大なコストがかかるので、やり直しが効かない、という観点
    JPEG 2000とJPEGが、非圧縮TIFFの代替ファイル・フォーマットとして、最も適している。画像情報を一切失ってはいけない、とすると、JPEG 2000及びPNGがお勧めのオプションとなる。
  3. マスター・ファイルはアクセス・ファイルの元になる、という観点
    不可逆のJPEG 2000およびJPEGが、圧縮率も高く、フォーマットとして最も適している。

JPEG2000