simpleA記

馬にふつまに 負ほせ持て

おまけイチ、ニイ、ヨン!


最後だよ。明日の(重大)発表を逃さないよーに


今日はおまけを、一気にいきましょ。
おまけ1>おまけ2>おまけ4scribdへアップ>みんなで打ち上げパーティー@門前仲町


最後なので、id:Ryu-Higaさんの「おまけ1」「おまけ4」とid:Ronronさんの「おまけ2」をドッキングしちゃいます。




『Alternative File Formats for Storing Master Images of Digitisation Projects』http://www.scribd.com/doc/2388286/Alternative20File20Formats20for20Storing20Masters202201

おまけ1 代替的ファイル・フォーマットの使用状況 45
おまけ2 ファイル・フォーマットの評価方法(表) 48
おまけ3 ファイル・フォーマットの評価方法(解説) 50
おまけ4 ストレージ・テスト 62


おまけ1:代替的ファイルフォーマットの使用状況


以下のリストは、代替的ファイルフォーマットの使用状況の全てを示してはいません。単に、様々なフォーマットの使用状況を、簡単に示そうとするものです。


JPEG 2000


「アクセスコピー」としてJPEG2000を使用している多数の機関があり、それ以外にも多くの機関が長期保存用のフォーマットとしての使うための調査を実施しています。長期保存用のフォーマットにJPEG 2000のみを選んだ文化的な機関はたったひとつのようです。今後の調査の課題として、医学分野におけるJPEG2000の使用があります。JPEG2000を使用する機関と会社に関する例:

  • 英国図書館は、JPEG2000をアーカイブ・フォーマットの1つとして選んだ唯一の団体です(まだTIFFとの混用ですが)。「英国図書館のデジタル保存チーム(DPT)は次のように考えます。このプロジェクトに使うストレージの予算はすでに割り当てられているので、ファイルフォーマット関する限り、仕様の変更を推奨するのは非実用的であります。したがって、我々は MLB_v2.docで認知されたフォーマットを継続することを推奨します。それらは以下の通りです。
    ・アクセス用ファイルとして、タグ付きPDF1.6を使います。スキャンされた本の条件によりますが、 トップページは目次ページか、第1章の最初のページとします。
    ・「保存コピー」用として、JPEG2000ファイルをPSNR70dBのレベルで圧縮します。
    メタデータはMETS/ALTO3 XMLを仕様します。
    JP2ファイルはマスターファイルの要件を満たしますが、業界での普及率が低く、保存という観点から僅かな懸念が残ります。しかしながら、このフォーマットは明瞭かつ文書化されておりますので、即座にリスクを引き起こすようなことはありません。「普及率の低さに伴うリスク」はこのようにして認識されますが、JPEG2000の選択を妨げる大きな障壁であるとは見なされません。
  • 米国議会図書館: アメリカ・メモリーのウェブサイトで、アクセス・ファイルとしてJPEG2000を使用しています。
    ( http://memory.loc.gov/ammem/index.html )
  • 全米電子新聞プログラム(NDNP)は、マスター・ファイルとして圧縮なしのTIFF6.0を、全ての派生ファイルにJPEG 2000を使用します。
    (http://www.loc.gov/ndnp /)
  • (日本)国立公文書館では、デジタル・ギャラリーにアクセスする際にJPEGとJPEG2000どちらかを選ぶことができます。
    ( http://jpimg.digital.archives.go.jp/kouseisai/index_e.html )
    マスター・ファイルのフォーマットは明らかにされていません。
  • Googleはグーグル・アースとグーグル・プリントでJPEG2000を使用します。
  • セカンドライフJPEG2000を使用します。
  • Motion JPEG2000(MJ2)は、デジタルシネマの規格としてDigital Cinema Initiatives(DCI)のメンバーによって使用されます。 DCIの代表的なメンバーは以下の通りです。
    ・Buena Vista Group (Disney)
    ・20th Century Fox
    ・Metro-Goldwyn-Mayer
    ・Paramount Pictures
    ・Sony Pictures Entertainment
    ・Universal Studios
    Warner Bros. Pictures
  • 医療画像分野ではJPEG2000が相当使われています--DICOMを参照して下さい。
    (http://medical.nema.org/ )
  • 生体認証: 例えばドイツの新しいパスポートは、組み込まれたチップ内にバイオメトリックなデータとJPEG 2000のイメージが格納されています。
  • ビデオ監視アプリケーション
  • カナダ国立図書・資料館(LAC)は、JPEG2000の使用に関して実行可能性調査を行いました。(http://www.archimuse.com/mw2007/papers/desrochers/desrochers.html)しかしながら、追加的なセーフティ・ネットとして、現在に至るまでTIFFでのコピーもアーカイブされています。
  • インターネット・アーカイブ。
    http://www.archive.org
  • コネティカット大学
    ( http://charlesolson.uconn.edu/Works_in_the_Collection/Melville_Project/index.htm 。)
  • ユタ大学
    ( http://www.lib.utah.edu/digital/collections/sanborn/ )。
  • スミソニアン図書館。
  • J・ポール・ゲティ美術館


PNG

  • オーストラリア国立公文書館は、アーカイブ・フォーマットとしてPNGを使用します。
  • アーカイブ・マスターとしてPNGフォーマットを使用する文化遺産機関はこれ以上見つけられませんでした。


JPEG


TIFF LZW

  • アメリカ国立公文書記録管理局は、内部デジタル化プロジェクト用アーカイブ・マスターとして、TIFF LZWを使用します。
  • 他の例は全く見つけられませんでした。


おまけ2:ファイル・フォーマット評価法の結果発表



おまけ4:ストレージテスト


序論で述べた通り、このテストを実行する際には2つの条件があった。

  • RGB各8ビットで計24ビットのファイルを用いた
  • 2セットのオリジナルファイルをテストした:片方はコントラストの低いテキスト・ページであり、もう一つは写真ページであった。


テストイメージは、ポピュラーな物語本をスキャンした94枚の画像であり、原本はコントラストが低く、スキャン条件は300ppi/24ビットRGBです*1。オリジナルファイルはA5より小さいものから、A4よりわずかに大きなフォーマットまで、様々です。

ファイル・フォーマット
及び圧縮
テストバッチの
ファイルサイズ
平均的な
ファイルサイズ*2
ストレージ節約率*3 50万ファイル
の推計容量*4
非圧縮TIFF 623 MB   6.6 MB 3.1 TB
TIFF+LZW 428 MB 4.6 MB 31% 2.2TB
JPEG 10*5 66 MB 0.7 MB 89% 343 GB
JPEG 8 35 MB 0.4 MB 94% 195 GB
JPEG 6 26 MB 0.3 MB 96% 146 GB
JPEG 1 10 MB 0.1 MB 98% 49 GB
PNG 355 MB 4 MB 43% 2 TB
JPEG2000ロスレス*6 298 MB 3.2 MB 52% 1.5 TB
JPEG2000圧縮率10 54 MB 0.6 MB 91% 280 GB
JPEG2000圧縮率25 25 MB 0.3 MB 96% 146 GB
JPEG2000圧縮率50 13 MB 0.1 MB 98% 68 GB


物語本に加えて、写真をRGB スキャンした104枚の画像に関しても行われました。結果はほとんど同等のものでした。

JPEG2000

*1:Geheugen van Nederland(オランダの思い出)プロジェクトの一環としてスキャンしました。http://www.geheugenvannederland.nl/?/nl/collecties/straatliederen

*2:ファイル数 . 94 .で全ファイルサイズを分割しました。

*3:94個の圧縮ファイルストレージと非圧縮TIFF(RGB 653GB, grey 218GB )ストレージを比較したパーセンテージ。

*4:平均的なファイルサイズを500,000倍

*5:JPEG Adobe Photoshop scale quality 10

*6:フォトショップの Lead JPEG2000 プラグインが使用されている。圧縮量は圧縮率によって設定されます。圧縮率10は最小の圧縮であり、質的にJPEG10に匹敵しています。圧縮率25は平均的な圧縮であり、質的にJPEG6に匹敵しています。圧縮率50は強烈な圧縮であり、質的にJPEG1に匹敵しています。追加テストはPhotoshop native プラグインで実行しました。可逆圧縮はLead プラグインと比較し、わずかに下回る結果を得ました。 Lead プラグイン53% -Photoshop プラグイン52%。 Lurawave toolのような、他コンバータによる追加テストの必要性あり。(http://www.luratech.com/ products/lurawave/jp2/clt/)