simpleA記

馬にふつまに 負ほせ持て

書籍電子化

FuzzyさんよりJPEGも到着

みなさーん、自分のペースで進めてくださいねー。そんで、翻訳してて、困ったこと、ぶちまけたいことなど、どんどん、アップしていきましょう。 最終的に翻訳されたものが重要なのでなく、その過程が重要なのです。全てがエンターテイメントです。 『Alterna…

FuzzyさんよりPNG到着

さて、みなさんのご協力で、少しずつ、前に進んでるよ。各方面からの応援メッセージもありがと。 基本的に、できるだけ、修正せずに、そのまま載せていきまーす。なので、表現の修正などの提案などは、みんなで意見してね。あと、wikiとかそーいったものが詳…

要約

『Alternative File Formats for Storing Master Images of Digitisation Projects』http://www.scribd.com/doc/2388286/Alternative20File20Formats20for20Storing20Masters202201 要約 2 要約この論文は、オランダのハーグにある王立図書館が行った「電子…

吉報は寝て待つ

朝起きたら、協力者が4人に増えた。(明日の朝は8人に増えてるのかな。) さっそく、(私の理解した範囲での)各人の特徴を活かし、割り振りを提案しまーす。 全体像: 目次 要約 2 1 序章 6 1.1 フォーマット選択の影響 7 1.2 マスター・ファイルを長期保存…

翻訳開始しまーす

日本に帰ってきて、3四半期が過ぎました。なので、新しいこと始めます。 http://d.hatena.ne.jp/simpleA/20080527で、 『Alternative File Formats for Storing Master Images of Digitisation Projects』 (電子化プロジェクトにおけるマスター・イメージの…

PDF/A

すでにISO 規格となっているPDF/A に加え、2007 年、「PDF 1.7」の仕様全体がAIIM に提出され、PDF のフル仕様をISO の世界標準とすることを目指す動きがある。ここではまず、PDF/A の概要にについて、概要、普及状況、ガイドラインをまとめる。 http://www.…

なんで圧縮の話してんの?小学5年生でも分かるように説明してください。

いきなり、JPEG2000だとか、LZWってなヘンテコ話をはじめて、「しんぷるは、とうとう発狂?」と思った方、ちょいとお時間よろしいですか?30秒で、ご説明します。 奥さん、要は布団圧縮パックですよ! (http://www.rakuten.co.jp/silknet/512825/566573/よ…

じゃ、どのフォーマットが良いの?

今日は(めずらしく)単刀直入に言いましょ。 書籍とかをスキャンした画像をTIFFなんかで保管しておくと、かさばるでしょ。圧縮したいよね。そんなとき、次のフォーマットを検討してみてはいかがでしょ?ってな論文があるんだよ。(上から順にお勧め、とのこ…

JPEG2000はどーなってんのよ?

http://www.scribd.com/doc/3102844/simpleR056r0 さっそく、一般公開な第1弾(なぜかレポート番号は「56」ですが、気にしないでね)はこちら。ほとんどの人にとってあんまし意味ないんだろーけど、記念に見てね。「電子画像データ長期保存フォーマットとし…

別の一見と百聞

これからは、さわやかな書籍電子化の季節です。みなさん、一緒に書籍電子化の世界を旅しましょ。 (一見)ジョージア工科大学のおもしろ作品*1 (百聞) 『Low Overhead Manipulation of Bound Book Pages』*2 http://www.cs.cmu.edu/~illah/PAPERS/page2pag…

百聞は一見にしかーず

見りゃー、分かる(はず)。新製品。 これはオーストリア製。他と比べると、一長一短あり。一長一短について、百聞希望の人いたら、「百聞希望。比較送れ!」とメールください。百聞希望動機も添えてくださーい。 その他のマシーン。

失敗のパターンをいくつか紹介

そろそろ春だし、ちょっとマニア度高いこと、話しましょ。*1 スキャン失敗した画像にも、いろんな種類があんのって気付いてた? まずは、基本を押さえましょ。普通、下のような「ボヨーン」って画像があったら、「ボヨーン」と膨らんでいるほうが、ページの…

今どき、書籍はどーやって探すのか?

2007年の末に、「Book Discovery in a Mass Digitized Environment(ネット時代の書籍探し)」ってなタイトルのプレゼンがされたんだよ。そんときのpptはこれね。 | View | Upload your own 英語分からんくても、パラパラ見てれば、言いたいことは分かる(か…

ハーバードが選んだ代表的ページたち

http://preserve.harvard.edu/massdig/hul_study/index.htmlより これは、アメリカの名門ハーバード大学が The digitized pages in this suite were selected to represent a segment (but not the full range) of page characteristics for volumes publish…

坂東さんに会ってきた

以前から気になってたので、「会いましょ」メールしたら、坂東さん(id:keitabando)が東京まで新幹線(おそらく)乗って来てくれました。(感謝)私もズンドコ東京まで東葉高速鉄道・東西線乗って行って来ました。わけあって、坂東さんは静岡あたりから乗っ…

書籍電子化におけるエスクロー方式とは?(後半)

ちょっと、いろいろあって、間が空いたけど、前回の続き。 前回、 Peterは何を問題にしているかと言うと、 CICには多くの公立図書館が含まれており、その図書館の費用負担は、税金から出ている。データがエスクローに入ったまま、Googleしか利用できない状態…

書籍電子化におけるエスクロー方式とは?(前半)

時は西暦2007年6月6日、書籍電子化業界に激震が走った! 事の発端は、CIC契約。後に「CIC事件*1」と呼ばれる大事件であった。 シカゴ大学、イリノイ大学、インディアナ大学など五大湖沿岸の12大学のコンソーシアム“Committee on Institutional Cooperation(…

なんで「閲覧可能にするため」なの〜?

さらに、昨日に引き続き、日本の国家プロジェクトに関して、話しましょ。 3000万冊を超える国会図書館の蔵書をデジタル化して全国で閲覧可能にするための法改正に政府が着手する。 http://it.nikkei.co.jp/internet/news/index.aspx?n=AS3S28039%2007012008 …

ホントに、国会図書館には3000万冊もあるのか?

昨日に引き続き、日本の国家プロジェクトに関して、話しましょ。 3000万冊を超える国会図書館の蔵書をデジタル化して全国で閲覧可能にするための法改正に政府が着手する。 http://it.nikkei.co.jp/internet/news/index.aspx?n=AS3S28039%2007012008 ホントか…

最低でも知っておくべきこと

日本の政府が新年の抱負を言ったっぽい。*1 3000万冊を超える国会図書館の蔵書をデジタル化して全国で閲覧可能にするための法改正に政府が着手する。 http://it.nikkei.co.jp/internet/news/index.aspx?n=AS3S28039%2007012008 何ともまぁ、「後追い」な。で…

ここまで写りこむのもすごい

http://www.theregister.co.uk/2007/12/05/google_books/によると、GBSで、かなーりすごいもんがあったらしい*1。 こっちへ行ってみると、たしかにすごい。何の「ためらい」もない。お見事。 だけど、「こんな画像品質じゃ、Googleもダメだね」って批判は的…

「アキラメない」連中の系譜

書籍の電子化について、現状把握をしよーとしてんだけど、今回の切り口は、「OCRのあたり」。 書籍電子化の歴史と、OCR*1の発展の紆余曲折は、姉妹のよーなもの。 OCRの発展の紆余曲折を知ることはとっても大事。 ただ、紆余も曲折もぜーんぶ見ようとすると…

現状整理

今日から、たまに、「書籍の電子化」について話しましょ。 何回かにわたり、いろんな切り口で、現状整理しまーす。 どんなときも、現状把握が大切。 切り口(1) ビジネスモデル「書籍の電子化」はやたらとお金がかかるんだけど、かなりボールパークな目安とし…