simpleA記

馬にふつまに 負ほせ持て

書籍電子化におけるエスクロー方式とは?(前半)


時は西暦2007年6月6日、書籍電子化業界に激震が走った!


事の発端は、CIC契約。後に「CIC事件*1」と呼ばれる大事件であった。


シカゴ大学イリノイ大学、インディアナ大学など五大湖沿岸の12大学のコンソーシアム“Committee on Institutional Cooperation(CIC)”が、Google Book Searchに参加すると発表しました。各大学図書館の蔵書から最大1,000万点(著作権保護期間内のものも含む)をGoogleがデジタル化するとのことです。また各大学が共同して、デジタル化した書籍のうちパブリック・ドメインのものをオンラインで提供する共通のリポジトリを構築することも発表されています。


http://www.dap.ndl.go.jp/ca/modules/car/index.php?p=3612*2


この知らせを聞きつけ、真っ先に懸念を表明したのは、電子図書館連盟(DLF)の重鎮Peter Brantleyであった。





CIC発表の1週間後の6月13日、Peterは、彼のブログ「Peter Brantley's thoughts and speculations」の中で、「Monetizing libraries」というタイトルのエントリを立てた。敢えて訳せば、「図書館を食い物にしてんだぞーぃ」となる(かも)。


話せば長くなるので、超簡単にまとめると、

CICは、著作権で問題になりそうな本もGoogleに渡す。


Googleは、とりあえず、スキャンする。


問題になりそうな本のスキャンデータは、エスクロー*3と名づけたサーバーに入れる。


エスクローに入ったデータは、次の5つのうちどれかに該当しないと、CICはもらえない。

  1. その本が、パブリックドメインになる
  2. 著作権持ってる人とちゃんと契約を交わし、許可を得る
  3. なんらかの法律がOKを出していることが確認できる
  4. Googleがデータ管理やそのアクセス確保において、重大なヘマをやらかした場合
  5. CICとGoogleが書面で合意した場合

ということは、普通に考えれば、パブリックドメインになるまでは、スキャンデータは手に入らないことになる。


これまでにGoogleと契約した図書館は、こんなことにはなっていなかった。スキャンデータはすぐにもらえた。なのに、CICはもらえない。


つまり、CICに参加している図書館は、Googleに食い物にされてる。(こやつら、足元を見られたな)

ってな感じであった。

ここでひとつ、よくある神話(≒誤解)について、解説しときましょ。


神話:「Googleにスキャンしてもらう図書館は、無料でスキャンしてもらえてラッキー」


そーんなわけないでしょ


"CICの契約書")を見て見ましょ。(他のどの契約書見ても同じだよ)

3.1 Costs paid by each CIC University.


In addition to costs mutually agreed upon by the Parties, each CIC University shall be responsible for the following costs: (a) those related to locating, pulling and moving the Selected Content to a designated location at the Source CIC University facility as well as re-shelving the Selected Content when the Digitization is complete, (b) those related to existing CIC University employees and agents whose participation is contemplated by this Agreement, (c) network bandwidth and data storage required by CIC University to receive all of the University Digital Copy, (d) any conservation efforts that Source CIC University elects to undertake on the Selected Content prior to Digitizing, and (e) barcoding and associated data entry to barcode the Selected Content.

ってな感じで、図書館サイドで負担しなくちゃならん費用として、5つ挙げられていて、

  • 本を本棚からスキャン現場まで往復させるロジ作業費
  • 図書館サイドの人件費
  • スキャンデータなどをもらった後のサーバーだとか、ネットワークの諸費用
  • 電子化前に本を修復したりする作業費
  • バーコードはっつけたり、付随するデータ入力作業費

ってなもん。よーく考えてみよー。大量の本を移動させる「ロジ作業費」がどんくらいなもんかってことを。


とまぁ、いろいろと大変で、とても「ラッキー」なんて言ってる場合じゃない*4。ここを勘違いすると、Peterの言う「食い物にされてる」って意味が少し分からなくなる(かも)。だって、ただでGoogleがスキャンしてくれんだったら、別にやってもらえばいいじゃん、ってことになりかねない。


本題に戻ると、結局、Peterは何を問題にしているかと言うと、

CICには多くの公立図書館が含まれており、その図書館の費用負担は、税金から出ている。データがエスクローに入ったまま、Googleしか利用できない状態が続くようなプロジェクトに、税金を投入してよいものか

ってこと。それゆえ、「(Googleは)図書館を食い物にしてんだぞーぃ」と書いた。


ところが、このPeter発言に対して、2日後の6月15日に、ひとつの反論があった。続きは次回に続く。


そんでもって、今日のところは、結局何が言いたいのかっていうと、「これから電子化の荒波へ突き進む日本よ、エスクローなどを含む先人の知恵をまーなびーましょ」ってこと。

*1:私がひとりで勝手に呼んでまーす

*2:おそらく日本では、あーそーなんだ、ってことで無事終結したはず、ところが米国では。。。

*3:こりゃなんじゃ、って話は後半で

*4:http://radar.oreilly.com/archives/2007/08/the_google_exch.htmlのPeter Brantley [08.23.07 05:42 PM] コメントをよーく読んでみてね。