文化の根幹をなすのは「知の共有」だ――第4回【後編】

千人回峰(対談連載)

2007/02/06 00:00

富田倫生

青空文庫 創始者 富田倫生

グーグルとは発想が違う

 奥田 富田さんにも執筆してもらっているBCN紙の「視点」というコラム。この06年9月25日号の「視点」でジャーナリストの原淳二郎さんが、グーグルが電子図書館に出てきたら、青空文庫はひとたまりもないだろうと書いています。どうなんですか。

 富田 その記事は私も読ませていただきました。グーグルが青空文庫を吹っ飛ばしてくれれば、私たちは引退。肩の荷が軽くなるなと楽しみです(笑)。でも、明日にも楽できると期待して、よいのでしょうか?

 グーグルにしろ、アマゾンにしろ、彼らはあくまで紙の本の存在を前提にして、そこに検索の網をかけようとしているようにみえる。具体的には、本のページをスキャンした画像と、OCRにかけて得たテキストのデータの組み合わせを、ファイルの基本単位にしています。読んでもらうのはあくまで画像で、テキストの精度は必ずしも求めていない。「何がどこに書かれているか」ざっと検索できれば、それでいいと割り切っているようです。

 一方、青空文庫では、転記作業ミスによる誤りはついて回るけれど、目標は「間違いのないテキスト」に置いています。いったん精度の高いテキストを作っておけば、パソコンに限らず、携帯やゲーム機、電子辞書等にも簡単にもっていけるし、もっていった先でも安心して読める。視覚障害のある人は、音声に変換したり、極端に大きな文字にして作品に触れられる。点字の基礎データとしても使える。将来的には、自動翻訳と結びつく可能性だってある。コンピュータの力をフルに引き出して、電子的な読書環境の可能性を広げるには、画像ではダメ。正確なテキストが必要なんだと腹をくくって、作業しているわけです。そうした考え方が、グーグルのアプローチで吹っ飛ぶとは、思えません。

 ただ、正確なテキストづくりが、ボランティアにしかやれないかといえば、そんなことはない。OCRの精度がさらに上がり、しっかりした基盤をもった組織なり企業なりが、工業生産的にテキスト化を進め始めれば、そしてその成果物が本当に自由に利用できるようになれば、青空文庫には存在理由がなくなる。そうなったら、私たちは消えればいい。

 私たちがほしいのは、社会に根づいた、電子アーカイブという名の公有作品の樹です。電子的な環境が今後ますます整って、この樹からさまざまな方向に枝が伸びて、いろいろな形で果実をもぎ取れるようになってほしい。こうした樹を社会に育てる最初の段階で、ボランティアの身軽さで、その価値を実証して見せることが、青空文庫の役割じゃないかと思います。いつ誰に吹っ飛ばされるかなんてことは心配しないで、その役目が終わるまで、淡々と作業を続ければ、それでいいと思うんですよ。(おわり)

前へ

  • 1
  • 2

Profile

富田倫生

(とみた みちお)  広島市生まれ。早稲田大学政治経済学部政治学科卒業。編集プロダクション勤務を経て、ライターに。ノンフィクションのさまざまな分野を取材対象としてきたが、次第にパーソナルコンピュータの比重が高まる。ボイジャーのエキスパンドブックを見て電子出版の可能性を本気で信じ込むようになり、「パソコン創世記」と名付けたタイトルを、コンピュータで読むことを前提に制作。このブック上の記述を、インターネット上のさまざまなホームページにリンクさせていくという作業を体験してからは、電子本への確信をさらに深めている。  著書に、「パソコン創世記」(旺文社文庫、TBSブリタニカ)、「宇宙回廊 日本の挑戦」(旺文社)、「電脳王 日電の行方」(ソフトバンク)、「青空のリスタート」(ソフトバンク)、「本の未来」(アスキー)がある。