HOME > モノ・インプレッション・トップ > 028 電子書籍、自炊をしてみた!~3時間でシステムを確立 

028 電子書籍、自炊をしてみた!~3時間でシステムを確立
断裁機:PLUS PK-513L
ドキュメントスキャナー:富士通 ScanSnap S1500
リーダー:APPLE iPad

2010年12月12日:初掲載
2012年 2月15日:最新版
この文章はまだまだ進化途上。新しい情報が入り次第、加筆していきますね。

このサイトはフレーム対応となっています。
フレーム機能つきのブラウザでご覧の方はこちらをクリックしてください
そうでない方はこのままご覧下さい。



自炊した本、iPadのアプリ、i文庫HDで読むと…。
ご覧のように実際の本のようにページをめくることができます。
 




【はじめに】

最初に断っておきます。

KAY2は本が好きです。そして、それは紙の本が好きだと言うことを意味します。新刊本を手に入れKAY2が最初にすることは匂いをかぐことなんです。そう、あの本独特の香りが大好き。したがって、匂いのしない電子書籍なんて「まっぴらごめん…」と思っていたのですが…。

電子書籍元年と言われる2010年もあとわずかになった11月末から12月上旬。実はそんなKAY2の哲学を変えてしまうことが起きてしまいました。

そーなんです。電子書籍。この世界に足を踏み入れてしまいました。しかも、「自炊」と呼ばれる、自分で本を電子書籍化してしまうということを!そして、それもある1日の3時間で一気にその体制を作り上げました。

きっかけは、2010年、9月のある日でした。


2010年9月23日 

KAY2の知り合いにとてもオシャレな人がいます。見た目もオシャレなんだけれど、実生活もオシャレ…と聞き、彼の住む素敵なマンションにむりやりお願いしてKAYSの二人、招待してもらいました。そのマンション、都内の有名なタワーマンションです。

その彼の部屋がまた素敵。実に趣味の良い家具が配置され、その窓から見下ろす都内の夜景は最高…。

で、部屋には静かにBGMが流れています。彼は音楽がとても好きなのにも関わらずマンションにCDなんて一枚も置いてない。そう、全部マックの中に入っており、無線LANで飛ばし、リビングに置かれた小さなBOSEのラジカセから聞いている…。うーん、この割り切り、凄いカッコイイ。

とにかく、シンプルのひと言。まるでマンションのモデルルーム。生活に必要な最低限のモノしか置いてないんです。新聞も、雑誌も、本も…、あれ?本は?と尋ねると「PCで見ますから…」

このひと言が激しくKAYS、特にKAY1の心の中にこだましました…。KAY1、もともと「しんぶる・いず・ざ・べすと」な人です。

そっか、電子書籍なんだ!

ひるがえって我が家。本の山、山、山、山、そして山…6つの本棚に入りきらず、押し入れにも、ベッドの下にも。そして、うずたかく床にも積み上げられています。それでも増え続ける本。実家に送ったりもしています。

捨てるか古本屋さんに売ったら…とKAY1はかつてKAY2に言ったのですが、KAY2、時々「あ、あの本を読み返したい!ということがあるじゃない!」ということで…。

その負のスパイラルからもしかして抜け出せるかも…。そう2人は思ったのです。


【Kindle(キンドル)との度重なる出会い】 
2010年10月12日


 昨日、仕事の知り合いのカナダ人、ニコニコしながらやってきました。
「KAY2、最近なにか面白いオモチャ買ったか?」
「うーん、いいところに来たね、ポメラっていうんだ」
と彼に見せつけていたら、彼も
「俺もオモシロイもの買ったぞ、見てみろ!」
と取り出したのが薄い板状のもの。お、どこかで見覚えが…。
そう、amazon の販売している Kindle (キンドル)でした。彼はとても自慢そうに、いかにこの機械が凄いかを力説。確かに視認性もよく、驚くほどシャープな画面です。それでいてバックライトもなく、バッテリーの持ちもいい。何よりも軽いのは素敵です。ただ、英語のみなんですよねぇ…読めるモノが…。

 で、翌日、別の知り合いと酒を飲んでいたんです。もうリタイアした仕事上の先輩で、物腰の柔らかい、素敵なジェントルマンです。その彼がワインを飲みながら、鞄からなにやら取り出します。「KAY2さん、僕、最近これにはまってて…」
 なんと、Kindle (キンドル)でした。そして、彼も熱く熱く語ってくれます。その魅力。
「英語しか読めませんよね」と思わず問いかけます。彼はアメリカで思春期から青年期を過ごしました。従って、読書の多くが英語なのです。
「いや、PDFファイルにしたものであれば、日本語も読めますよ。ほら、最近「自炊」ってあるでしょ。ああした形で自分で持っている本を電子書籍化しちゃえばいいんです。」

 ここに至って、気持ちがさらに傾きました。うん。


【電子書籍化への道筋】
2010年11月某日



これがH君も使っている自炊の世界での定番断裁機。

KAY2の別の知り合い、H君。年齢が一回り若いのですが、実は、KAY2にとっては師匠のような存在。仕事上もそうですが、何年も前にレーシックを勧めてくれたのも彼でした。超優秀で、しかもきわめて合理的な思考の、シャープな人です。その彼が数年前大きな断裁機を買い、自宅の本をスキャナーで取り込んで電子書籍化しちゃったという話を聞いていました。そのときは聞き流してしまったのですが、先日の「Kindle(キンドル)事件」でそれを思い出し、彼に尋ねてみます。

「いいですよ。おかげで我が家はすっきり。費用は初期投資はかかるけれど、その後はずっと継続的に使えるわけだし。」

そこで、彼と同じシステムを組むことを考え、ネットで調べてみます。すると、まず電子書籍を読むためのシステムとしては上記、Kindle の他に今年話題沸騰した iPadもありますし、それ以外にも各社新製品を投入しつつあります。ただ、その電子書籍のファイルそのものが各社オリジナルなモノを使ったりしており、まちまち。まだ決定打はないようです。これは困ります。ベータとVHSの戦いを思い出すまでもなく、標準化されていないところに首を突っ込むのは火傷のもと。

ただ、実は抜け道があり、それが、上記、PDFファイル。あるいはJPEG。多くの機種がこうしたファイルは読み込むことができるようです。そして、これであれば、ほぼ、PCの世界では標準的なファイルであり、将来にわたって廃れる心配はなさそうです。ということは、H君の方法…書籍を断裁して、スキャナで取り込み、それをPDF、もしくはJPEGファイルにするという方法は合理的だといえそうです。

また、書籍のデータを電子化するには、現在、断裁機はプラスの PK-513L、そして、スキャナは富士通の scansnap S1500 というのが定番だそうです。この「定番」があるというのはありがたい。そんなに迷う必要がないわけですから。かつて1980年代にパソコンを買うならNECの9800シリーズという時代がありました。事との是非はともかくも、買い物をするのに分かりやすかったのは確かです。

で、そんなある日、テレビを見ていたら、まさに、その「自炊」をリポートしていました。そこでは、都内の青年が、断裁のみ業者に依頼し、あとは自分でスキャナーを操作してPCに取り込んでいました。

ふーん、そっか。業者さんもいるんだナ。

そこで、インターネットで調べてみるとすぐに何社か引っかかります。断裁からPDF化まで完全にやってくれる場合、一冊当たりの価格は100円から200円程度と分かれますが、実は、表紙取り込みとか、テキスト検索が可能になるOCR処理などのオプションがあり、それを加えると、各社ともほぼ250円程度となるようです(2010年現在)。結構な値段がします。

で、その中からさらにブログなどで評判の良い一社を選び、試しに段ボール1箱分の本を送ってみることにしたのです。その会社、大阪にある、「snapbook」と言います。


11月29日

H君に尋ねてみます。
「Kindle 使ってる?」
「いいえ。僕は iPad ですよ。やっぱり少しサイズの大きな本はKindleの小さな画面ではホントに小さくなってツライから。もちろん拡大もできるけれど、そうなると全体が見えなくて面倒でしょ。雑誌とかも見るんだったら絶対 iPad ですね。」
なぁるほど。
「もしKAY2さん、iPad を買うことを考えていて、しかもそれが WiFi のみのモデルだったら、急いだ方がいいかもしれません。まもなく3Gモデル以外は販売終了になるというウワサですよ」
うーん、このひと言も気になる…。(結局、これは分割払いでの販売が終了ということだったのでしょう。12月12現在、WiFiモデルは分割払いでの販売が終了し、現金払いのみとなっています)


11月30日

snapbook、まず会員登録します。その上で送りたい本の冊数を入力。まず実験として、段ボール1箱。結局様々なサイズの本を合計すると65冊。ただし、その会社の規定で350ページを超える書籍は2冊としますから、全部で67冊。snapbook のページで入力し、合計金額を見ると17000円ちょっと。一瞬、ためらいます。1冊250円もこれだけの分量になれば、結構金額がかかるものです。そっか、今回は試しにということでお願いするのだけれど、まだまだ数千冊ある我が家、これは、全部業者におまかせすると破産してしまいそう。手がかかってもある程度は自炊する必要が絶対にあります。おまけに1冊500円程度のコミックを250円かけて電子書籍化を依頼するのも馬鹿らしい。値段の安い本については、やはり自炊ですね。

さて、入金確認がとれたこの日、snapbook に全部で67冊(350ページを超えた本を2冊と計算した結果)を宅急便元払いで送りました。


12月 4日

PDF化完了のメールを受け取り、ダウンロードしてみます。ZIPファイルと本ごとのファイルと両方を snapbook のサイトから自分でダウンロードします。もちろん、有料のDVDでの返却もあるのですが。ここはまず自分で。

そして、PDFファイルを開けてみると、ほぉ、きちんと、表紙もカラーで取り込まれていますね。

で、ファイル名は単に数字の羅列になっているので、それを書名に自分で変えていきます。もちろん、この作業も有料でやってくれるのですが、今回はあくまで自分で…をつらぬきました。あとで検索しやすいように「書名_著者名.pdf」という形式にしておきます。

で、確認のためにPC上で一冊一冊開いてみるのですが、以前読んだ本、ついつい、読み始めちゃうんですよね。やっぱり、捨てないで良かった!と思う瞬間です。

それから、OCR化しているので、検索をかけてみます。実は書籍によって段組など、様々なレイアウトがあり、OCRにとって苦手なものもあるため、必ずしもきちんと処理されないと例のH君から聞いていました。ですから、それほど期待をせずに試してみます。すると、うん、短い単語ならそこそこちゃんと表示されます。が、少し長い語句になるとこちらは難しいようです。ま、それでも実用範囲ではないかと思います。


【一気に機材をそろえる】

12月 7日

昨夜、KAYS家の予算審議会でGOサインが出ました。よかったよかった。ただしKAY1からひと言。「まずはKAY2のへそくりで買いなさい。その後有用であると認めれば、国家予算からの支出を許す」との御託宣。そこで、断裁機、スキャナと購入。さらに kindle と iPadも。もうなでもござれという雰囲気で久々に凄い買い物ですね。断裁機とスキャナ、意外とアマゾンが安いことも判明。ヨドバシに比べればそれぞれ1万円近く安いのです。まぁ、ヨドバシはポイントがあることを考えても、それぞれに4000円程度の差があることになります。へそくりではもちろん足りず、国家予算に借金までしちゃいました。

Kindle に関しては出荷は1月以降になるとのこと。結構かかるものですね。クリスマスシーズンだからでしょうか。また、最初にUSアマゾンのページから普通に入ったのですが、肝心の支払いの直前で、門前払い。Kindle の通信仕様の関係で、日本向け製品の別ページから改めて入らねばなりませんでした。

いずれにしても、明後日、12月9日は久しぶりのお休み。この日に一気に「自炊」のセットアップをして第一号を完成させようと決意します。


12月 8日

アマゾンは早い…。今日夕方には断裁機、スキャナ共に届きました。



12月 9日 いよいよ3時間で初自炊システム完成

YouTube の威力は絶大です。スキャナ、断裁機ともに使い方を説明した動画があります。それを見て予習。

iPad も朝、届きました。

では本日のミッション開始。

午前11時。まず断裁機とスキャナーの箱ををあけてセットアップ。

断裁機は箱にも書かれていますが、箱を開ける際、レバーが跳ね上がるので(一応、箱に針金で結んでありますが)、注意が必要。それにしても…重い!ひよわなKAY2は持った瞬間、足が攣ってしまいました。

スキャナーは思ったより小さくて、これは嬉しい誤算。物凄くコンパクトです。これで、A4(書類を折り曲げて専用のフォルダーに入れたらA3も)まで読めてしまうのですからたいしたものです。

添付のDVD-ROMからインストールをするのですが、結構ファイルサイズがあるのか、時間がかかります。珈琲を飲みながらゆっくりと完了を待ち、そして、ついでに、オンライン登録もしておきます。その上でさっそく添付してきた書類を試しに一枚スキャン。ほぉ、あっという間。見事です。もう一枚のDVDーROM、「Acrobat」 は必要に応じてインストールしますが、とりあえず、電子書籍化のみであれば、必要はありません。

いよいよ自炊初体験。

まずは、断裁機。記念すべき第一号は文春新書「こわい病気のやさしい話」山田春木著。名著です。山田先生、本をバラバラにしてしまいます。ごめんなさい。


中に入っているしおりなどは取り除いて…。

断裁はあっという間。ところが、切れ目を見ると、黒く汚れています。ありゃりゃ、これは紙押さえ、もしくは歯に油がついている様子。みなさんもご注意を。かといって、手で布を持って拭き取るのは危ない。そこで、綿棒で…。

そしてスキャン。一応、念のため最初は50枚ずつスキャン。紙送りのミスフィードが以前は多発して、ページが飛んでしまうことがあったそうなんです。現在の機種は改良されているとの話ですが、念のためです。


読み取りは速い速い!1分に20枚ということは40ページ!

ScanSnap Organizer という付属のソフトが立ち上がり、読み取ったものをPDF化して、表示できます。最初の設定ではファイル名は読み取った日時となっています。さっそくできあがりとページ番号を照合して…。あれ、読み取ったページ数が少ない?再度確認。なんと何も印刷されていないページを自動的に飛ばしていることが判明。お利口ですねぇ。もちろん、白紙を飛ばさない設定もあとでできます。その方が枚数確認には便利ですよね。

で、読み取り精度ですが、最初の設定では、一応問題はないのですが、拡大すると、結構、文字、つぶれています。これも後で、少しdpiをあげてやった方がいいかもしれません。

で、このままではテキスト検索ができないので、できあがったPDFファイルをすぐにOCR処理をかけます。とりあえずは ScanSnap Organize に付属の機能でOCRをかけました。これもそれほど時間はかからずに終了。

さて、今度は1冊を4回にわけて読み取ったので、ファイルを一つに統合します。最初、ScanSnap Organizer でのそのやり方が分からなくて、サポートに電話してしまいました(比較的簡単に、待たされずにつながりました)。実はこれ、ScanSnap Organizer で最初のファイルを開いたら、「ページを挿入」というボタンがありますので、それを押して「最後に挿入」で、次々に続きを結合していけばOKです。「結合」という文字にとらわれすぎちゃった結果のとまどいでした。

ただ、実際は最初の設定で、「継続読み取り」をオンにすることで、何度か分けて読み取りをしても一つのファイルにすることができるということを後で知りました。

ここで午後1時。一旦昼食。

さて、午後1時半。今度は自炊した本を端末で見る方法です。

iPadです。

まずは本格的に使用する前に、指紋で表面がべたべたしないようにと、液晶保護フィルムを貼り付けます。

数センチ、裏紙から剥がして表面に、お、ホコリが一つ。そこでホコリブロワーをiPadに噴射したたところ勢い余ってフィルムにも、すると瞬間、変色!ありゃりゃ、あわてまくり、布でふいたから…そうなんです。フィルム。思いっきり布の繊維をひっつけちゃいました!1300円もしたのに!これで一貫の終わり。みなさんも、くれぐれも気をつけて下さいね。

そこで、仕方なく、剥がして、とりあえず、フィルムなしで使用。

続いて設定。とにかく、わかりやすさが身上の Apple 製品。iPad も例外ではありません。もともと iPOD ユーザーであるため、すでに iTUNES を利用済み。そうなるともっとお手軽です。同期などの設定を済ませ、すぐに電子書籍の閲覧ソフトとして名高い i文庫HD をアップルストアで購入。とにかく、このソフト、日本語の書籍を読むには最高との評価の高い定番ソフトだそうなんです。しかも値段はわずか800円なり。

iTUNE でダウンロードし、iPad で利用できるようにし、開いて見て驚きます。すでに青空文庫(著作権の切れた作家の作品をボランティアの方たちが電子書籍化しているもの)の代表的な作品が予めインストールされているのです。びっくり。これだけでも一体何日、何ヶ月、何年たのしめるか!うわぁ、凄いですね。そして、実際に開いて見てみると実にページめくりがリアル!繰り返しますが、このソフト、800円なんて凄すぎです。この青空文庫のためにだけ iPad を買ってもいいくらい!

さて、肝心の自炊した本の取り込み方法、わかりやすい説明の素晴らしいサイトがありました。
立花さんという方の No Second Life というサイトです。
http://www.ttcbn.net/no_second_life/archives/2291

こちらのサイトに書かれた方法に従います。つまり、iTUNES を開いたPCと iPad を接続。そして、iTUNES の中の iPad の APP タブを開き、その中から i文庫HD を選び、追加ボタンを押して、自炊で作った本のフォルダーを指定し、iPad に移したい本をクリック。そして保存。これでOKなんです。続いて、iPad の方で、フォルダからその書籍を選び、読むだけか、それとも本棚に並べるかを聞いてきます。なんと簡単。素晴らしい!

i文庫HD のバーチャル本棚に無事「こわい病気のやさしい話」の表紙が入りました。まるで本物の書棚に並べたみたいに。



ということで、ついに完成!インターネットの先人達のおかげで、こうして、自炊、実に短時間に完成しました。午後15時、ミッション完了。作業時間、正味3時間。

いやぁ、ここにリンクを勝手に貼らせてもらいましたが、本当に素敵なサイトの皆さん、ありがとうございました!


【追記 1 ScanSnap での読み取り画質の設定】

どうやら、デフォルトの「自動設定」では原稿のサイズが大きくなると、白黒のdpiが200dpiに落とされます。そのため、活字がややつぶれがち。そこで、自分でdpiを少し上げることにしてみました。
現在の設定は「スーパーファイン」カラー&グレーが600dpi。白黒が300dpiの設定です。これなら、原稿の大きさにかかわらず同じdpiで読み取ってくれます。

  
こちらがデフォルトの200dpi。                        こちらは300dpi。見栄えがかなり良くなります。


【追記 2 コミックのScanSnap での読み取り】

カラーページはカラーで良いのですが、古いコミックの場合、紙が変質し、日焼けしていると、グレーで本来読むはずのページをカラーで読み取ってしまい、ファイルサイズがやたら大きくなりますし、見た目も良くありません。そこで、カラーページとグレーページをわけて、読み取り、最後にファイルを結合させるというやり方で現在読み取っています。


【追記 3 書見台の利用 2010年12月27日】

iPadを手に持ち続けるのは結構しんどいです。700g近くあるため、読書をしようとすると、何らかの方法が必要。もちろん、純正のカバーは便利で iPad 本体を立てて使用することもできます。でも、一番良いのは書見台(ブックスタンド)が便利です。昨今のタブレットブームのおかげか、様々な製品が安価で売られています。KAY2の場合は、ブログにも書きましたが、セキセイという会社の BH001ー62 という製品を使っています(amazon で974円)。



【追記 4 OCRの方式変更 2011年 1月24日】

 ScanSnap Organizer で読み取った書籍。それを Acrobat のOCR処理すると、ずいぶんサイズが軽くなります。しかし、それでも、i文庫HDなどで読む際に、やたらとページめくりに時間がかかる場合があります。書籍のサイズとはあまり関係なく、困っていたところ、こちらのサイトが参考になりました。inouetakuyaさんのブログです。
 http://d.hatena.ne.jp/inouetakuya/20100709/1278634808
 こちらの記事で紹介されている方法なのですが、Acrobat でOCRをかける際に、「Clear Scan」という形式を選択するのです。これは Acrobat 9 から導入されている機能だそうです。で、実際に比べてみると…ずいぶんページめくりが軽くなりました。よかった。で、以前業者に依頼した電子書籍のOCRはこの形式ではないので、やっぱり読み込みでストレスが溜まります。今後業者さんに依頼する場合はOCRのオプションははずし、PDF化のみしてもらい、OCRは自分でしたほうが良さそうです。


【追記 5 OCRでどれだけサイズが変わる? 2011年 1月24日】

 さて、上記OCRでどれだけサイズが変化するのか実験してみました。
 全部で120ページほどの文庫本。カバー部分、最初と最後のページがカラーです。それ以外の部分の読み取り方法とOCRの有無でファイルサイズを見てみると…
   本文がグレーでOCR処理なし     28.177MB
   本文が白黒でOCRは処理なし      7.828MB
   本文がグレーでOCR処理有り      7.302MB
   本文が白黒でOCRは処理有り      6.940MB
 というわけで、ファイルサイズが大きくなりがちなグレースケールの場合、OCR処理をすることにより、相当にファイルサイズが小さくなることがわかりました。なんと白黒に匹敵するサイズまで落とし込めます。今後、図版やイラストが少しでも入っている本の場合、始めからグレースケールで読み取っても良いなと感じます。


【追記 6 OCRの認識エラー 2012年 2月15日】

 その後、Acrobat でOCR化を必ずしているのですが、時折、「Paper Capture 認識サービスのエラー」というメッセージが出て、OCR化できない文書が出てきました。結局原因となっているページを見ると表紙など、デザイン的に凝ったモノの場合がほとんど。そこで、対処療法ではありますが、そのページを除いてOCR化しています。


最後に、あらためて、備忘録をかねて、数々の有益なサイトをご紹介。お世話になりました。

・ITmediaさんのサイト。まさに A to Z という感じですべてを網羅!
 http://www.itmedia.co.jp/keywords/ebookselfmaking.html
・ScanSnap の設定方法他
 http://d.hatena.ne.jp/inouetakuya/20100813/1281655901
・同じ人が書いた、断裁機使い方のコツ
 http://d.hatena.ne.jp/inouetakuya/20100512/1273624430
・青空文庫のkindle化
 http://www.kako.com/neta/2009-022/2009-022.html
・断裁機
 http://bungu.plus.co.jp/sta/product/office/papercutter/pk-513l.pdf
・ドキュメントスキャナ 富士通 scansnap s1500
 http://scansnap.fujitsu.com/jp/product/s1500/
・自炊技術WIKI これは網羅的。素晴らしいサイトです。
 http://wikiwiki.jp/bookjisui/?FrontPage
・年賀状をスキャンするとは!Good Idea!
 http://k-tai.impress.co.jp/cda/article/stapa/45018.html
・iPadのフィルム 気泡の取り方、ホコリの取り方
 http://www.micro-solution.com/pd/iPad/pgaf-iPad.html
・iPadでのBBモバイルの登録、実は結構大変な面が…。
 http://arkouji.cocolog-nifty.com/blog/2010/05/iPadsoftbank-wi.html



もしもここにあげた機種の組み合わせで自炊をされる場合、
この「大量の音楽・動画・本をiPhone/iPadに詰め込む本」
(三才ブックス刊)を参考にされると良いでしょう。
とても実感的でわかりやすい解説がなされています。
KAYSは自炊をかなり進めた後で本書を知り、
「この本を最初に買っていれば!」と思いました。



次ページ

TOPへ

KAYSトップ

inserted by FC2 system