※ $このブログでの--> { 現代芸能考察について覚書 } [ 2011-03-03 ]

@女芸人売れMG考察 = [ $稲垣早希{吉本}、$鳥居みゆき{サンミュ}、$いとうあさこ{マセキ}、 $おかもとまり{太田}、$イモトアヤコ{ナベ}、 ] [ 2011-02-09 ]

芸能IT政治トつ国下層


2009-10-24

日経ソフト「簡単10分PGレシピ」をScanSnap S1500でやると検索も簡単やで! 2009_10_24_[SAT]



2009_10_24_[SAT]






ドキュメントスキャナーのScanSnap S1500。

以前からあるのは知っていたけども、値段的に裁断機とを合わせると10マンゼニー近くするのでグッと我慢していたのだが

「やねうらお」さんのブログを見て物欲限界になり「ScanSnap S1500」の楽2セットと裁断機PK-513Lに1TのHDDを買ってもうたで!

なので必然的に 金が無く赤いNetwalkerは買えなくなった。

無念。

で、早速使ってみたんだけども、思った以上にScanSnap S1500は、コツとか掴むまでは時間が掛かりそう。 単行本はスムーズだけど雑誌は結構スキャンに手間取る。

考えていた以上に時間を費やしそうだから、パターンを掴んだ後は時間を見ながら効率よくデータ化していく予定。

あと初日から、裁断機PK-513Lに定規を突っ込んだまま切断して刃がーーーー。 初日で刃が・・・あほすぎる。 泣きそう。

とりあえず、最初に使ってみて慣れると言うかコツを掴むまで色々試してみる 自分用メモ。


---------------


--目次--
  1. まずは、スキャン用の素材。
  2. 裁断機で背表紙から5mmほどカット。
  3. スキャンを掛けてPDFにします。
  4. 検索可能なPDFに加工。
-----------------------

  1. まずは、スキャン用の素材




    今回は日経ソフト2009年12月号の付録。

    変形A4サイズの「完全保存版!かんたん10分PGレシピ」約60ページを本当に 完全保存してみたい。




  2. 裁断機で背表紙から5mmほどカット




    裁断機PK-513Lで切り落とします。

    枚数が多いものは、大体50枚づつぐらいに分けて裁断します。今回は30枚程度なので一気に落しましょう。

    ちなみに自分も裁断機PK-513Lを、ヤホーで検索して31000円で買いました。

    あと個人的な情報ですがオイチャンは、 裁断機のゴミ取り用にしていた定規を突っ込んだままで裁断をヤッテしまい 刃がやられました。

    自分のバカさに悲しくて涙もコボレます。

    って上手いこと言ってる場合じゃない!



    裁断後は、スキャン時に紙を2枚送りなどしてジャグらないように紙と紙の間に隙間を作るように 紙をシゴクというのかシャギシャギします。≪たぶん正しい呼び名があるんだと思いますが≫

    お札を広げるときにやるような動作を上下で行って、最初に送るページが若干前に出るような感じにやると なんとなくジャグる率が下がって上手くいく気がします。

    読み取り後半でジャグるとイラッとします。音楽でも聴きながら落ち着いた精神でやるといいでしょう。




  3. スキャンを掛けてPDFにします。




    今回は60ページ30枚程度を一気に掛けます。

    あらかじめドライバやソフトを入れて セッティングしているとドキュメントスキャナーのScanSnap S1500のフタをあけると自動認識して スタンバイになります。

    差し込み方は、FAXと同じで若いページを一番下にして頭から突っ込みます。

    青く光っているボタンを押すとスキャンが始まり、一枚づつ送って読み取っていきます。



    読み取りが終わると、加工の選択にScanSnapのOrganizerをとりあえず選択するとこんな感じでPDF化して取り込んでくれます。

    漫画とかの場合は、とりこんだ画像で直接JPG化した方が早いかもしれませんが、それ以外はいったんPDF化しておいてから変換で 対応が加工しやすいのかなぁ。がファーストインプレッションでした。



    拡大するとこんな感じで、ベタのPDFで集められてサムネイルでとりあえず表示されます。

    今回は一気に取り込みましたが、分割で取り込んだ場合はココからScanSnapのOrganizerビューアーで表示しながら 「編集」-->「ページの挿入」-->「最後に追加」で合体させていきます。




  4. 検索可能なPDFに加工


    おそらく、ココからがScanSnap S1500を欲しくさせる最大の要因になるOCRで文字情報にして検索可能なPDFに再加工します。

    ScanSnapのOrganizerの右端にある「検索可能なPDFに変換」という長いタイトルのボタンで 選んでいるファイルのみか、フォルダにある全部のファイルを加工かを選択します。



    次に処理選択で「テキスト情報の埋め込み範囲」と「マーカー部分の文字列処理」を決定し、

    実行のタイミング「すぐ実行」か「PCのアイドル時間」 かを指定してOKを押すと

    なぜか並列処理されられないみたいだ。なにか別の方法があるのかな?今のところわかんない。



    一枚ずつ文字変換して



    最後に全体で関連付けをしていくので結構な時間が掛かる。【やね】さんも言ってた通り、あえず一気にPDFを作っておいて「検索可能なPDF」に加工するのは休憩や就寝中にまとめてしたほうが効率がいいと思う。



    パッとみたところ7から8割は正確に文字情報化できている気がする。

    これで、デジタル本を持ち運べて横断して検索とかも掛けられるようになって便利。

    あとは、結構な時間を掛けてやる根気。







━━━━━━━━━━━━━━━━━