2010年7月17日土曜日

自炊電子書籍作成に便利な一括画像処理バッチ


このエントリーをはてなブックマークに追加


紙の本をスキャンして電子書籍化する際に便利な一括画像処理のスクリプトです。

ImageMagicを使ってますので、使う場合は事前にダウンロードしておきましょう。
http://www.imagemagick.org/www/binary-releases.html#windows

image-conv.bat
---------------------------------------
@echo off

set TODAY=%date:~-10,4%%date:~-5,2%%date:~-2,2%
set time2=%time: =0%
set NOWTIME=%time2:~0,2%%time2:~3,2%%time2:~6,2%

rem ここに出力先のディレクトリを指定する。
set OCRDIR=Z:\temp\ocr\%TODAY%_%NOWTIME%

mkdir %OCRDIR%
for %%i in (*.jpg) do C:\Tool\ImageMagick-6.5.8-6\convert  -monochrome -quality 100 -crop 2400x3436+40+30 %%i %OCRDIR%\%%i
---------------------------------------
*色が付いているところを自分の環境に合わせて変更する。
このバッチを、画像ファイルが保管されたフォルダに入れて実行すると、
そのフォルダ内の全てのjpgファイルに対して変換処理を実行する。
変換されたファイルは元のファイルと同じ名前で別ディレクトリに保存される。

■ -monochrome ・・・画像をモノクロ変換する(OCR認識率を上げることができる)
■ -quality 100 ・・・jpgの圧縮率。100は読み込み元と同じ圧縮率を保つ。
■ -crop 2400x3436+40+30 ・・・画像の左上から、横40px、縦30pxの位置から、横幅2400px,縦幅3436pxを切り出す。つまり画像のふちをカットすることができる。

その他参考
■ Acrobat 「ClearScan」のポイント
■ 裁断した書籍をスキャンする時のポイント
■ 書籍の電子化

0 件のコメント:

コメントを投稿