防衛省・防衛研究所が公開している戦史叢書(全104巻)の画像ファイルをダウンロードし、PDFを作成します。
ダウンロードしたファイルの利用にあたっては防衛研究所のガイドラインに従って下さい。
また、Webサイトをクローリングするため、過剰なアクセスは控えて下さい。
できるだけWebサーバに負荷をかけないようウェイトを入れてありますが、このプログラムを利用する際にはその動作について十分に理解しているものと考え、それによって発生した問題について作者は責任を負いかねます。
ruby soshoget.rb [-a] [-v] [-p] [-s] [-o] get [巻番号]
巻番号: 巻数を指定します。2024年7月時点で1巻から104巻まで公開されています。
-a: 全ての巻をダウンロードします。30秒の間隔を空けるため、全巻のダウンロードには1時間程度かかります。
-v: 詳細な途中経過を表示します。
-p: ダウンロードした画像を結合してPDFファイルを作成します。ファイル名は巻のタイトルになります。
-s: ダウンロードした画像をページ毎に左右分割したものを結合してPDFファイルを作成します。ファイル名は巻のタイトルになります。
-o: 既にダウンロードされているファイルを再ダウンロードし上書きします。PDFも上書きされます。
出力先は カレントディレクトリ/downloads/[巻番号]
以下になります。
-sを指定した場合、横幅が1920ピクセルの画像のみ左右に分割されます。図表等も分割されてしまうので注意して下さい。
-pと-sを両方指定すると-pは無視されます。