JISC の規格文書を最大限活用するスクリプト

最終更新日

せこいこと言ってないで配布してくれればいいのにね.

スクリプト

JICS で JIS の規格文書を閲覧できるけどダウンロードはできない.曰く「この規格は,著作権法で保護対象となっている著作物である」とか何とか🤷 あまりにも不便なので一括で画像を取得して PDF を生成するスクリプトを書いてみた.

#!/bin/bash

# const
URL="https://www.jisc.go.jp"
width=1200 # 画像の幅

# params
src="*************" # 画像 src の ?pageNo 以前

# download iamges and delete watermarks
i=0
while true
do
  wget -O $i ${URL}${src}?pageNo=${i}\&width=${width} || break
  convert $i -level 0%,90% ${i}_leveled.png
  i=$((i+1))
done

# generate PDF
convert `ls -v *_leveled.png` pdf.pdf

exit 0
画像の src はブラウザで調べてください (要ログイン)

参考

  1. スクリプトで使ったもの
    1. ImageMagick を使って jpeg ファイルを PDF 化する | Linux Magazine
    2. 【シェルスクリプト】コメントの書き方 | server-memo.net
    3. bash — 404を取得した後、「wget」をどのように停止しますか?
    4. bashでexprを使わずにインクリメント処理する。 – oxdbのブログ
    5. シェルスクリプトで文字列と変数を連結する | ハックノート
  2. スクリプトで使ってないもの
    1. bashで連番を生成する方法(ブレース展開) – Qiita
      1. for i in {0..10} のブレース展開って #!/bin/sh だと使えないのね…!
    2. ブレース展開に変数を使う(実行例). eval を使えば解決!
    3. for 文の使用方法 | UNIX & Linux コマンド・シェルスクリプト リファレンス

コメントを残す

%d人のブロガーが「いいね」をつけました。