Skip to content

選定図書総目録CD-ROMのデータ変換ツール

License

Notifications You must be signed in to change notification settings

CALIL/jlaselect

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

28 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

jlaselect Maintainability

日本図書館協会選定図書総目録CD-ROMのデータ変換ツール

概要

  • 日本図書館協会選定図書総目録のデータを使いやすい形に変換
  • 抽出したデータはLine-delimited JSON形式で保存
  • 図書選定事業は2016年3月に終了しています

依存パッケージのインストール

poetry install

コマンドライン

  • 各CD-ROM内の"JBISCS"ファイルをコピーする
  • 複数ファイルをまとめて処理する場合は、プログラムを直接修正する
poetry run python jlaselect.py > jlaselect.jsonl

サンプルデータ

{"year": 1999, "isbn": "426701535X"}
{"year": 1999, "isbn": "4121014995"}
{"year": 1999, "isbn": "4876386749"}
項目 概要
year Number 選定された西暦
isbn String 正規化されたISBN(ISBN-10)

処理済みデータのダウンロード

jlaselect.jsonl 130,702件 (2019年8月21日公開)

  • 処理に用いた元情報は以下の通りです

    タイトル ISBN 期間
    選定図書総目録59 9784820408109 2003年1月~2007年12月
    選定図書総目録64 9784820413103 2008年1月~2012年12月
    選定図書総目録67 9784820416043 2011年1月~2016年3月
    1996年~2010年の児童図書
  • 1996年~2016年3月の20年間のデータを統合していますが、全データの範囲は2003年1月~2016年3月となります

  • 過去に発行されたCD-ROMに含まれてるデータのうち、選定図書目録58に収録されている2002年1月~2002年12月分が含まれていません(入手困難であったため)

  • ISBNの付与されていない選定図書は除外されています

  • yearが0となっているデータが一部あります

  • このデータは「単なる事実」の集合であり著作権の対象外です

About

選定図書総目録CD-ROMのデータ変換ツール

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages