Парсер скачивает и сохраняет книги в жанре фантастика.
Для работы необходим python версии 3.6+.
Установка зависимостей:
pip3 install -r requirements.txt
При запуске скрипта указывается первая и последняя страница библиотеки сайта. Аргумент file указывает на файл описания библиотеки:
python3 parse_tululu_category.py --start_page %start_page% --end_page %end_page% --file %description.json%
Если не указать аргумент end_page парсер пройдёт до последней страницы.
После работы программы папка books/
содержит книги, папка images/
- обложки книг, файл description.json
- описание скачанной библиотеки.
Структура файла с описание библиотеки:
[
{
"title": "Название книги",
"author": "Автор книги",
"img_src": "images/обложка.жпг",
"book_path": "books/книга.txt",
"comments": ["комментарий1", "комментарий2"],
"genres": ["жанр1", "жанр2"]
},
]
Код написан в образовательных целях на онлайн-курсе для веб-разработчиков dvmn.org.