spiegel-scraper

Scrape articles and comments from DER SPIEGEL

Setup

pip install spiegel-scraper

Usage

from datetime import date
import spiegel_scraper as spon

# list all articles from 2020-01-31
archive_entries = spon.archive.by_date(date(2020, 1, 31))
# or, for later replication, retrieve and scrape the html instead
archive_html = spon.archive.html_by_date(date(2020, 1, 31))
archive_entries_from_html = spon.archive.scrape_html(archive_html)

# fetch one article by url
article_url = archive_entries[0]['url']
article = spon.article.by_url(article_url)
# or alternatively using the html
article_html = spon.article.html_by_url(article_url)
article_from_html = spon.article.scrape_html(article_html)

# retrieve all comments for an article
comments = spon.comments.by_article_id(article['id'])

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
spiegel_scraper		spiegel_scraper
.gitignore		.gitignore
README.md		README.md
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

spiegel-scraper

Setup

Usage

About

Releases

Packages

Languages

ietz/spiegel-scraper

Folders and files

Latest commit

History

Repository files navigation

spiegel-scraper

Setup

Usage

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages