Skip to content

lisongxi/eastWealthCrawler

Repository files navigation

基于Asyncio实现对东方财富股票数据爬取

实现

1,爬取股票板块历史资金流

2,爬取股票板块历史价格信息

3,爬取5000多个股票的历史价格数据

运行

1,创建数据库

创建eastwealthcrawlerMySQL数据库

用户密码在settings.ymal文件里面修改

2,启动

main.py ,直接运行

scheduler.py ,可执行定时任务

结果

数据库

板块资金流

img_1.png

板块历史价格

img_2.png

5000多个股票历史数据(每个股票大概1000行,总共四百多万行)

img_3.png

补充

s_block包下面有一个blockCrawl_gevent的文件,利用了 gevent 库进行高并发爬取数据。但是我并不提倡高并发爬虫,这对目标网站不友好。

使用gevent短时间发起大量请求,会被目标主机强行关闭连接。如有学习需要,最好自行购买IP池进行爬取数据。

About

爬取东方财富

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages