Skip to content

分布式抓取东方财富股吧2000多支股票的信息

Notifications You must be signed in to change notification settings

donadonny/guba_distribute_crawler

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 

Repository files navigation

guba_distribute_crawler 分布式抓取东方财富股吧2000多支股票的信息

利用scrapy,mongodb,scrapy-redis,redis抓取东方财富网股吧的帖子数据

项目环境:

需要的软件

  1. scrapy 0.24.6
  2. mongodb 2.6.11
  3. redis
  4. scrapy-redis

用到的python库:

  1. pymongo
  2. redis

针对windows下的环境下的特殊处理,运行批处理文件进行环境的搭建

  1. 1_set_environment.bat
  2. 2_run_server.py
  3. 3_run.bat
  4. 4_clear_environment.bat

需要注意的是在windows下pip安装软件会特别的慢,为了快速搭建环境,建议用库中提供的pip.ini代替本身的pip.ini

项目实验主机使用windows+ubuntu,由于mongodb的原因,系统全部使用64bit

About

分布式抓取东方财富股吧2000多支股票的信息

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published