###CRAWL 一个简单的爬虫项目。
######使用
- 将本项目下周到本地: git clone [email protected]:winterZhao/crawl.git
- 安装依赖 npm install;
- 执行 npm start;
- 本地新建数据库 'crawl';执行新建表的内容,表结构在
database
里; - 浏览器窗口开启 'localhost:3000';
######项目内容
-
发出HTTP请求获取指定数据;
-
使用jQuery语法操作网页元素;
-
将数据保存到mysql;
-
建立web服务器展示;
-
自动执行更新任务;
#####所需模块
- async;
- request;
- iconv-lite //作用:将gbk编码格式转换为utf8
- cheerio //node端操作DOM元素
- crontab //按照一定时间自动执行某项任务,类似setInterval;npm install cron;
- debug //日志记录器;
- child-process //用于启动一个新的子进程; 【node是单线程单进程的】:无法做到多进程,但可以开个子进程;