pycurl_session

本项目是对pycurl进行了封装，目的是使pycurl可以像requests.Session和scrapy一样使用，但功能精简。
本项目是业余开发，功能上会不完善，请谨慎使用。
本项目没有发布到pypi等分发平台。

依赖

pycurl -- 主要
lxml -- 通过xpath解析html内容
cssselect -- 通过css解析html内容
certifi -- ssl获取证书位置

安装

下载项目内的目录pycurl_session到需要引用的地方。或者

git clone https://github.com/glamas/pycurl_session
cd pycurl_session
python setup.py install

使用

使用Session类，可以参考Session

from pycurl_session import Session

s = Session()
r = s.get(url)
print(r)
r.save("test.html")

使用Schedule类，可以参考Schedule

from pycurl_session.spider import Spider, Schedule

class Test(Spider):
    def __init__(self):
        self.start_urls = []

    def parse(self, response):
        self.log(response.title)

if __name__ == "__main__":
    settings = {}
    schedule = Schedule(settings)
    schedule.add_spider(Test)
    schedule.run()

特点

Session类，简化版本的requests.Session

Schedule类，简化版本的scrapy

其他，仅测试 pycurl_session.client可导入FTP，SFTP，WEBDAV进行对应协议请求。可以参考Client

已知问题

已知的不完善的地方，请参考Issue

使用许可

MIT © glamas

Name		Name	Last commit message	Last commit date
Latest commit History 99 Commits
doc		doc
pycurl_session		pycurl_session
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
run_tests.py		run_tests.py
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

pycurl_session

依赖

安装

使用

特点

已知问题

相关仓库

使用许可

About

Languages

License

glamas/pycurl_session

Folders and files

Latest commit

History

Repository files navigation

pycurl_session

依赖

安装

使用

特点

已知问题

相关仓库

使用许可

About

Topics

Resources

License

Stars

Watchers

Forks

Languages