Skip to content

抽取柳州政府采购信息(不涉及隐私信息,所有数据该网站上公开)

Notifications You must be signed in to change notification settings

hrdg/LiuZhoudata

Repository files navigation

LiuZhoucode

python版本2.7

公司安排的任务,觉得用Java写比较麻烦,就用py了。感觉就是他们的数据太乱了,要求还多 具体提取要求在数据提取要求.doc,简单讲就是把下面字段提取出来

采购项目名称、采购项目编号、采购人、采购人地址、采购联系人、采购联系人电话、中标供应商名称、中标供应商地址、中标金额(数值型)、公告日期

然后金额需要数值类型的,保留两位小数,(原文件里面是有数字有中文的)金额转换的写在transfer2num.py这个实用价值比较大吧(我觉得)

日期要求全部类似20170203这样的。日期转换写在transfer2date.py

最后要求把2017年1月到3月的数据单独提取

其实想法很简单就是从excel里读取一行行记录,通过正则表达式去匹配这些字符,然后把匹配到的写入excel

使用了python的 xlrd xlwt库 需要的 直接pip install xlrd ,pip install xlwt

如果装不上去就去百度下。 可以通过这个学下xlrd xlwt的使用以及正则表达式,正则表达式我写的比较多里面,需要点耐心看的。

留下个star 蟹蟹!

哦,跑的时候记得改一下文件读取的路径和文件名!

About

抽取柳州政府采购信息(不涉及隐私信息,所有数据该网站上公开)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages