Stars
5
stars
written in Python
Clear filter
从新浪财经、每经网、金融界、中国证券网、证券时报网上,爬取上市公司(个股)的历史新闻文本数据进行文本分析、提取特征集,然后利用SVM、随机森林等分类器进行训练,最后对实施抓取的新闻数据进行分类预测
基于分布式爬虫,采集互联网公开来源的金融类新闻和文档类文本; 基于文本挖掘技术,进行无监督/半监督学习的数据ETL与特征工程; 基于金融数据挖掘技术,进行宏观经济分析,基本面分析与行业分析
2018全国云计算应用创新大赛一等奖作品。从零开始设计并构建“金科云盾”网站防护系统。该系统实现了大规模日志数据收集、高可用存储、分类归档、快速检索;基 于神经网络实时、精准地识别DDOS、慢连接等恶意攻击并直观展示;采用黑名单+防火墙封杀恶意IP,邮件实时告警。整个系 统通过脚本串联,响应时间达到秒级水平。