用'commits'记录毕设摸索的过程,“学术分享搜素引擎”
更多介绍参见 http://blog.csdn.net/zbf8441372/article/details/8697956 以及 http://blog.csdn.net/zbf8441372/article/details/8887188
用于个性化定制网页爬取,以及通用性内容爬取
基于twisted异步网络框架,代码少,性能高
用于元数据存储,以及pdf文件存取
易用性最高的NoSQL,分布式,多分片,易扩展,我的场景下适合取代MySQL
为数据建立索引并定制隔离的搜索服务
最主流的搜索引擎搭建工具,互相兼容并提供常规搜索功能
用于提取pdf文本内容
兼容Lucene的多功能文本提取工具,适应很多类型文件,使用方便
企业级SSO解决方案
Struts2 + Jquery + Bootstrap + D3
基于爬取的学术资源,提供搜索、推荐、可视化、分享四块。