-
-
-
pipenlp Public
以Pipeline的方式构建NLP任务,包括文本清洗、关键词提取、特征抽取、文本分类等任务
-
-
gbdt-is-all-you-need Public
收集、整理其他技术与gbdt的融合,期望既能保留其他技术所带来的效果提升,又能保留gbdt模型的良好可解释性
-
-
-
-
-
Text_Representation Public
基于gensim对BOW,TFIDF,LDA,LSI,W2V等传统的文本表示模型进行简单的封装,并添加了chi2,互信息等特征选择方法