Looking for more concise code in python3? switch to branch py3.
文件夹 | 基本算法 | 应用 |
---|---|---|
classify | 点积实现欧几里得距离比较、核函数rbf | 根据某记录与各类别的“距离”分类 |
cluster | Tanimoto系数、皮尔逊距离、k-means算法、降维可视化 | 文章聚类、结果可视化 |
decision_tree | 基尼不纯度、熵、决策树的建立/剪枝/预测 | 预测用户中的潜在消费者 |
docclass | 朴素贝叶斯分类器、费舍尔分类器 | 文章最佳标签判定、垃圾文章判定 |
feature_extraction | 非负矩阵因式分解 | 文章特征提取、【数据准备预处理,并进行监督性(分类)非监督性(聚类)学习】 |
frequent_itemset | Apriori、FP_growth | 购物篮事务基础关联分析 |
genetic_programming | 遗传算法 | 重构数学函数、简单游戏博弈训练 |
optimization | 随机搜索优化、爬山优化、模拟退火优化、遗传优化 | 航班安排优化、网络绘制优化(借助质点弹簧算法) |
prediction | KNN算法(带权)、交叉验证、概率可视化 | 商品价格预估、训练特征缩放权重(提取特征)、价格概率分布可视化 |
recommendation | 欧几里得距离、皮尔逊距离(相关系数) | 协同过滤实现推荐功能 |
- 参考书籍:
- 《集体智慧编程》
- 《机器学习实战》