- 微积分
- 概率论和统计学
- 线性代数(矩阵,向量)
- 数值数学(数值分析,线性规划,凸优化理论,常见数值优化算法)
- 实分析和泛函的基础
从大量数据中找到规律和知识,然后用规律和知识做决策
机器学习偏向数学问题推导,数据挖掘就是抽特征
不要沉迷于数学公式推导,理解如何运用数据
分类器
- Naive Bayes
- Linear Discriminant Analysis
- Logistic Regression
- Linear SVM
- Kernel SVM
- Adaboost
- Decision
- Neural network
非监督模型
- 数据处理与可视化:PCA,LDA,MDS
- 聚类算法
- 稀疏编码
基本不会去实现这些基础算法,都有现成的开源工具
- 概率图模型(Probabilistic graphical model)
- 两个核心的机器学习模型:Latent Dirichlet Allocation(LDA) Probabilistic Matrix Factorization(PMF)
- 统计计算(Statistical computing)
- 深度学习(Deep learning)
- 优化(optimization)
- PAC学习理论(PAC Learning)
- 非参数贝叶斯统计(Non-parametric Bayesian statistics)
参考链接:http://www.zhihu.com/question/21714701
分类 聚类 模式识别
SVM 贝叶斯
学好python http://julyedu.com/course/getDetail?course_id=34#discard julyedu 课程大纲
数据挖掘
是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息和知识的过程。(from 知乎的描述)