Learn-Algorithms/pre.md at master · antflux/Learn-Algorithms · GitHub

数学是基础

微积分
概率论和统计学
线性代数（矩阵，向量）
数值数学（数值分析，线性规划，凸优化理论，常见数值优化算法）
实分析和泛函的基础

机器学习

从大量数据中找到规律和知识，然后用规律和知识做决策
机器学习偏向数学问题推导，数据挖掘就是抽特征
不要沉迷于数学公式推导，理解如何运用数据

分类器

Naive Bayes
Linear Discriminant Analysis
Logistic Regression
Linear SVM
Kernel SVM
Adaboost
Decision
Neural network

非监督模型

数据处理与可视化：PCA，LDA，MDS
聚类算法
稀疏编码

基本不会去实现这些基础算法，都有现成的开源工具

概率图模型（Probabilistic graphical model）
两个核心的机器学习模型：Latent Dirichlet Allocation（LDA） Probabilistic Matrix Factorization（PMF）
统计计算（Statistical computing）
深度学习（Deep learning）
优化（optimization）
PAC学习理论（PAC Learning）
非参数贝叶斯统计（Non-parametric Bayesian statistics）

参考链接：http://www.zhihu.com/question/21714701

分类聚类模式识别

SVM 贝叶斯

学好python http://julyedu.com/course/getDetail?course_id=34#discard julyedu 课程大纲

数据挖掘

数据挖掘是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息和知识的过程。（from 知乎的描述）