Skip to content

HadXu/feature-engineering-for-ml-zh

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

12 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

面向机器学习的特征工程

欢迎任何人参与和完善:一个人可以走的很快,但是一群人却可以走的更远

目录

  • 一、引言
  • 二、简单数字的花式技巧
  • 三、文本数据:展开、过滤和分块
  • 四、特征缩放的效果:从词袋到 TF-IDF
  • 五、类别变量:机器鸡时代的鸡蛋计数
  • 六、降维:使用 PCA 摊数据饼
  • 七、非线性特征提取和模型堆叠
  • 八、自动化特征提取器:图像特征提取和深度学习
  • 九、回到特征:将它们放到一起
  • 附录、线性模型和线性代数基础

联系方式

负责人

贡献者

标题 译者 校对
一、引言
二、简单数字的花式技巧
三、文本数据:展开、过滤和分块
四、特征缩放的效果:从词袋到 TF-IDF
五、类别变量:机器鸡时代的鸡蛋计数
六、降维:使用 PCA 摊数据饼
七、非线性特征提取和模型堆叠 @friedhelm739
八、自动化特征提取器:图像特征提取和深度学习 @friedhelm739
九、回到特征:将它们放到一起
附录、线性模型和线性代数基础

免责声明

ApacheCN 纯粹出于学习目的与个人兴趣翻译本书,不追求任何经济利益。

本译文只供学习研究参考之用,不得用于商业用途。ApacheCN 保留对此版本译文的署名权及其它相关权利。

深度学习 机器学习 大数据 运维工具
TensorFlow R1.2 中文文档 机器学习实战-教学 Spark 2.2.0和2.0.2 中文文档 Zeppelin 0.7.2 中文文档
Pytorch 0.3 中文文档 Sklearn 0.19 中文文档 Storm 1.1.0和1.0.1 中文文档 Kibana 5.2 中文文档
LightGBM 中文文档 Kudu 1.4.0 中文文档
XGBoost 中文文档 Elasticsearch 5.4 中文文档
kaggle: 机器学习竞赛 Beam 中文文档
Sklearn 与 TensorFlow 机器学习实用指南

About

📖 [译] 面向机器学习的特征工程

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published