该项目的主要目的是结合实际工作解决团队中个人成长问题:
1、如何通过系统化学习,更精准的掌握工作所需的知识点与技能;
2、如何提升解决问题的思考能力,将所学更好的表达出来;
3、如何得心应手的应用到实际项目中,提升自己的工程能力。
主要从基础、原理、应用、实践、学习资源5个方面来思考,可以肯定会存在很多不足,后续一步步改进。
无论哪本深度学习教程,首先都会提到数学、机器学习、深度学习的相关基础性知识,并且通常是一堆概念和公式,显得高深且难入门。但在实际工作中可能并不需要写公式,然后实现公式,就好比编程不一定要求手动敲算法一样,工程化才是核心问题。如何更通俗易懂的描述导数、矩阵、熵等概念与深度学习的关系可能是让人更容易理解AI的工作方式。
机器学习要解决的问题可以归纳为分类问题、回归问题、聚类问题,这对应了现实中需要解决的实际问题。例如经常提的分辨猫狗就是现实中的分类问题,股票预测是为回归问题,蛇鼠一窝为聚类问题。我们将这种问题分类方式定义为问题模型,现实中所有的问题都是由各类问题模型组成。
在机器学习中,解决问题模型的方式则有各类算法模型,例如图像识别用来解决图像的分类问题,而在问答系统中的意图识别本身也是短文本的分类问题。
为了更好的应对现实中的问题,图像、文本、语音领域中又做了更高一级的归纳。图像中有图像识别、目标检测、图像语义分割、图像实例分割,文本中有文本分类、文本序列标注、文本关系(句对关系)、文本生成、文本聚类等。针对这些问题都有对应的算法模型来解决。
同样为了解决掉现实中的问题,人脸检测、OCR将问题将目标检测任务中的任务更加具体。针对这些任务,都会有针对性改进的算法模型。单从模型角度看,基本思想仍然脱离不了目标检测任务中的思路框架。NLP中的任务同样更加具体,例如基础技术的分词、应用技术中的自动问答,它们都可能由多个模型,甚至符号规则组成。
这里主要描述工程化的过程中需要掌握的工具,阐述解决问题的思想。
相关学习资源,供随时查看。
- 线下阅读:使用Atom编辑与阅读,安装"Markdown Preview Plus"来显示Latex公式。
- github线上阅读:chrome浏览器中安装MathJax插件来显示Latex公式,github地址: 下载.