diff --git "a/BasicAlgorithm/\345\275\222\344\270\200\345\214\226.md" "b/BasicAlgorithm/\345\275\222\344\270\200\345\214\226.md" index cd388d0..165aafa 100644 --- "a/BasicAlgorithm/\345\275\222\344\270\200\345\214\226.md" +++ "b/BasicAlgorithm/\345\275\222\344\270\200\345\214\226.md" @@ -6,11 +6,12 @@ ### 1.1 为什么要归一化? -因为 每一列 数据的量纲不同,导致 数据分布区间存在差异。(人的身高可以是 180cm,也可以是 1.8m,这两个虽然表示意义相同,但是由于单位的不同,导致 机器学习在计算过程中也容易出现差异,所以就需要对数据进行归一化)。 +因为 每一列 数据的量纲不同,导致 数据分布区间存在差异。 +举例:(人的身高可以是 180cm,也可以是 1.8m,这两个虽然表示意义相同,但是由于单位的不同,导致 机器学习在计算过程中也容易出现差异,所以就需要对数据进行归一化)。 ## 二、介绍篇 -### 2.1 归一化 有 哪些方法? +### 2.1 归一化有哪些方法? - 线性比例变换法: @@ -24,7 +25,7 @@ ![](img/20200906192249.png) -### 2.2 归一化 各方法 特点? +### 2.2 归一化各方法特点? - 线性比例变换法 and 极差变换法 - 特点:将原始数据线性化的方法转换到[0 1]的范围,该方法实现对原始数据的等比例缩放。通过利用变量取值的最大值和最小值(或者最大值)将原始数据转换为界于某一特定范围的数据,从而消除量纲和数量级影响,改变变量在分析中的权重来解决不同度量的问题。由于极值化方法在对变量无量纲化过程中仅仅与该变量的最大值和最小值这两个极端值有关,而与其他取值无关,这使得该方法在改变各变量权重时过分依赖两个极端取值。