Skip to content

Commit

Permalink
fix typo
Browse files Browse the repository at this point in the history
  • Loading branch information
szcf-weiya committed Dec 5, 2018
1 parent e90f2d5 commit 885bf13
Showing 1 changed file with 1 addition and 1 deletion.
Original file line number Diff line number Diff line change
Expand Up @@ -15,7 +15,7 @@

输入变量也有各种各样的测量类型;我们可以有定性的输入变量和定量的输入变量两者中的一些变量。这些也导致了预测中方法类型的不同:一些方法更自然地定义为定量的输入变量,一些方法更自然地定义为定性的输入变量,还有一些是两者都可以的。

第三种变量类型是 **有序分类 (ordered categorical)**,如 **小(small)****中 (medium)****大 (large)**,在这些值之间存在顺序,但是没有合适的度量的概念(中与小之间的差异不必和大于中间的差异相等)。这将在[第四章](../04-Linear-Methods-for-Classification/4.1-Introduction/index.html)中讨论。
第三种变量类型是 **有序分类 (ordered categorical)**,如 **小(small)****中 (medium)****大 (large)**,在这些值之间存在顺序,但是没有合适的度量概念(中与小之间的差异不必和大于中间的差异相等)。这将在[第四章](../04-Linear-Methods-for-Classification/4.1-Introduction/index.html)中讨论。

定性的变量常用数字编码来表示。最简单的情形是只有两个分类,比如说“成功”与“失败”,“生存”与“死亡”。这些经常用一位二进制数来表示,比如 $0$ 或 $1$,或者用 $-1$ 和 $1$ 来表示。因为一些显然的原因,这些数字编码有时被称作 **指标 (targets)**。当存在超过两个的类别,存在其他可行的选择。最有用并且最普遍使用的编码是 **虚拟变量(dummy variables)**。这里有 $K$ 个水平的定性变量被一个 $K$ 位的二进制变量表示,每次只有一个在开启状态。尽管更简洁的编码模式也是可能的,但虚拟变量在因子的层次中是对称的。

Expand Down

0 comments on commit 885bf13

Please sign in to comment.