Skip to content

Commit

Permalink
update tags
Browse files Browse the repository at this point in the history
  • Loading branch information
szcf-weiya committed Feb 22, 2020
1 parent 5274c10 commit 667332f
Show file tree
Hide file tree
Showing 2 changed files with 17 additions and 4 deletions.
Original file line number Diff line number Diff line change
Expand Up @@ -14,7 +14,17 @@

> 图 7.1. 当模型复杂度变化时测试样本和训练样本的误差.浅蓝色曲线显示了当模型复杂度增加时训练误差 $\overline{\err}$ 的变化,而浅红色曲线显示了当模型复杂度增加时 100 个大小为 50 的训练集的条件测试误差 $\Err_{\cal T}$ 的变化.实(粗)线显示了对应的期望测试误差 $\Err$ 和期望训练误差 $\E[\overline{\err}]$
图 7.1 说明了评估某学习方法泛化能力中的一个重要问题.首先考虑定量或者 **等距尺度 (interval scale)** 响应变量的情形.我们有目标变量 $Y$,输入向量 $X$,以及从训练集 $\cal T$ 估计出来的预测模型 $\hat f(X)$.衡量 $Y$ 与 $\hat f(X)$ 间误差的损失函数记为 $L(Y,\hat f(X))$.一般的选择是
图 7.1 说明了评估某学习方法泛化能力中的一个重要问题.首先考虑 **定量 (quantitative)** 或者 **定距型 (interval scale)** 响应变量的情形.

!!! note "weiya 注:"
根据[百度百科](https://baike.baidu.com/item/%E5%AE%9A%E8%B7%9D%E5%8F%98%E9%87%8F/2710255)[知乎回答](https://www.zhihu.com/question/26201880),定距变量也称间距变量,是取值具有“距离”特征的变量。统计学依据数据的计量尺度将数据分为四大类:

- **定距型 (interval scale)**: 数值变量,可以加减运算,但不能乘除;不存在基准 0 值,即当变量值为 0 时不是表示没有,如温度变量。
- **定序型 (ordinal scale)**: 类别型变量,如性别。
- **定类型 (nominal scale)**: 不可以做四则运算,如满意度(非常满意、满意、一般、不满意、非常不满意)。
- **定比型 (ratio scale)**: 数值变量,存在 0 值,比值有意义。

我们有目标变量 $Y$,输入向量 $X$,以及从训练集 $\cal T$ 估计出来的预测模型 $\hat f(X)$.衡量 $Y$ 与 $\hat f(X)$ 间误差的损失函数记为 $L(Y,\hat f(X))$.一般的选择是

$$
L(Y,\hat f(X))=\left\{
Expand Down
Original file line number Diff line number Diff line change
Expand Up @@ -38,12 +38,15 @@ $$
\tag{17.5}\label{17.5}
$$

分割函数保证在样本空间中概率相加起来为 1.$\theta_{jk}X_jX_k$ 项表示(对数)势函数 \eqref{17.5} 的特定参量化,而且因为技术上的原因需要包含 **常值 (constant)** 结点(与其他结点都有边相连) $X_0\equiv 1$([练习 17.10](https://github.com/szcf-weiya/ESL-CN/issues/139)).

分割函数保证在样本空间中概率相加起来为 1.$\theta_{jk}X_jX_k$ 项表示(对数)势函数 \eqref{17.5} 的特定参量化,而且因为技术上的原因需要包含 **常值结点 (constant node)** $X_0\equiv 1$,即与其他结点都有边相连.[练习 17.10](https://github.com/szcf-weiya/ESL-CN/issues/139)).
!!! note "weiya 注:Ex. 17.10"
已解决,详见 [Issue 139: Ex. 17.10](https://github.com/szcf-weiya/ESL-CN/issues/139)

在统计领域中,这个模型等价于多路计算表(multiway tables of counts)的一阶交叉泊松对数线性模型(Bishop et al.,1975[^1] ;McCullagh and Nelder,1989[^2]; Agresti, 2002[^3]).
在统计领域中,这个模型等价于 **多路计数表 (multiway tables of counts)****一阶交叉泊松对数线性模型 (first-order-interaction Poisson log-linear model)**(Bishop et al.,1975[^1] ;McCullagh and Nelder,1989[^2]; Agresti, 2002[^3]).

!!! note "weiya 注:multiway tables of counts"
Agresti (2002) 在 p17 介绍到,如果一个 **列联表 (contigency table)** 对两个(类别型)变量进行交叉分类,则称为 two-way table;如果对三个变量交叉分类,则称为 three-way table,以此类推.

[^1]: Bishop, Y., Fienberg, S. and Holland, P. (1975). Discrete Multivariate Analysis, MIT Press, Cambridge, MA.
[^2]: McCullagh, P. and Nelder, J. (1989). Generalized Linear Models, Chapman and Hall, London.
Expand Down

0 comments on commit 667332f

Please sign in to comment.