From 667332ff1752acdccde1f2b55d475f145b6004c0 Mon Sep 17 00:00:00 2001 From: szcf-weiya <2215235182@qq.com> Date: Sat, 22 Feb 2020 23:58:44 +0800 Subject: [PATCH] update tags --- .../7.2-Bias-Variance-and-Model-Complexity.md | 12 +++++++++++- ...rected-Graphical-Models-for-Discrete-Variables.md | 9 ++++++--- 2 files changed, 17 insertions(+), 4 deletions(-) diff --git a/docs/07-Model-Assessment-and-Selection/7.2-Bias-Variance-and-Model-Complexity.md b/docs/07-Model-Assessment-and-Selection/7.2-Bias-Variance-and-Model-Complexity.md index 4d460a10ee..66275772c3 100644 --- a/docs/07-Model-Assessment-and-Selection/7.2-Bias-Variance-and-Model-Complexity.md +++ b/docs/07-Model-Assessment-and-Selection/7.2-Bias-Variance-and-Model-Complexity.md @@ -14,7 +14,17 @@ > 图 7.1. 当模型复杂度变化时测试样本和训练样本的误差.浅蓝色曲线显示了当模型复杂度增加时训练误差 $\overline{\err}$ 的变化,而浅红色曲线显示了当模型复杂度增加时 100 个大小为 50 的训练集的条件测试误差 $\Err_{\cal T}$ 的变化.实(粗)线显示了对应的期望测试误差 $\Err$ 和期望训练误差 $\E[\overline{\err}]$ -图 7.1 说明了评估某学习方法泛化能力中的一个重要问题.首先考虑定量或者 **等距尺度 (interval scale)** 响应变量的情形.我们有目标变量 $Y$,输入向量 $X$,以及从训练集 $\cal T$ 估计出来的预测模型 $\hat f(X)$.衡量 $Y$ 与 $\hat f(X)$ 间误差的损失函数记为 $L(Y,\hat f(X))$.一般的选择是 +图 7.1 说明了评估某学习方法泛化能力中的一个重要问题.首先考虑 **定量 (quantitative)** 或者 **定距型 (interval scale)** 响应变量的情形. + +!!! note "weiya 注:" + 根据[百度百科](https://baike.baidu.com/item/%E5%AE%9A%E8%B7%9D%E5%8F%98%E9%87%8F/2710255) 即 [知乎回答](https://www.zhihu.com/question/26201880),定距变量也称间距变量,是取值具有“距离”特征的变量。统计学依据数据的计量尺度将数据分为四大类: + + - **定距型 (interval scale)**: 数值变量,可以加减运算,但不能乘除;不存在基准 0 值,即当变量值为 0 时不是表示没有,如温度变量。 + - **定序型 (ordinal scale)**: 类别型变量,如性别。 + - **定类型 (nominal scale)**: 不可以做四则运算,如满意度(非常满意、满意、一般、不满意、非常不满意)。 + - **定比型 (ratio scale)**: 数值变量,存在 0 值,比值有意义。 + +我们有目标变量 $Y$,输入向量 $X$,以及从训练集 $\cal T$ 估计出来的预测模型 $\hat f(X)$.衡量 $Y$ 与 $\hat f(X)$ 间误差的损失函数记为 $L(Y,\hat f(X))$.一般的选择是 $$ L(Y,\hat f(X))=\left\{ diff --git a/docs/17-Undirected-Graphical-Models/17.4-Undirected-Graphical-Models-for-Discrete-Variables.md b/docs/17-Undirected-Graphical-Models/17.4-Undirected-Graphical-Models-for-Discrete-Variables.md index ff754e5a62..8f27ce515f 100644 --- a/docs/17-Undirected-Graphical-Models/17.4-Undirected-Graphical-Models-for-Discrete-Variables.md +++ b/docs/17-Undirected-Graphical-Models/17.4-Undirected-Graphical-Models-for-Discrete-Variables.md @@ -38,12 +38,15 @@ $$ \tag{17.5}\label{17.5} $$ -分割函数保证在样本空间中概率相加起来为 1.$\theta_{jk}X_jX_k$ 项表示(对数)势函数 \eqref{17.5} 的特定参量化,而且因为技术上的原因需要包含 **常值 (constant)** 结点(与其他结点都有边相连) $X_0\equiv 1$([练习 17.10](https://github.com/szcf-weiya/ESL-CN/issues/139)). - +分割函数保证在样本空间中概率相加起来为 1.$\theta_{jk}X_jX_k$ 项表示(对数)势函数 \eqref{17.5} 的特定参量化,而且因为技术上的原因需要包含 **常值结点 (constant node)** $X_0\equiv 1$,即与其他结点都有边相连.([练习 17.10](https://github.com/szcf-weiya/ESL-CN/issues/139)). + !!! note "weiya 注:Ex. 17.10" 已解决,详见 [Issue 139: Ex. 17.10](https://github.com/szcf-weiya/ESL-CN/issues/139). -在统计领域中,这个模型等价于多路计算表(multiway tables of counts)的一阶交叉泊松对数线性模型(Bishop et al.,1975[^1] ;McCullagh and Nelder,1989[^2]; Agresti, 2002[^3]). +在统计领域中,这个模型等价于 **多路计数表 (multiway tables of counts)** 的 **一阶交叉泊松对数线性模型 (first-order-interaction Poisson log-linear model)**(Bishop et al.,1975[^1] ;McCullagh and Nelder,1989[^2]; Agresti, 2002[^3]). + +!!! note "weiya 注:multiway tables of counts" + Agresti (2002) 在 p17 介绍到,如果一个 **列联表 (contigency table)** 对两个(类别型)变量进行交叉分类,则称为 two-way table;如果对三个变量交叉分类,则称为 three-way table,以此类推. [^1]: Bishop, Y., Fienberg, S. and Holland, P. (1975). Discrete Multivariate Analysis, MIT Press, Cambridge, MA. [^2]: McCullagh, P. and Nelder, J. (1989). Generalized Linear Models, Chapman and Hall, London.