From 58491a3b32e53f59be017c9db6d7bbe135e2c491 Mon Sep 17 00:00:00 2001 From: szcf-weiya <2215235182@qq.com> Date: Mon, 30 Apr 2018 23:49:49 +0800 Subject: [PATCH] fix typo --- .../17.1-Introduction.md | 18 ++++++++++-------- 1 file changed, 10 insertions(+), 8 deletions(-) diff --git a/docs/17-Undirected-Graphical-Models/17.1-Introduction.md b/docs/17-Undirected-Graphical-Models/17.1-Introduction.md index 613a66ec6d..c430dc6155 100644 --- a/docs/17-Undirected-Graphical-Models/17.1-Introduction.md +++ b/docs/17-Undirected-Graphical-Models/17.1-Introduction.md @@ -4,21 +4,23 @@ | ---- | ---------------------------------------- | | 翻译 | szcf-weiya | | 时间 | 2017-02-24:2017-02-24 | -| 更新 | 2017-08-26 | +| 更新 | 2017-08-26; 2018-04-30 | +图包含顶点集合(结点),以及连接顶点对的边的集合。在图模型中,每个顶点表示随机变量,并且图给出了理解整个随机变量联合分布的可视化方式。对于监督学习和非监督学习它们都是很有用的。在无向图中,边是没有方向的。我们仅限于讨论无向图模型,也称作**马尔科夫随机域 (Markov random fields)** 或者**马尔科夫网络 (Markov networks)**。在这些图中,两个顶点之间缺失一条边有着特殊的含义:对应的随机变量是在给定其它变量下是条件独立的。 -图包含顶点集合(结点),以及连接顶点对的边的集合。在图模型中,每个顶点表示随机变量,并且图给出了理解整个随机变量联合分布的可视化方式。对于监督学习和非监督学习它们都是很有用的。在无向图中,边是没有方向的。我们仅限于讨论无向图模型,也称作马尔科夫随机域(Markov random fields)或者马尔科夫网络(Markov networks)。在这些图中,两个顶点之间缺失一条边有着特殊的含义:对应的随机变量是在给定其它变量下是条件独立的。 - -图17.1显示了图模型的一个例子,是$p=11$个蛋白质在$N=7466$个细胞中的flow-cytometry数据集,取自Sachs等人(2003)的工作。图中的每一个顶点对应蛋白质表达水平的真实值。网络结构是在假定多元高斯分布情况下利用本章后面将要讨论的graphical lasso过程估计得到的。 +图 17.1 显示了图模型的一个例子,这是 $p=11$ 个蛋白质在 $N=7466$ 个细胞中的 `flow-cytometry` 数据集,取 Sachs et. al (2005)[^1]。图中的每一个顶点对应蛋白质表达水平的真实值。网络结构是在假定多元高斯分布情况下利用本章后面将要讨论的 graphical lasso 过程估计得到的。 ![](../img/17/fig17.1.png) -> 图17.1. 稀疏无向图的例子,从flow-cytometry数据集中估计得到,含有$p=11$个蛋白质在$N=7466$个细胞中的测量值。网络结构是通过本章后面将要讨论的图lasso过程进行估计的。 +> 图 17.1. 稀疏无向图的例子,从 `flow-cytometry` 数据集中估计得到,含有 $p=11$ 个蛋白质在 $N=7466$ 个细胞中的测量值。网络结构是通过本章后面将要讨论的图 lasso 过程进行估计的。 稀疏图有相对少的边数,而且非常方便来解读。在各种领域中都有用,包括基因和蛋白质,其中它们提供了基因通路的大致模型。在定义和理解图模型上做了很多工作,参见文献笔记。 -正如我们将要看到的,图中的边用值或者势(potential)参量化,来表示在对应顶点上的随机变量之间的条件依赖性的强度大小。采用图模型的主要挑战是模型选择(选择图的结构),从数据来估计边的参数,并且从联合分布中计算边缘顶点的概率和期望。后两个任务在计算机科学中有时被称作学习(learning)和推断(inference)。 +正如我们将要看到的,图中的边用值或者势 (potential) 参量化,来表示在对应顶点上的随机变量之间的条件依赖性的强度大小。采用图模型的主要挑战是模型选择(选择图的结构),从数据来估计边的参数,并且从联合分布中计算边缘顶点的概率和期望。后两个任务在计算机科学中有时被称作学习(learning)和推断(inference)。 + +我们不去试图全面地了解这个有趣的领域。相反地,仅仅介绍一些基本的概念,并且讨论一些估计参数和无向图结构的简单方法;涉及这些技巧的方法已经在本书中讨论了。我们介绍的的估计方式对于连续值和离散值的顶点的情形是不同的,所以我们分别对待它们。17.3.1 和 17.3.2 节可能是特别有意义的,因为描述全新的、基于回归的过程来估计图模型。 -我们不去试图全面地了解这个有趣的领域。相反地,仅仅介绍一些基本的概念,并且讨论一些估计参数和无向图结构的简单方法;涉及这些技巧的方法已经在本书中讨论了。我们介绍的的估计方式对于连续值和离散值的顶点的情形是不同的,所以我们分别对待它们。17.3.1和17.3.2节可能是特别有意义的,因为描述全新的、基于回归的过程来估计图模型。 +关于**有向图 (directed graphical models)** 或者**贝叶斯网络 (Bayesian networks)** 有大量并且活跃(active)的文献;这是边有方向箭头(但是没有有向环)的图模型。有向图模型表示可以分解成条件分布乘积的概率分布,并且有解释因果关系的潜力。作者建议我们读 Wasserman (2004)[^2] 来对无向图和有向图的综述;下一节与 18 章联系很紧密。更多有用的参考文献在文献笔记中给出。 -关于有向图(directed graphical models)或者贝叶斯网络(Bayesian networks)有大量并且活跃(active)的文献;这是边有方向箭头(但是没有有向环)的图模型。有向图模型表示可以分解成条件分布乘积的概率分布,并且有解释因果关系的潜力。作者建议我们读Wasserman(2004)的工作来对无向图和有向图的综述;下一节与18章联系很紧密。更多有用的参考文献在p645的文献笔记中给出。 +[^1]: Sachs, K., Perez, O., Pe’er, D., Lauffenburger, D. and Nolan, G. (2005). Causal protein-signaling networks derived from multiparameter singlecell data, Science 308: 523–529. +[^2]: Wasserman, L. (2004). All of Statistics: a Concise Course in Statistical Inference, Springer, New York. \ No newline at end of file