Skip to content

Commit

Permalink
Site updated at 2014-09-05 13:04:46 UTC
Browse files Browse the repository at this point in the history
  • Loading branch information
YinanWangAI committed Sep 5, 2014
1 parent 784a517 commit 6209a6e
Show file tree
Hide file tree
Showing 11 changed files with 23 additions and 180 deletions.
57 changes: 2 additions & 55 deletions atom.xml
Original file line number Diff line number Diff line change
Expand Up @@ -5,7 +5,7 @@
<link href="http://wangyinanchina.github.io/atom.xml" rel="self"/>
<link href="http://wangyinanchina.github.io/"/>

<updated>2014-09-05T21:02:00+08:00</updated>
<updated>2014-09-05T21:04:16+08:00</updated>
<id>http://wangyinanchina.github.io/</id>
<author>
<name><![CDATA[王轶楠]]></name>
Expand All @@ -19,60 +19,7 @@
<link href="http://wangyinanchina.github.io/blog/2014/09/03/fishers-exact-test/"/>
<updated>2014-09-03T23:30:07+08:00</updated>
<id>http://wangyinanchina.github.io/blog/2014/09/03/fishers-exact-test</id>
<content type="html"><![CDATA[<p>Fisher精确检验(fisher&rsquo;s exat test)是进行统计分析时经常碰到的一种检验方法,它基于超几何分布,作用于离散变量,用于检测两种分类方法的结果是否独立。</p>
<p>首先,我们介绍超几何分布。超几何分布用来模拟这样的过程:将有限的总体分为两类A和B,从中不放回的抽样n次,结果中A的个数符合超几何分布。所以使用古典概型的方法,假设N个总体中有A和B两类,其中A有K个,从中不放回的抽样n次,我们可以推导出n中为A的数目x,即超几何分布的pmf:$$P(X = x) = \binom{K}{x} \binom{N - K}{n - x} / \binom{N}{n}$$</p>
<p>回到fisher精确检验,fisher检验要回答的问题是,对数据进行两种分类,这两种分类是否独立?即在第一种分类条件下分为某一类的数据是否更倾向于在第二种分类中归于某类。举例说明(<a href="http://en.wikipedia.org/wiki/Fisher's_exact_test">例子来源于wiki</a>):</p>
<blockquote><p>我们有24位测试对象,根据其性别和是否在节食,将其分为四类,分类结果如下:</p>
<table>
<thead>
<tr>
<th>$$$\qquad$$$ </th>
<th> 男性 </th>
<th> 女性</th>
</tr>
</thead>
<tbody>
<tr>
<td>节食 </td>
<td> 1 </td>
<td> 9</td>
</tr>
<tr>
<td>不节食 </td>
<td> 11 </td>
<td> 3</td>
</tr>
</tbody>
</table>
<p>现在我们的问题是,是否女性更喜欢节食?从数据直观上来看,男性和女性都是12人,但是节食的女性是男性的9倍,似乎女性的确更容易节食,但是我们如何定量的去描述这件事呢?可以看出,我们要解决的是一个假设检验问题,我们将零假设设定为:<strong>是否节食和性别无关。</strong>那么,在零假设下,根据超几何分布我们观察到表格中数据的概率是:
$$\binom{12}{1}\binom{12}{9} / \binom{24}{10} = 0.001346076$$
而如果我们做一个单尾的检验,那么我们观测到表格中数据或者比表格中数据更极端(即节食男性为0)的概率为:
$$\binom{12}{1}\binom{12}{9} / \binom{24}{10} + \binom{12}{0}\binom{12}{10} / \binom{24}{10} = 0.001379728$$
即fisher精确检验的p-value。我们用R去检验我们计算的结果</p></blockquote>
<pre><code>fisher.test(matrix(c(1, 11, 9, 3), 2, 2), alternative = 'less')
# 结果如下,可以看出与我们计算的结果相同
Fisher's Exact Test for Count Data
data: matrix(c(1, 11, 9, 3), 2, 2)
p-value = 0.00138
alternative hypothesis: true odds ratio is less than 1
95 percent confidence interval:
0.0000000 0.3260026
sample estimates:
odds ratio
0.03723312
</code></pre>
<p>对于双尾的fisher检验,目前还没有好的计算方法,因为对于两个极端并不好定义,目前最简单的方法就是对两个极端,分别计算观测到观测值或者更极端的观测值得概率(例如上例中节食男性为1或者0的情况(一个极端)以及节食男性为9,10,11,12(另一个极端)的情况),并将所得到的概率相加,即为最终的p-value。</p>
]]></content>
<content type="html"><![CDATA[<p>Fisher精确检验(fisher&rsquo;s exat test)是进行统计分析时经常碰到的一种检验方法,它基于超几何分布,作用于离散变量,用于检测两种分类方法的结果是否独立。]]></content>
</entry>

<entry>
Expand Down
57 changes: 2 additions & 55 deletions blog/2014/09/03/fishers-exact-test/index.html
Original file line number Diff line number Diff line change
Expand Up @@ -215,64 +215,11 @@ <h1 class="entry-title" itemprop="name headline">超几何分布和fisher精确
<div class="entry-content">
<div class="group">

<p>Fisher精确检验(fisher&rsquo;s exat test)是进行统计分析时经常碰到的一种检验方法,它基于超几何分布,作用于离散变量,用于检测两种分类方法的结果是否独立。</p>

<p>首先,我们介绍超几何分布。超几何分布用来模拟这样的过程:将有限的总体分为两类A和B,从中不放回的抽样n次,结果中A的个数符合超几何分布。所以使用古典概型的方法,假设N个总体中有A和B两类,其中A有K个,从中不放回的抽样n次,我们可以推导出n中为A的数目x,即超几何分布的pmf:$$P(X = x) = \binom{K}{x} \binom{N - K}{n - x} / \binom{N}{n}$$</p>

<p>回到fisher精确检验,fisher检验要回答的问题是,对数据进行两种分类,这两种分类是否独立?即在第一种分类条件下分为某一类的数据是否更倾向于在第二种分类中归于某类。举例说明(<a href="http://en.wikipedia.org/wiki/Fisher's_exact_test">例子来源于wiki</a>):</p>

<blockquote><p>我们有24位测试对象,根据其性别和是否在节食,将其分为四类,分类结果如下:</p>

<table>
<thead>
<tr>
<th>$$$\qquad$$$ </th>
<th> 男性 </th>
<th> 女性</th>
</tr>
</thead>
<tbody>
<tr>
<td>节食 </td>
<td> 1 </td>
<td> 9</td>
</tr>
<tr>
<td>不节食 </td>
<td> 11 </td>
<td> 3</td>
</tr>
</tbody>
</table>


<p>现在我们的问题是,是否女性更喜欢节食?从数据直观上来看,男性和女性都是12人,但是节食的女性是男性的9倍,似乎女性的确更容易节食,但是我们如何定量的去描述这件事呢?可以看出,我们要解决的是一个假设检验问题,我们将零假设设定为:<strong>是否节食和性别无关。</strong>那么,在零假设下,根据超几何分布我们观察到表格中数据的概率是:
$$\binom{12}{1}\binom{12}{9} / \binom{24}{10} = 0.001346076$$
而如果我们做一个单尾的检验,那么我们观测到表格中数据或者比表格中数据更极端(即节食男性为0)的概率为:
$$\binom{12}{1}\binom{12}{9} / \binom{24}{10} + \binom{12}{0}\binom{12}{10} / \binom{24}{10} = 0.001379728$$
即fisher精确检验的p-value。我们用R去检验我们计算的结果</p></blockquote>

<pre><code>fisher.test(matrix(c(1, 11, 9, 3), 2, 2), alternative = 'less')

# 结果如下,可以看出与我们计算的结果相同
Fisher's Exact Test for Count Data

data: matrix(c(1, 11, 9, 3), 2, 2)
p-value = 0.00138
alternative hypothesis: true odds ratio is less than 1
95 percent confidence interval:
0.0000000 0.3260026
sample estimates:
odds ratio
0.03723312
</code></pre>

<p>对于双尾的fisher检验,目前还没有好的计算方法,因为对于两个极端并不好定义,目前最简单的方法就是对两个极端,分别计算观测到观测值或者更极端的观测值得概率(例如上例中节食男性为1或者0的情况(一个极端)以及节食男性为9,10,11,12(另一个极端)的情况),并将所得到的概率相加,即为最终的p-value。</p>

<p>Fisher精确检验(fisher&rsquo;s exat test)是进行统计分析时经常碰到的一种检验方法,它基于超几何分布,作用于离散变量,用于检测两种分类方法的结果是否独立。
</div>
<!-- more -->
<div class="group">
<p>Fisher精确检验(fisher&rsquo;s exat test)是进行统计分析时经常碰到的一种检验方法,它基于超几何分布,作用于离散变量,用于检测两种分类方法的结果是否独立。</p>
<p>Fisher精确检验(fisher&rsquo;s exat test)是进行统计分析时经常碰到的一种检验方法,它基于超几何分布,作用于离散变量,用于检测两种分类方法的结果是否独立。<!--more--></p>

<p>首先,我们介绍超几何分布。超几何分布用来模拟这样的过程:将有限的总体分为两类A和B,从中不放回的抽样n次,结果中A的个数符合超几何分布。所以使用古典概型的方法,假设N个总体中有A和B两类,其中A有K个,从中不放回的抽样n次,我们可以推导出n中为A的数目x,即超几何分布的pmf:$$P(X = x) = \binom{K}{x} \binom{N - K}{n - x} / \binom{N}{n}$$</p>

Expand Down
2 changes: 1 addition & 1 deletion blog/categories/duo-yuan-hui-gui/atom.xml
Original file line number Diff line number Diff line change
Expand Up @@ -4,7 +4,7 @@
<title><![CDATA[Category: 多元回归 | 玩儿数据]]></title>
<link href="http://wangyinanchina.github.io/blog/categories/duo-yuan-hui-gui/atom.xml" rel="self"/>
<link href="http://wangyinanchina.github.io/"/>
<updated>2014-09-05T21:02:00+08:00</updated>
<updated>2014-09-05T21:04:16+08:00</updated>
<id>http://wangyinanchina.github.io/</id>
<author>
<name><![CDATA[王轶楠]]></name>
Expand Down
4 changes: 2 additions & 2 deletions blog/categories/jia-she-jian-yan/atom.xml
Original file line number Diff line number Diff line change
Expand Up @@ -4,7 +4,7 @@
<title><![CDATA[Category: 假设检验 | 玩儿数据]]></title>
<link href="http://wangyinanchina.github.io/blog/categories/jia-she-jian-yan/atom.xml" rel="self"/>
<link href="http://wangyinanchina.github.io/"/>
<updated>2014-09-05T21:02:00+08:00</updated>
<updated>2014-09-05T21:04:16+08:00</updated>
<id>http://wangyinanchina.github.io/</id>
<author>
<name><![CDATA[王轶楠]]></name>
Expand All @@ -18,7 +18,7 @@
<link href="http://wangyinanchina.github.io/blog/2014/09/03/fishers-exact-test/"/>
<updated>2014-09-03T23:30:07+08:00</updated>
<id>http://wangyinanchina.github.io/blog/2014/09/03/fishers-exact-test</id>
<content type="html"><![CDATA[<p>Fisher精确检验(fisher&rsquo;s exat test)是进行统计分析时经常碰到的一种检验方法,它基于超几何分布,作用于离散变量,用于检测两种分类方法的结果是否独立。</p>
<content type="html"><![CDATA[<p>Fisher精确检验(fisher&rsquo;s exat test)是进行统计分析时经常碰到的一种检验方法,它基于超几何分布,作用于离散变量,用于检测两种分类方法的结果是否独立。<!--more--></p>
<p>首先,我们介绍超几何分布。超几何分布用来模拟这样的过程:将有限的总体分为两类A和B,从中不放回的抽样n次,结果中A的个数符合超几何分布。所以使用古典概型的方法,假设N个总体中有A和B两类,其中A有K个,从中不放回的抽样n次,我们可以推导出n中为A的数目x,即超几何分布的pmf:$$P(X = x) = \binom{K}{x} \binom{N - K}{n - x} / \binom{N}{n}$$</p>
Expand Down
2 changes: 1 addition & 1 deletion blog/categories/markdown/atom.xml
Original file line number Diff line number Diff line change
Expand Up @@ -4,7 +4,7 @@
<title><![CDATA[Category: Markdown | 玩儿数据]]></title>
<link href="http://wangyinanchina.github.io/blog/categories/markdown/atom.xml" rel="self"/>
<link href="http://wangyinanchina.github.io/"/>
<updated>2014-09-05T21:02:00+08:00</updated>
<updated>2014-09-05T21:04:16+08:00</updated>
<id>http://wangyinanchina.github.io/</id>
<author>
<name><![CDATA[王轶楠]]></name>
Expand Down
2 changes: 1 addition & 1 deletion blog/categories/mou/atom.xml
Original file line number Diff line number Diff line change
Expand Up @@ -4,7 +4,7 @@
<title><![CDATA[Category: Mou | 玩儿数据]]></title>
<link href="http://wangyinanchina.github.io/blog/categories/mou/atom.xml" rel="self"/>
<link href="http://wangyinanchina.github.io/"/>
<updated>2014-09-05T21:02:00+08:00</updated>
<updated>2014-09-05T21:04:16+08:00</updated>
<id>http://wangyinanchina.github.io/</id>
<author>
<name><![CDATA[王轶楠]]></name>
Expand Down
2 changes: 1 addition & 1 deletion blog/categories/octopress/atom.xml
Original file line number Diff line number Diff line change
Expand Up @@ -4,7 +4,7 @@
<title><![CDATA[Category: Octopress | 玩儿数据]]></title>
<link href="http://wangyinanchina.github.io/blog/categories/octopress/atom.xml" rel="self"/>
<link href="http://wangyinanchina.github.io/"/>
<updated>2014-09-05T21:02:00+08:00</updated>
<updated>2014-09-05T21:04:16+08:00</updated>
<id>http://wangyinanchina.github.io/</id>
<author>
<name><![CDATA[王轶楠]]></name>
Expand Down
2 changes: 1 addition & 1 deletion blog/categories/tong-ji-mo-xing/atom.xml
Original file line number Diff line number Diff line change
Expand Up @@ -4,7 +4,7 @@
<title><![CDATA[Category: 统计模型 | 玩儿数据]]></title>
<link href="http://wangyinanchina.github.io/blog/categories/tong-ji-mo-xing/atom.xml" rel="self"/>
<link href="http://wangyinanchina.github.io/"/>
<updated>2014-09-05T21:02:00+08:00</updated>
<updated>2014-09-05T21:04:16+08:00</updated>
<id>http://wangyinanchina.github.io/</id>
<author>
<name><![CDATA[王轶楠]]></name>
Expand Down
2 changes: 1 addition & 1 deletion blog/categories/zheng-ming/atom.xml
Original file line number Diff line number Diff line change
Expand Up @@ -4,7 +4,7 @@
<title><![CDATA[Category: 证明 | 玩儿数据]]></title>
<link href="http://wangyinanchina.github.io/blog/categories/zheng-ming/atom.xml" rel="self"/>
<link href="http://wangyinanchina.github.io/"/>
<updated>2014-09-05T21:02:00+08:00</updated>
<updated>2014-09-05T21:04:16+08:00</updated>
<id>http://wangyinanchina.github.io/</id>
<author>
<name><![CDATA[王轶楠]]></name>
Expand Down
61 changes: 5 additions & 56 deletions index.html
Original file line number Diff line number Diff line change
Expand Up @@ -9,11 +9,11 @@
<meta name="author" content="王轶楠">


<meta name="description" content="Posted in 假设检验 超几何分布和fisher精确检验 Fisher精确检验(fisher&rsquo;s exat test)是进行统计分析时经常碰到的一种检验方法,它基于超几何分布,作用于离散变量,用于检测两种分类方法的结果是否独立。 首先,我们介绍超几何分布。 &hellip;">
<meta name="description" content="Posted in 假设检验 超几何分布和fisher精确检验 Fisher精确检验(fisher&rsquo;s exat test)是进行统计分析时经常碰到的一种检验方法,它基于超几何分布,作用于离散变量,用于检测两种分类方法的结果是否独立。 Read on &rarr; Posted in &hellip;">

<meta property="og:title" content="" />
<meta property="og:type" content="blog" />
<meta property="og:description" content="Posted in 假设检验 超几何分布和fisher精确检验 Fisher精确检验(fisher&rsquo;s exat test)是进行统计分析时经常碰到的一种检验方法,它基于超几何分布,作用于离散变量,用于检测两种分类方法的结果是否独立。 首先,我们介绍超几何分布。 &hellip;">
<meta property="og:description" content="Posted in 假设检验 超几何分布和fisher精确检验 Fisher精确检验(fisher&rsquo;s exat test)是进行统计分析时经常碰到的一种检验方法,它基于超几何分布,作用于离散变量,用于检测两种分类方法的结果是否独立。 Read on &rarr; Posted in &hellip;">

<meta property="og:url" content="http://wangyinanchina.github.io/" />

Expand Down Expand Up @@ -192,61 +192,10 @@ <h1 class="entry-title" itemprop="name headline"><a href="/blog/2014/09/03/fishe
<div class="entry-content index_click_box">
<div class="group">

<p>Fisher精确检验(fisher&rsquo;s exat test)是进行统计分析时经常碰到的一种检验方法,它基于超几何分布,作用于离散变量,用于检测两种分类方法的结果是否独立。</p>

<p>首先,我们介绍超几何分布。超几何分布用来模拟这样的过程:将有限的总体分为两类A和B,从中不放回的抽样n次,结果中A的个数符合超几何分布。所以使用古典概型的方法,假设N个总体中有A和B两类,其中A有K个,从中不放回的抽样n次,我们可以推导出n中为A的数目x,即超几何分布的pmf:$$P(X = x) = \binom{K}{x} \binom{N - K}{n - x} / \binom{N}{n}$$</p>

<p>回到fisher精确检验,fisher检验要回答的问题是,对数据进行两种分类,这两种分类是否独立?即在第一种分类条件下分为某一类的数据是否更倾向于在第二种分类中归于某类。举例说明(<a href="http://en.wikipedia.org/wiki/Fisher's_exact_test">例子来源于wiki</a>):</p>

<blockquote><p>我们有24位测试对象,根据其性别和是否在节食,将其分为四类,分类结果如下:</p>

<table>
<thead>
<tr>
<th>$$$\qquad$$$ </th>
<th> 男性 </th>
<th> 女性</th>
</tr>
</thead>
<tbody>
<tr>
<td>节食 </td>
<td> 1 </td>
<td> 9</td>
</tr>
<tr>
<td>不节食 </td>
<td> 11 </td>
<td> 3</td>
</tr>
</tbody>
</table>


<p>现在我们的问题是,是否女性更喜欢节食?从数据直观上来看,男性和女性都是12人,但是节食的女性是男性的9倍,似乎女性的确更容易节食,但是我们如何定量的去描述这件事呢?可以看出,我们要解决的是一个假设检验问题,我们将零假设设定为:<strong>是否节食和性别无关。</strong>那么,在零假设下,根据超几何分布我们观察到表格中数据的概率是:
$$\binom{12}{1}\binom{12}{9} / \binom{24}{10} = 0.001346076$$
而如果我们做一个单尾的检验,那么我们观测到表格中数据或者比表格中数据更极端(即节食男性为0)的概率为:
$$\binom{12}{1}\binom{12}{9} / \binom{24}{10} + \binom{12}{0}\binom{12}{10} / \binom{24}{10} = 0.001379728$$
即fisher精确检验的p-value。我们用R去检验我们计算的结果</p></blockquote>

<pre><code>fisher.test(matrix(c(1, 11, 9, 3), 2, 2), alternative = 'less')

# 结果如下,可以看出与我们计算的结果相同
Fisher's Exact Test for Count Data

data: matrix(c(1, 11, 9, 3), 2, 2)
p-value = 0.00138
alternative hypothesis: true odds ratio is less than 1
95 percent confidence interval:
0.0000000 0.3260026
sample estimates:
odds ratio
0.03723312
</code></pre>

<p>对于双尾的fisher检验,目前还没有好的计算方法,因为对于两个极端并不好定义,目前最简单的方法就是对两个极端,分别计算观测到观测值或者更极端的观测值得概率(例如上例中节食男性为1或者0的情况(一个极端)以及节食男性为9,10,11,12(另一个极端)的情况),并将所得到的概率相加,即为最终的p-value。</p>

<p>Fisher精确检验(fisher&rsquo;s exat test)是进行统计分析时经常碰到的一种检验方法,它基于超几何分布,作用于离散变量,用于检测两种分类方法的结果是否独立。


<a href="/blog/2014/09/03/fishers-exact-test/">Read on &rarr;</a>

</div>
</div>
Expand Down
12 changes: 6 additions & 6 deletions sitemap.xml
Original file line number Diff line number Diff line change
Expand Up @@ -29,42 +29,42 @@

<url>
<loc>http://wangyinanchina.github.io/404.html</loc>
<lastmod>2014-09-05T21:02:00+08:00</lastmod>
<lastmod>2014-09-05T21:04:16+08:00</lastmod>
<changefreq>weekly</changefreq>
<priority>0.7</priority>
</url>

<url>
<loc>http://wangyinanchina.github.io/</loc>
<lastmod>2014-09-05T21:02:00+08:00</lastmod>
<lastmod>2014-09-05T21:04:16+08:00</lastmod>
<changefreq>weekly</changefreq>
<priority>1.0</priority>
</url>

<url>
<loc>http://wangyinanchina.github.io/about/</loc>
<lastmod>2014-09-05T21:02:00+08:00</lastmod>
<lastmod>2014-09-05T21:04:16+08:00</lastmod>
<changefreq>weekly</changefreq>
<priority>0.7</priority>
</url>

<url>
<loc>http://wangyinanchina.github.io/projects/</loc>
<lastmod>2014-09-05T21:02:00+08:00</lastmod>
<lastmod>2014-09-05T21:04:16+08:00</lastmod>
<changefreq>weekly</changefreq>
<priority>0.7</priority>
</url>

<url>
<loc>http://wangyinanchina.github.io/privacy/</loc>
<lastmod>2014-09-05T21:02:00+08:00</lastmod>
<lastmod>2014-09-05T21:04:16+08:00</lastmod>
<changefreq>weekly</changefreq>
<priority>0.7</priority>
</url>

<url>
<loc>http://wangyinanchina.github.io/search.html</loc>
<lastmod>2014-09-05T21:02:00+08:00</lastmod>
<lastmod>2014-09-05T21:04:16+08:00</lastmod>
<changefreq>weekly</changefreq>
<priority>0.7</priority>
</url>
Expand Down

0 comments on commit 6209a6e

Please sign in to comment.