Skip to content

Commit

Permalink
Merge pull request scutan90#507 from l0rraine/l0rraine-patch-1
Browse files Browse the repository at this point in the history
L0rraine patch 1
  • Loading branch information
scutan90 authored Mar 17, 2021
2 parents 196ebda + 590cfa1 commit c296062
Showing 1 changed file with 13 additions and 2 deletions.
15 changes: 13 additions & 2 deletions ch09_图像分割/第九章_图像分割.md
Original file line number Diff line number Diff line change
Expand Up @@ -12,7 +12,7 @@

为图像中的每个像素分配一个类别,如把画面中的所有物体都指出它们各自的类别。

![](img/ch9/Semantic-01.png)
![](img/ch9/semantic-01.png)

**2.实例分割**

Expand All @@ -39,6 +39,7 @@
![](img/ch9/figure_9.1.1_2.jpg)

<center>图 4</center>

### 9.3.2 FCN网络结构?

​ FCN对图像进行像素级的分类,从而解决了语义级别的图像分割(semantic segmentation)问题。与经典的CNN在卷积层之后使用全连接层得到固定长度的特征向量进行分类(全联接层+softmax输出)不同,FCN可以接受任意尺寸的输入图像,采用反卷积层对最后一个卷积层的feature map进行上采样, 使它恢复到输入图像相同的尺寸,从而可以对每个像素都产生了一个预测, 同时保留了原始输入图像中的空间信息, 最后在上采样的特征图上进行逐像素分类。
Expand Down Expand Up @@ -103,12 +104,15 @@
![](img/ch9/figure_9.1.7_1.png)

<center>一个分类网络</center>

![](img/ch9/figure_9.1.7_2.png)

<center>变为全卷积网络</center>

![](img/ch9/figure_9.1.7_3.png)

<center>End-to-end, pixels-to pixels网络</center>

![](img/ch9/figure_9.1.7_4.jpg)


Expand All @@ -135,14 +139,17 @@ Upsampling的操作可以看成是反卷积(deconvolutional),卷积运算的
![](img/ch9/figure_9.1.8_1.png)

<center>上图中的反卷积,input是2×2, output是4×4。 Zero padding, non-unit strides, transposed。</center>

![](img/ch9/figure_9.1.8_2.png)

<center>上图中的反卷积,input feature map是3×3, 转化后是5×5, output是5×5</center>
### 9.2.8 跳级(skip)结构

&emsp;&emsp;
对CNN的结果做处理,得到了dense prediction,而作者在试验中发现,得到的分割结果比较粗糙,所以考虑加入更多前层的细节信息,也就是把倒数第几层的输出和最后的输出做一个fusion,实际上也就是加和:

![](img/ch9/figure_9.1.9_1.png)

&emsp;&emsp;
实验表明,这样的分割结果更细致更准确。在逐层fusion的过程中,做到第三行再往下,结果又会变差,所以作者做到这里就停了。

Expand All @@ -169,28 +176,32 @@ Upsampling的操作可以看成是反卷积(deconvolutional),卷积运算的
*对于不同尺寸的输入图像,各层数据的尺寸(height,width)相应变化,深度(channel)不变。*

![](img/ch9/figure_9.1.10_1.png)

&emsp;&emsp;
(1)全卷积层部分进行特征提取, 提取卷积层(3个蓝色层)的输出来作为预测21个类别的特征。

&emsp;&emsp;
&emsp;&emsp;&emsp;&emsp;
(2)图中虚线内是反卷积层的运算, 反卷积层(3个橙色层)可以把输入数据尺寸放大。和卷积层一样,升采样的具体参数经过训练确定。

&emsp;&emsp;&emsp;&emsp;
1) 以经典的AlexNet分类网络为初始化。最后两级是全连接(红色),参数弃去不用。

![](img/ch9/figure_9.1.10_2.png)

&emsp;&emsp;&emsp;&emsp;
2) 从特征小图()预测分割小图(),之后直接升采样为大图。

![](img/ch9/figure_9.1.10_3.png)

<center>反卷积(橙色)的步长为32,这个网络称为FCN-32s</center>

&emsp;&emsp;&emsp;&emsp;
3) 升采样分为两次完成(橙色×2), 在第二次升采样前,把第4个pooling层(绿色)的预测结果(蓝色)融合进来。使用跳级结构提升精确性。

![](img/ch9/figure_9.1.10_4.png)

<center>第二次反卷积步长为16,这个网络称为FCN-16s</center>

&emsp;&emsp;&emsp;&emsp;
4) 升采样分为三次完成(橙色×3), 进一步融合了第3个pooling层的预测结果。

Expand Down

0 comments on commit c296062

Please sign in to comment.