Update 第九章_图像分割.md

修整图片
jnhoodlum · Jan 29, 2021 · 590cfa1 · 590cfa1
1 parent df30679
commit 590cfa1
Showing 1 changed file with 12 additions and 1 deletion.
diff --git a/ch09_图像分割/第九章_图像分割.md b/ch09_图像分割/第九章_图像分割.md
@@ -39,6 +39,7 @@
 ![](img/ch9/figure_9.1.1_2.jpg)
 
 <center>图 4</center>
+
 ### 9.3.2 FCN网络结构？ 
 
 	FCN对图像进行像素级的分类，从而解决了语义级别的图像分割（semantic segmentation）问题。与经典的CNN在卷积层之后使用全连接层得到固定长度的特征向量进行分类（全联接层＋softmax输出）不同，FCN可以接受任意尺寸的输入图像，采用反卷积层对最后一个卷积层的feature map进行上采样, 使它恢复到输入图像相同的尺寸，从而可以对每个像素都产生了一个预测, 同时保留了原始输入图像中的空间信息, 最后在上采样的特征图上进行逐像素分类。
@@ -103,12 +104,15 @@
 ![](img/ch9/figure_9.1.7_1.png)
 
 <center>一个分类网络</center>
+
 ![](img/ch9/figure_9.1.7_2.png)
 
 <center>变为全卷积网络</center>
+
 ![](img/ch9/figure_9.1.7_3.png)
 
 <center>End-to-end, pixels-to pixels网络</center>
+
 ![](img/ch9/figure_9.1.7_4.jpg)
 
 
@@ -135,14 +139,17 @@ Upsampling的操作可以看成是反卷积(deconvolutional)，卷积运算的
 ![](img/ch9/figure_9.1.8_1.png)
 
 <center>上图中的反卷积，input是2×2, output是4×4。     Zero padding, non-unit strides, transposed。</center>
+
 ![](img/ch9/figure_9.1.8_2.png)
+
 <center>上图中的反卷积，input feature map是3×3, 转化后是5×5, output是5×5</center>
 ### 9.2.8 跳级(skip)结构
 
 &emsp;&emsp;
 对CNN的结果做处理，得到了dense prediction，而作者在试验中发现，得到的分割结果比较粗糙，所以考虑加入更多前层的细节信息，也就是把倒数第几层的输出和最后的输出做一个fusion，实际上也就是加和：
 
 ![](img/ch9/figure_9.1.9_1.png)  
+
 &emsp;&emsp;
 实验表明，这样的分割结果更细致更准确。在逐层fusion的过程中，做到第三行再往下，结果又会变差，所以作者做到这里就停了。
 
@@ -169,28 +176,32 @@ Upsampling的操作可以看成是反卷积(deconvolutional)，卷积运算的
 *对于不同尺寸的输入图像，各层数据的尺寸（height，width）相应变化，深度（channel）不变。*
 
 ![](img/ch9/figure_9.1.10_1.png)  
+
 &emsp;&emsp;
 （1）全卷积层部分进行特征提取, 提取卷积层（3个蓝色层）的输出来作为预测21个类别的特征。
 
-&emsp;&emsp;
+&emsp;&emsp;&emsp;&emsp;
 （2）图中虚线内是反卷积层的运算, 反卷积层（3个橙色层）可以把输入数据尺寸放大。和卷积层一样，升采样的具体参数经过训练确定。    
 
 &emsp;&emsp;&emsp;&emsp;
 1) 以经典的AlexNet分类网络为初始化。最后两级是全连接（红色），参数弃去不用。
 
 ![](img/ch9/figure_9.1.10_2.png)
+
 &emsp;&emsp;&emsp;&emsp;
 2) 从特征小图（）预测分割小图（），之后直接升采样为大图。
 
 ![](img/ch9/figure_9.1.10_3.png)
 
 <center>反卷积（橙色）的步长为32，这个网络称为FCN-32s</center>  
+
 &emsp;&emsp;&emsp;&emsp;
 3) 升采样分为两次完成（橙色×2）, 在第二次升采样前，把第4个pooling层（绿色）的预测结果（蓝色）融合进来。使用跳级结构提升精确性。
 
 ![](img/ch9/figure_9.1.10_4.png)
 
 <center>第二次反卷积步长为16，这个网络称为FCN-16s</center>
+
 &emsp;&emsp;&emsp;&emsp;
 4) 升采样分为三次完成（橙色×3）, 进一步融合了第3个pooling层的预测结果。