提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
Unet是2015年诞生的模型,它几乎是当前segmentation项
目中应用最广的模型。
Unet已经成为大多做医疗影像语义分割任务的最基础的网络结构。
也启发了大量研究者去思考U型语义分割网络。
即使在自然影像理解方面,也有越来越多的语义分割和目标检测模型
开始关注和使用U型结构
Unet能从更少的训练图像中进行学习。当它在少于 40 张图
的生物医学数据集上训练时,IOU 值仍能达到 92%。
U-net网络非常简单,前半部分作用是特征提取,后半部分是上采样。
在一些文献中也把这样的结构叫做编码器-解码器结构。
由于此网络整体结构类似于大写的英文字母U,故得名U-net。
U-net与其他常见的分割网络有一点非常不同的地方:U-net采用了
完全不同的特征融合方式:拼接(tf.concat)
U-net采用将特征在channel维度拼接在一起,形成更厚的特征。
而FCN融合时使用的对应点相加,并不形成更厚的特征。
语义分割网络在特征融合时有两种办法:
1、网络对图像特征的多尺度特征识别。
2、上采样部分会融合特征提取部分的输出,这样做实际上是将多尺
度特征融合在了一起,以最后一个上采样为例,它的特征既来自第一
个卷积block的输出(同尺度特征),也来自上采样的输出(大尺度特征),
Unet的左侧是convolution layers,
右侧则是upsamping layers,
convolutions layers中每个pooling layer前输出值
会concatenate到对应的upsamping层的输出值中。
注意是concatenate,而FCN是add