ESPNet: 自动驾驶领域轻量级分割模型
创始人
2024-05-13 22:46:17
0

论文标题:ESPNet: Efficient Spatial Pyramid of Dilated Convolutions for Semantic Segmentation

论文地址:https://arxiv.org/pdf/1803.06815v2.pdf

开源地址: https://github.com/sacmehta/ESPNet


论文思想

ESPNet是用于语义分割的轻量级网络,主要思想基于传统卷积模块设计,提出一种高效空间金字塔卷积模块(ESP Module)

该模块包含point-wise卷积和空洞卷积金字塔,有助于减小模型运算量和内存、功率消耗,以提高在终端设备上的适用性

综合比较,ESPNet能在GPU/笔记本/终端设备上达到112FPS/21FPS/9FPS


具体实施

ESP模块将标准卷积分解成

point-wise卷积和空洞卷积金字塔(spatial pyramid of dilated convolutions)

point-wise卷积将输入映射到低维特征空间

空洞卷积金字塔使用K组空洞卷积的同时下采样得到低维特征

这种分解方法能够大量减少ESP模块的参数量和内存,并且保持较大的有效感受域

在这里插入图片描述
网络架构如下

在这里插入图片描述
在这里插入图片描述


实验结果

在这里插入图片描述
在这里插入图片描述


改进

论文标题:ESPNetv2: A Light-weight, Power Efficient, and General Purpose Convolutional Neural Network

ESPNetv2主要基于ESPNetv1进行了模型轻量化处理,主要包括:

基于深度可分离空洞卷积以及分组point-wise卷积改进ESP模块,提出了EESP(Extremely Efficient Spatial Pyramid)模块

相对于ESPNet拥有更好的精度以及更少的参数

设计了cyclic learning rate scheduler,比一般的固定学习率的scheduler要好

其中下采样版本的EESP模块(Strided EESP with shortcut connection to an input image),主要改进如下

修改深度可分离空洞卷积为stride=2的版本。为模块原本的shortcut添加平均池化操作

将element-wise相加操作替换为concate操作,这样能增加输出的特征维度

为防止随着下采样产生的信息丢失,添加一条连接输入图像的shortcut

该路径使用多个池化操作来使其空间大小与模块输出的特征图一致

然后使用两个卷积来提取特征并调整维度,最后进行element-wise相加

在这里插入图片描述

在这里插入图片描述

相关内容

热门资讯

监控摄像头接入GB28181平... 流程简介将监控摄像头的视频在网站和APP中直播,要解决的几个问题是:1&...
【PdgCntEditor】解... 一、问题背景 大部分的图书对应的PDF,目录中的页码并非PDF中直接索引的页码...
在Word、WPS中插入AxM... 引言 我最近需要写一些文章,在排版时发现AxMath插入的公式竟然会导致行间距异常&#...
protocol buffer... 目录 目录 什么是protocol buffer 1.protobuf 1.1安装  1.2使用...
修复 爱普生 EPSON L4... L4151 L4153 L4156 L4158 L4163 L4165 L4166 L4168 L4...
Windows10添加群晖磁盘... 在使用群晖NAS时,我们需要通过本地映射的方式把NAS映射成本地的一块磁盘使用。 通过...
Fluent中创建监测点 1 概述某些仿真问题,需要创建监测点,用于获取空间定点的数据࿰...
ChatGPT 怎么用最新详细... ChatGPT 以其强大的信息整合和对话能力惊艳了全球,在自然语言处理上面表现出了惊人...
educoder数据结构与算法...                                                   ...
MySQL下载和安装(Wind... 前言:刚换了一台电脑,里面所有东西都需要重新配置,习惯了所...