目标检测之YOLOv3算法分析
创始人
2024-04-30 22:52:14
0
基本原理

特征网络
在这里插入图片描述

输入输出
输入416∗416∗3416*416*3416∗416∗3大小的图片(不唯一,但图片大小必为32的倍数),输出3个尺度的feature map,分别为13∗13∗25513*13*25513∗13∗255,26∗26∗25526*26*25526∗26∗255,52∗52∗25552*52*25552∗52∗255,即分成13∗1313*1313∗13,26∗2626*2626∗26,52∗5252*5252∗52个grid cell.
每个grid cell生成3个anchor,每个anchor对应一个预测框,每个预测框有5+805+805+80个参数,{(x,y,w,h,c),80kindsofclass}\{(x,y,w,h,c),80 \space kinds \space of \space class\}{(x,y,w,h,c),80 kinds of class}

输出分析
(该图取自知乎博主)
在这里插入图片描述

13∗13∗25513*13*25513∗13∗255,26∗26∗25526*26*25526∗26∗255,52∗52∗25552*52*25552∗52∗255分别预测大,中,小物体。
13∗13∗25513*13*25513∗13∗255为下采样32倍得到的特征;
26∗26∗25526*26*25526∗26∗255为下采样16倍与13∗1313*1313∗13一次上采样结合得到的特征;
52∗52∗25552*52*25552∗52∗255为下采样8倍与26∗2626*2626∗26一次上采样结合得到的特征;

正负样本
正样本为anchor与真实框的IOU大于指定阈值,且最大IOU的anchor;
负样本为anchor与真实框IOU小于指定阈值的anchor。

损失函数
由正样本的坐标损失、置信度损失和类别损失,负样本的置信度损失构成。
λcoord∑i=0S2∑J=0B1i,jobj[(bx−bx^)2+(by−by^)2+(bw−bw^)2+(bh−bh^)2]+∑i=0S2∑J=0B1i,jobj[−log(pc)+∑i=1nBCE(ci,ci^)]+λnoobj∑i=0S2∑J=0B1i,jnoobj[−log(1−pc)]\lambda_{coord} \sum_{i=0}^{S^2}\sum_{J=0}^{B}1_{i,j}^{obj}[(b_x-\hat{b_x})^2+(b_y-\hat{b_y})^2+(b_w-\hat{b_w})^2+(b_h-\hat{b_h})^2]\\+\sum_{i=0}^{S^2}\sum_{J=0}^{B}1_{i,j}^{obj}[-log(p_c)+\sum_{i=1}^{n}BCE(c_i,\hat{c_i})]\\+\lambda_{noobj}\sum_{i=0}^{S^2}\sum_{J=0}^{B}1_{i,j}^{noobj}[-log(1-p_c)]λcoord​i=0∑S2​J=0∑B​1i,jobj​[(bx​−bx​^​)2+(by​−by​^​)2+(bw​−bw​^​)2+(bh​−bh​^​)2]+i=0∑S2​J=0∑B​1i,jobj​[−log(pc​)+i=1∑n​BCE(ci​,ci​^​)]+λnoobj​i=0∑S2​J=0∑B​1i,jnoobj​[−log(1−pc​)]
S2S^2S2为grid cell的总数,BBB为每一个grid cell的anchor数目。
第一行为计算正样本的坐标与真实框的坐标损失;
第二行为计算正样本的置信度和类别损失,1i,jobj1_{i,j}^{obj}1i,jobj​表示是否为正样本;−log(pc)-log(p_c)−log(pc​)中,若pcp_cpc​越接近于1,则−log(pc)-log(p_c)−log(pc​)越接近于0;类别损失中,对于检测的80类,每一个类别进行二叉熵损失运算。
第三行为负样本的置信度损失,−log(1−pc)-log(1-p_c)−log(1−pc​)中pcp_cpc​越接近于0,该式越小,接近于0

性能
在这里插入图片描述

相关内容

热门资讯

监控摄像头接入GB28181平... 流程简介将监控摄像头的视频在网站和APP中直播,要解决的几个问题是:1&...
Windows10添加群晖磁盘... 在使用群晖NAS时,我们需要通过本地映射的方式把NAS映射成本地的一块磁盘使用。 通过...
protocol buffer... 目录 目录 什么是protocol buffer 1.protobuf 1.1安装  1.2使用...
在Word、WPS中插入AxM... 引言 我最近需要写一些文章,在排版时发现AxMath插入的公式竟然会导致行间距异常&#...
【PdgCntEditor】解... 一、问题背景 大部分的图书对应的PDF,目录中的页码并非PDF中直接索引的页码...
Fluent中创建监测点 1 概述某些仿真问题,需要创建监测点,用于获取空间定点的数据࿰...
educoder数据结构与算法...                                                   ...
MySQL下载和安装(Wind... 前言:刚换了一台电脑,里面所有东西都需要重新配置,习惯了所...
修复 爱普生 EPSON L4... L4151 L4153 L4156 L4158 L4163 L4165 L4166 L4168 L4...
MFC文件操作  MFC提供了一个文件操作的基类CFile,这个类提供了一个没有缓存的二进制格式的磁盘...