SS-ELM-AE与S2-BLS相关论文阅读记录
创始人
2024-05-28 21:15:28
0

Broad learning system for semi-supervised learning

摘要:本文认为,原始BLS采用的稀疏自编码器来生成特征节点是一种无监督学习方法,这意味着忽略了标注数据的一些信息,并且难以保证同类样本之间的相似性和相邻性,同时SS-BLS和BLS都是构造线性模型,当不同类的样本分布存在重叠时,难以取得良好的分类效果。因此本文提出了一种新的半监督BLS——S2-BLS。

SS-ELM-AE

本文认为,SS-BLS或者是SS-ELM在引入非监督信息,即流形化的时候,考虑到选取k近邻点的情况,但是这种方法可能存在的缺点就是如果大多数标注样本它们所选择的k个近邻点都是标注样本,然后大多数无标注样本所选择的k个近邻点都是无标注样本,那么就没有充分利用到标注样本和未标注样本之间的关系。因此将SS-ELM-AE的目标函数定义为:
LSS−ELM−AE=12∥HW−X∥F2+C2∥W∥F2+λ2(GLL+GLU)L_{SS-ELM-AE}=\frac{1}{2}\Vert HW-X\Vert^2_F+\frac{C}{2}\Vert W\Vert^2_F+\frac{\lambda}{2}(G_{LL}+G_{LU}) LSS−ELM−AE​=21​∥HW−X∥F2​+2C​∥W∥F2​+2λ​(GLL​+GLU​)
其中X代表所有样本。而GLL、GLUG_{LL}、G_{LU}GLL​、GLU​分别代表标注样本内部之间的信息以及标注样本和无标注样本之间的信息。

对于标注样本,其相似度矩阵定义为:
SijL={1yi,yj∈t0otherwiseS^L_{ij}=\begin{cases}1\quad y_i,y_j \in t\\0\quad otherwise\end{cases} SijL​={1yi​,yj​∈t0otherwise​
就是属于同类的相似度为1,否则为0。因此GLLG_{LL}GLL​表示为:
GLL=12∑i=1l∑j=1lSijL∥g(xi)−g(xj)∥F2G_{LL}=\frac{1}{2}\sum_{i=1}^l\sum_{j=1}^lS^L_{ij}\Vert g(x_i)-g(x_j)\Vert ^2_F GLL​=21​i=1∑l​j=1∑l​SijL​∥g(xi​)−g(xj​)∥F2​
其中g(x)g(x)g(x)代表模型对样本的输出。

而对于未标注样本,其相似性矩阵定义为:
SijLU={1xi∈knn(xj),j∗orxj∈knn(xi),i∗0otherwiseS^{LU}_{ij}=\begin{cases}1\quad x_i\in knn(x_j),j^* ~~or ~~x_j\in knn(x_i),i^*\\0\quad otherwise\end{cases} SijLU​={1xi​∈knn(xj​),j∗  or  xj​∈knn(xi​),i∗0otherwise​
其中j∗j^*j∗表示如果xjx_jxj​是标注样本,那么其k个近邻点要从未标注样本之中选择。因此
GLU=12∑i=1l+u∑j=1l+uSijLU∥g(xi)−g(xj)∥F2G_{LU}=\frac{1}{2}\sum_{i=1}^{l+u}\sum_{j=1}^{l+u}S^{LU}_{ij}\Vert g(x_i)-g(x_j)\Vert ^2_F GLU​=21​i=1∑l+u​j=1∑l+u​SijLU​∥g(xi​)−g(xj​)∥F2​
那么可以将该矩阵写为:
SLU=(0LLSLUSULSUU)S_{LU}=\left(\begin{matrix}0_{LL}\quad S_{LU}\\S_{UL }\quad S_{UU}\end{matrix}\right) SLU​=(0LL​SLU​SUL​SUU​​)
斜对角线两个矩阵应该是转置关系。SUUS_{UU}SUU​就是简单的knn来计算。因此有:

在这里插入图片描述

其中G=[g(x1);...;g(xl+u)]G=[g(x_1);...;g(x_{l+u})]G=[g(x1​);...;g(xl+u​)]。L定义为:
L=D−SD=diag(d1,...,dl+u),di=∑i=1l+uSijS=(SLSLUSULSUU)L=D-S\\D=diag(d_1,...,d_{l+u}),d_i=\sum_{i=1}^{l+u}S_{ij}\\S=\left(\begin{matrix}S^L\quad S_{LU}\\S_{UL}\quad S_{UU}\end{matrix}\right) L=D−SD=diag(d1​,...,dl+u​),di​=i=1∑l+u​Sij​S=(SLSLU​SUL​SUU​​)
因此可以推导出:
LSS−ELM−AE=12∥HW−X∥F2+C2∥W∥F2+λ2Tr(WTHTLHW)L_{SS-ELM-AE}=\frac{1}{2}\Vert HW-X\Vert^2_F+\frac{C}{2}\Vert W\Vert^2_F+\frac{\lambda}{2}Tr(W^TH^TLHW) LSS−ELM−AE​=21​∥HW−X∥F2​+2C​∥W∥F2​+2λ​Tr(WTHTLHW)
当输出节点输出多于隐藏层节点数目,可解出:

在这里插入图片描述

否则:

在这里插入图片描述

注意这里的损失函数是重构误差,因此可以看成是一个结合ELM思想的AE,是用来求解输入到隐藏层的权重的,而不是像ELM最终求解隐藏层到输出的权重的。

因此求解输入到特征节点映射的权重过程为:
在这里插入图片描述

S2-BLS

该算法就是对原有SS-BLS算法的改良,其利用了同样样本间的相似性和近邻点间的相似性信息来获取映射后的特征,同时考虑了类内紧性和类间可分性,获得更好的判别模型。具体来说:

其特征节点的定义比较特殊,用到了非线性激活函数,即:
Zi=ϕi(XWeiT),i=1,2,...,nZ_i=\phi_{i}(XW^T_{ei}),i=1,2,...,n Zi​=ϕi​(XWeiT​),i=1,2,...,n
其中权重WeiW_{ei}Wei​正是通过SS-ELM-AE来获得的,而ϕ\phiϕ是非线性函数。然后狗仔增强节点的过程与普通BLS相同,因此得到P=[Zn∣Hm]P=[Z^n\mid H^m]P=[Zn∣Hm]

那么在计算输出权重时,其考虑了类内紧性和类间可分性,即:

在这里插入图片描述

因此构造的损失项为:

在这里插入图片描述

其中F=[F1;...;Fl+u]F=[F_1;...;F_{l+u}]F=[F1​;...;Fl+u​]为对每个样本模型的预测向量,Lintra=Dintra−Sintra=diag(d1intra,...,dl+uintra)L_{intra}=D^{intra}-S_{intra}=diag(d^{intra}_1,...,d^{intra}_{l+u})Lintra​=Dintra−Sintra​=diag(d1intra​,...,dl+uintra​),diintra=∑i=1l+uSintraijd^{intra}_i=\sum_{i=1}^{l+u}S^{ij}_{intra}diintra​=∑i=1l+u​Sintraij​。

在这里插入图片描述

其中LinterL_{inter}Linter​也类似。

那么结合这两个L矩阵,可以用参数进行衡量。因此目标函数为:

在这里插入图片描述

其中
U=(Ul×l,000)Ul×l=diag(1,...,1)F=Pβ,β为连接权重L~=ηLintra−(1−η)LinterU=\left(\begin{matrix}U_{l\times l},\quad 0\\~~~0\quad ~~~~0\end{matrix}\right)\\U_{l\times l}=diag(1,...,1)\\F=P\beta, ~~~~\beta 为连接权重\\\tilde{L}=\eta L_{intra}-(1-\eta)L_{inter} U=(Ul×l​,0   0    0​)Ul×l​=diag(1,...,1)F=Pβ,    β为连接权重L~=ηLintra​−(1−η)Linter​
当样本数目多于隐藏层节点数目,可解出

在这里插入图片描述

否则:

在这里插入图片描述
其示意图大致如下所示:
在这里插入图片描述
伪代码如下所示:
在这里插入图片描述

总结

这篇文章从两部分作为创新点,一是原先BLS的AE寻求特征节点映射的部分,这部分它结合了ELM的思想来求解权重向量,第二部分是在求解链接输出的权重时,加入了类内和类间样本之间的关系矩阵。

相关内容

热门资讯

监控摄像头接入GB28181平... 流程简介将监控摄像头的视频在网站和APP中直播,要解决的几个问题是:1&...
Windows10添加群晖磁盘... 在使用群晖NAS时,我们需要通过本地映射的方式把NAS映射成本地的一块磁盘使用。 通过...
protocol buffer... 目录 目录 什么是protocol buffer 1.protobuf 1.1安装  1.2使用...
在Word、WPS中插入AxM... 引言 我最近需要写一些文章,在排版时发现AxMath插入的公式竟然会导致行间距异常&#...
【PdgCntEditor】解... 一、问题背景 大部分的图书对应的PDF,目录中的页码并非PDF中直接索引的页码...
修复 爱普生 EPSON L4... L4151 L4153 L4156 L4158 L4163 L4165 L4166 L4168 L4...
Fluent中创建监测点 1 概述某些仿真问题,需要创建监测点,用于获取空间定点的数据࿰...
educoder数据结构与算法...                                                   ...
MySQL下载和安装(Wind... 前言:刚换了一台电脑,里面所有东西都需要重新配置,习惯了所...
MFC文件操作  MFC提供了一个文件操作的基类CFile,这个类提供了一个没有缓存的二进制格式的磁盘...