56 门控循环单元(GRU)【动手学深度学习v2】
创始人
2024-05-24 04:04:13
0

56 门控循环单元(GRU)【动手学深度学习v2】

深度学习学习笔记
学习视频:https://www.bilibili.com/video/BV1mf4y157N2/?spm_id_from=autoNext&vd_source=75dce036dc8244310435eaf03de4e330

门控循环单元GRU
GRU和LSTM 实际上效果差不多。

做RNN处理不了太长序列,因为信息都在隐藏状态中,如果序列太长隐藏状态就累计太多东西,对前面的信息就不太好抽取信息。

序列中每个观察值都不是同等重要,实际句子中也就是关键字和关键句比较重要。门控神经网络,通过一些门控单元,去选择一些比较重要的关注的地方。
有两种门,更新门:这个数据比较重要,尽量的放到隐藏层里面;重置门:不太重要的部分,可以忘记掉。
**在这里插入图片描述
门:**一个层,σ(sigmoid将值变为0-1之间)
Rt和Zt两个门。
Ht-1 、Xt 并在一起,进入一个全连接成,然后得到输出。
在这里插入图片描述

**候选隐状态:**使用tanh作为激活函数。 【圈】按元素乘法的意思。Rt是一个0-1的值,Rt靠近0的话,变向0,就是将上一个隐藏层的信息全忘掉。Rt=0的话,从0初始化开始;Rt=1,上一层隐藏层信息全要。所以Rt 是一个控制单元,控制上一层的信息给到下一层信息。
在这里插入图片描述

隐状态: 真正的隐状态,Zt按元素点乘Ht-1(上一层的隐藏层状态),加上(1-Zt)点乘候选隐藏层状态。
在这里插入图片描述
可学习权重是之前RNN的2-3倍。
两个门是控制单元,重置门用来控制新隐藏状态要用到多少过去隐藏状态的信息;更新门新的隐藏状态要用到当前新的隐藏信息多少。因为它们的值都是在0-1区间。

在这里插入图片描述

相关内容

热门资讯

监控摄像头接入GB28181平... 流程简介将监控摄像头的视频在网站和APP中直播,要解决的几个问题是:1&...
Windows10添加群晖磁盘... 在使用群晖NAS时,我们需要通过本地映射的方式把NAS映射成本地的一块磁盘使用。 通过...
protocol buffer... 目录 目录 什么是protocol buffer 1.protobuf 1.1安装  1.2使用...
在Word、WPS中插入AxM... 引言 我最近需要写一些文章,在排版时发现AxMath插入的公式竟然会导致行间距异常&#...
【PdgCntEditor】解... 一、问题背景 大部分的图书对应的PDF,目录中的页码并非PDF中直接索引的页码...
Fluent中创建监测点 1 概述某些仿真问题,需要创建监测点,用于获取空间定点的数据࿰...
educoder数据结构与算法...                                                   ...
MySQL下载和安装(Wind... 前言:刚换了一台电脑,里面所有东西都需要重新配置,习惯了所...
修复 爱普生 EPSON L4... L4151 L4153 L4156 L4158 L4163 L4165 L4166 L4168 L4...
MFC文件操作  MFC提供了一个文件操作的基类CFile,这个类提供了一个没有缓存的二进制格式的磁盘...