预训练+微调任务
创始人
2024-04-15 16:39:21
0
1.ELMO微调2.微调阶段下游任务:用训练好的模型继续之后的任务E=r(S1*E1(词特征)+S2*E2(句特征)+S3*E3(语义特征))注意:ELMO并不是把文本编码成向量之后,直接作为下游任务模型输入,而是将ELMO编码的向量作为新的单词特征补充到下游任务。ELMO是基于特征的微调。2.Bert微调:bert通过bert模型,可以编码得到一个句子的句子向量,那么我们不会像ELMO一样把这个向量作为新特征补充到下游任务,而是直接将该向量作为下游任务的输入。当最终代价产生的时候,反向传播,就会将梯度传到句子向量cls上,那么就会更新到bert里边的参数。因此叫做基于微调的模型。
3.GPT微调:GPT通过GPT模型,可以编码得到一个句子的句子向量,那么我们不会像ELMO一样把这个向量作为新特征补充到下游任务,而是直接将该向量作为下游任务的输入。当最终代价产生的时候,反向传播,就会将梯度传到句子向量cls上,那么就会更新到GPT里边的参数。因此叫做基于微调的模型。

相关内容

热门资讯

【PdgCntEditor】解... 一、问题背景 大部分的图书对应的PDF,目录中的页码并非PDF中直接索引的页码...
监控摄像头接入GB28181平... 流程简介将监控摄像头的视频在网站和APP中直播,要解决的几个问题是:1&...
在Word、WPS中插入AxM... 引言 我最近需要写一些文章,在排版时发现AxMath插入的公式竟然会导致行间距异常&#...
protocol buffer... 目录 目录 什么是protocol buffer 1.protobuf 1.1安装  1.2使用...
修复 爱普生 EPSON L4... L4151 L4153 L4156 L4158 L4163 L4165 L4166 L4168 L4...
Windows10添加群晖磁盘... 在使用群晖NAS时,我们需要通过本地映射的方式把NAS映射成本地的一块磁盘使用。 通过...
Fluent中创建监测点 1 概述某些仿真问题,需要创建监测点,用于获取空间定点的数据࿰...
ChatGPT 怎么用最新详细... ChatGPT 以其强大的信息整合和对话能力惊艳了全球,在自然语言处理上面表现出了惊人...
educoder数据结构与算法...                                                   ...
MySQL下载和安装(Wind... 前言:刚换了一台电脑,里面所有东西都需要重新配置,习惯了所...