厦大纪老师chatgpt相关讲座3.7
创始人
2024-05-30 00:22:44
0

在线更新数据,迭代学习训练,进而提高模型性能。
比较明显的是API部分,这一步学习的就是intruction,实现人机写作的复杂系统工程

在这里插入图片描述
数据充足,维基类似于百度百科
transformer结构更有优势,预测下一个字,模型越大,则condition的range大。

模型遗忘是当模型做一个新任务时,就会忘记旧的任务,而模型足够大,就不会发生这种作用。

大的数据+大的模型——chatgpt


**
在这里插入图片描述

下图中的数据,多为猜测。
数据的搜集过程,无法复制?

在这里插入图片描述
论文中给出了标注数据集类型,有QA等等,需要给出提示

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

​​​在这里插入图片描述

不仅给出了答案,还给出推理chain。

无监督预训练:文本语料570g,代码:159g
有监督:12万个训练集,1653个测试集,集合的意思,不是数据集量

在这里插入图片描述

​​

​​

​​​

2、国产大模型硬件基础

不大指望企业,指望国家实验室

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
给标注数据和原始数据,他们把模型做出来。
给data,他们做模型
在这里插入图片描述

在这里插入图片描述

鹏程国家实验室不穷,很有钱

下边的模型花了27个亿

鹏程*神农——新冠预测的模型——4000张GPU卡。
在这里插入图片描述
在这里插入图片描述

国产大模型-神农模型

**用户需求:**蛋白的RDB区域是否病变
**研究动机:**提前预测病毒变异类型

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
蓝色表示结合亲力上升,月蓝色月可能发生变异
在这里插入图片描述

在这里插入图片描述

新颖的多任务损失函数,是什么?新在哪?

在这里插入图片描述

在这里插入图片描述
**在这里插入图片描述
**

流感病毒能直接迁移吗?应该不行吧?流感应该不是看RBD吧?

在这里插入图片描述

可能的未来的方向
给一部电影,写成一本小说。
给一本小说,拍出来一步电影。

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

一轮300万,学生写的代码完蛋

土豪做法是数据或者任务线性排,没钱,做聚类’

在这里插入图片描述

模型压缩

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

洪永淼:
AI领域的问题:
确定性问题(当输入和输出是确定的)
确定性答案

明确的,可控的情况下做模型。
数据量和标注数据的质量有关。

优化算法中,凸优化问题,怎么更新上万个参数?
梯度更新

相关内容

热门资讯

监控摄像头接入GB28181平... 流程简介将监控摄像头的视频在网站和APP中直播,要解决的几个问题是:1&...
Windows10添加群晖磁盘... 在使用群晖NAS时,我们需要通过本地映射的方式把NAS映射成本地的一块磁盘使用。 通过...
protocol buffer... 目录 目录 什么是protocol buffer 1.protobuf 1.1安装  1.2使用...
在Word、WPS中插入AxM... 引言 我最近需要写一些文章,在排版时发现AxMath插入的公式竟然会导致行间距异常&#...
【PdgCntEditor】解... 一、问题背景 大部分的图书对应的PDF,目录中的页码并非PDF中直接索引的页码...
修复 爱普生 EPSON L4... L4151 L4153 L4156 L4158 L4163 L4165 L4166 L4168 L4...
Fluent中创建监测点 1 概述某些仿真问题,需要创建监测点,用于获取空间定点的数据࿰...
educoder数据结构与算法...                                                   ...
MySQL下载和安装(Wind... 前言:刚换了一台电脑,里面所有东西都需要重新配置,习惯了所...
MFC文件操作  MFC提供了一个文件操作的基类CFile,这个类提供了一个没有缓存的二进制格式的磁盘...