PRML笔记4-绪论中推断和决策小结
创始人
2024-05-26 21:04:35
0

推断阶段使用训练数据学习后验概率p(Ck∣x)p(\mathcal{C_k}|\boldsymbol{x})p(Ck​∣x)的模型;在决策阶段使用后验概率进行最优的分类;亦或是同时解决推断和决策问题,简单的学习一个函数f(x)f(\boldsymbol{x})f(x),将输入x\boldsymbol{x}x直接映射为决策,这是函数f(x)f(\boldsymbol{x})f(x)被称为判别函数
有三种不同的方法来解决决策问题,按照复杂度从高到低,分别为:

  1. 对于每一个类别Ck\mathcal{C_k}Ck​,独立地确定类别条件密度p(x∣Ck)p(\boldsymbol{x}|\mathcal{C_k})p(x∣Ck​),随后推断先验类别的概率p(Ck)p(\mathcal{C_k})p(Ck​),最后使用贝叶斯定理求出类别的后验概率p(Ck∣x)=p(x∣Ck)p(Ck)p(x)p(\mathcal{C_k}|\boldsymbol{x})=\frac{p(\boldsymbol{x}|\mathcal{C_k})p(\mathcal{C_k})}{p(\boldsymbol{x})}p(Ck​∣x)=p(x)p(x∣Ck​)p(Ck​)​。其中的p(x)p(\boldsymbol{x})p(x)我们从直观上无法理解其概率,但是转换为全概率公式可表示为:∑kp(x∣Ck)p(Ck)\sum_{\mathcal{k}}p(\boldsymbol{x}|\mathcal{C_k})p(\mathcal{C_k})∑k​p(x∣Ck​)p(Ck​),这样就可以通过数据集得出了。也可以直接对p(x,Ck)p(\boldsymbol{x},\mathcal{C_k})p(x,Ck​)进行建模,这种方法叫做生成式模型,这种模型可以人工生成输入空间(x\boldsymbol{x}x和Ck\mathcal{C_k}Ck​的空间)的数据点。
  2. 直接对类别的后验概率p(Ck∣x)p(\mathcal{C_k}|\boldsymbol{x})p(Ck​∣x)建模,随后通过模型对x\boldsymbol{x}x进行分类,这种方法叫判别式模型
  3. 与概率无关,直接使用一个判别函数f(x)f(\boldsymbol{x})f(x),该函数可以将输入x\boldsymbol{x}x映射为对应的类别Ck\mathcal{C_k}Ck​。
    方法1需要大量的训练数据,但是它对于检测模型中具有低概率的新数据点很有用。如果我们指向进行分类决策,使用方法2和方法3是更好的选择。然而,使用方法3我们未接触后验概率p(Ck∣x)p(\mathcal{C_k}|\boldsymbol{x})p(Ck​∣x),使用后验概率有很多优势,比如:
    a) 最小化风险。如果损失矩阵中的元素时时刻刻都被修改,知道后验概率的话,只需要调整最小风险决策准则即可。
    b) 拒绝选项。 如果给定被拒绝数据点所占比例,后验概率可以让我们确定最小化误差分类和最小化期望损失的拒绝标准。
    c) 补偿类先验概率。 数据集类别分布不平衡的补偿问题。
    d) 组合模型。 将复杂应用拆解为多个小问题,每个子问题都可以通过一个独立的模型解决,因为分布以类别Ck\mathcal{C_k}Ck​为条件时满足独立性。因此p(xI,xB∣Ck)=p(xI∣Ck)p(xB∣Ck)p(\boldsymbol{x_I},\boldsymbol{x_B}|\mathcal{C_k})=p(\boldsymbol{x_I}|\mathcal{C_k})p(\boldsymbol{x_B}|\mathcal{C_k})p(xI​,xB​∣Ck​)=p(xI​∣Ck​)p(xB​∣Ck​),这时我们可以将后验概率表示为:
    p(Ck∣xI,xB)∝p(xI,xB∣Ck)p(Ck)∝p(xI∣Ck)p(xB∣Ck)p(Ck)∝p(Ck∣xI)p(xI)p(Ck∣xB)p(xB)p(Ck)p(Ck)p(Ck)∝p(Ck∣xI)p(xI)p(Ck∣xB)p(xB)p(Ck)∝p(Ck∣xI)p(Ck∣xB)p(Ck)\begin{aligned} p(\mathcal{C_k}|\boldsymbol{x_I},\boldsymbol{x_B})&\propto p(\boldsymbol{x_I},\boldsymbol{x_B}|\mathcal{C_k})p(\mathcal{C_k})\\ &\propto p(\boldsymbol{x_I}|\mathcal{C_k})p(\boldsymbol{x_B}|\mathcal{C_k})p(\mathcal{C_k})\\ &\propto \frac{p(\mathcal{C_k}|\boldsymbol{x_I})p(\boldsymbol{x_I})p(\mathcal{C_k}|\boldsymbol{x_B})p(\boldsymbol{x_B})p(\mathcal{C_k})}{p(\mathcal{C_k})p(\mathcal{C_k})}\\ &\propto \frac{p(\mathcal{C_k}|\boldsymbol{x_I})p(\boldsymbol{x_I})p(\mathcal{C_k}|\boldsymbol{x_B})p(\boldsymbol{x_B})}{p(\mathcal{C_k})}\\ &\propto \frac{p(\mathcal{C_k}|\boldsymbol{x_I})p(\mathcal{C_k}|\boldsymbol{x_B})}{p(\mathcal{C_k})} \end{aligned} p(Ck​∣xI​,xB​)​∝p(xI​,xB​∣Ck​)p(Ck​)∝p(xI​∣Ck​)p(xB​∣Ck​)p(Ck​)∝p(Ck​)p(Ck​)p(Ck​∣xI​)p(xI​)p(Ck​∣xB​)p(xB​)p(Ck​)​∝p(Ck​)p(Ck​∣xI​)p(xI​)p(Ck​∣xB​)p(xB​)​∝p(Ck​)p(Ck​∣xI​)p(Ck​∣xB​)​​其中的p(Ck)p(\mathcal{C_k})p(Ck​)可以通过估计每个类别的数据点所占的比例得到。

相关内容

热门资讯

监控摄像头接入GB28181平... 流程简介将监控摄像头的视频在网站和APP中直播,要解决的几个问题是:1&...
Windows10添加群晖磁盘... 在使用群晖NAS时,我们需要通过本地映射的方式把NAS映射成本地的一块磁盘使用。 通过...
protocol buffer... 目录 目录 什么是protocol buffer 1.protobuf 1.1安装  1.2使用...
在Word、WPS中插入AxM... 引言 我最近需要写一些文章,在排版时发现AxMath插入的公式竟然会导致行间距异常&#...
【PdgCntEditor】解... 一、问题背景 大部分的图书对应的PDF,目录中的页码并非PDF中直接索引的页码...
修复 爱普生 EPSON L4... L4151 L4153 L4156 L4158 L4163 L4165 L4166 L4168 L4...
Fluent中创建监测点 1 概述某些仿真问题,需要创建监测点,用于获取空间定点的数据࿰...
educoder数据结构与算法...                                                   ...
MySQL下载和安装(Wind... 前言:刚换了一台电脑,里面所有东西都需要重新配置,习惯了所...
MFC文件操作  MFC提供了一个文件操作的基类CFile,这个类提供了一个没有缓存的二进制格式的磁盘...