监督学习(Supervised Learning)是指从标注数据中学习预测模型的机器学习问题,其本质是学习输入到输出的映射的统计规律。
一般情况下,输入空间和特征空间相同,但在下面核技巧该情况下则不同!
核技巧:通过一个非线性变化,将输入空间对应到特征空间上。
比如下面这种情况:
输入空间: R2\mathbf{R}^2R2; 实例: x=(x(1),x(2))Tx=\left(x^{(1)}, x^{(2)}\right)^Tx=(x(1),x(2))T
ϕ(x):R2→H;ϕ(x)=((x(1))2,2x(1)x(2),(x(2))2)T\phi(x): \mathbf{R}^2 \rightarrow \mathcal{H} ; \quad \phi(x)=\left(\left(x^{(1)}\right)^2, \sqrt{2} x^{(1)} x^{(2)},\left(x^{(2)}\right)^2\right)^Tϕ(x):R2→H;ϕ(x)=((x(1))2,2x(1)x(2),(x(2))2)T
ϕ(x)\phi(x)ϕ(x)特征空间变成三维,但输入空间还是二维,故明显不是一个空间。
根据变量类型不同:
输入变量与输出变量均为连续变量的预测问题 ------ 回归问题
输出变量为有限个离散变量的预测问题 ------ 分类问题
输入变量与输出变量均为变量序列的预测问题 ------- 标注问题
输入变量:X; 输入变量的取值:x
输出变量:Y; 输出变量的取值:y
输入实例X的特征向量表示:
x=(x(1),x(2),⋯,x(j),⋯,x(nˉ))Tx=\left(x^{(1)}, x^{(2)}, \cdots, x^{(j)}, \cdots, x^{(\bar{n})}\right)^T x=(x(1),x(2),⋯,x(j),⋯,x(nˉ))T
样本容量为N的训练集:
T={(x1,y1),(x2,y2)⋯,(xN,yN)}T=\left\{\left(x_1, y_1\right),\left(x_2, y_2\right) \cdots,\left(x_N, y_N\right)\right\} T={(x1,y1),(x2,y2)⋯,(xN,yN)}
监督学习的目的:学习一个输入到输出的映射,这一映射以模型表示
模型的形式:条件概率分布P(Y∣X)P(Y\mid X)P(Y∣X)或决策函数Y=f(X)Y=f(X)Y=f(X)
假设空间(Hypothesis Space):所有这些可能模型的集合。
注:以上笔记素材来自:B站简博士,十分钟 机器学习 系列视频 《统计学习方法》
下一篇:软件和硬件中的调用