本站原创文章,转载请说明来自《老饼讲解-机器学习》www.bbbdata.com
本文讲述带阈值的线性模型与无阈值线性模型之间的转化方法
01. 线性模型的样本中心化
本节介绍如何通过"样本中心化"的方法,将线性模型转为无阈值线性模型
思路与推导
对于无阈值的线性模型y=wx,如何使它适用于需要阈值的样本呢?
如果样本的中心是处在原点的,
那么,完全就可以用模型 y=wx来拟合,而不需要用y=wx+b
因此,可以先把数据中心化,即
X′=X−Xˉ
Y′=Y−Yˉ
然后使用模型y′=w′x′拟合X′、Y′的关系
在得到中心化数据X′、Y′的模型y′=w′x′后
我们再反推出原始数据的模型
由于X′、Y′是X、Y中心化后的数据,
所以变量x与x′,y与y′之间的关系为:
x′=x−Xˉ
y′=y−Yˉ
从而得到:
⇒⇒y′y−Yˉy===w′x′w′(x−Xˉ)w′x−(w′Xˉ+Yˉ)
实际操作
1.数据中心化
先将原始数据X,Y进行中心化,得到
X′=X−Xˉ
Y′=Y−Yˉ
2.训练无阈值模型
使用中心化数据X',Y'训练无阈值模型
y′=w′x′
3.反推出原数据的带阈值模型
根据无阈值模型的参数w′和中心值,
反推出原数据的带阈值模型
y=wx+b
其中
w=w′
b=−w′Xˉ+Yˉ
End