Blog

一扇雕刻精美的木门,两旁是石柱。门上方悬挂着一盏复古的圆形白色灯笼。门前的地板上有装饰性的瓷砖图案。【人工智能】神经网络如何自动调整

这是上一期提到的感知器公式:

f(x)=W1X1+W2X2+bf(x)=W_{1}X_{1}+W_{2}X_{2}+b

它本质上是一条线,它的目标是分开这分布在二维平面上的点(橙色点的目标值为 1, 蓝色点的为 0):

一个坐标轴包含两类数据和一条分割线

而这条线由 W1W_{1}W2W_{2}bb 共同影响。

所以,问题的关键其实是要知道 WiW_{i}bb 要变大还是变小,变大变小多少?

自动调整

直接告诉你答案吧:

Wi(t)=Wi(t1)+(Yy)xiW_{i(t)} = W_{i(t-1)} + (Y - y) * x_{i} b(t)=b(t1)+(Yy)b_{(t)} = b_{(t-1)} + (Y - y)

YY 是目标值,yy 是输出值。

YYyy 一致,分类正确,(Yy)=0(Y - y)=0,不调整。

当蓝色的点在线上方时,分类错误,(Yy)=1(Y - y)=-1,说明 WiW_{i}bb 太大:

一个坐标轴有一个蓝色的点而线因W2的减小穿过了那个点

当橙色的点在线下方时,分类错误,(Yy)=1(Y - y)=1,说明 WiW_{i}bb 太小:

一个坐标轴有一个橙色的点而线因W2的增大穿过了那个点

乘以 xix_{i} 是因为随着 xix_{i} 变大,WiW_{i} 调整得也应该更大:

一个坐标轴有一个橙色的点而线因W2的增大穿过了那个点

通常,它们还会再被乘个 rr,这会在今后的内容里展开。

Wi(t)=Wi(t1)+(Yy)xirW_{i(t)} = W_{i(t-1)} + (Y - y) * x_{i} * r b(t)=b(t1)+(Yy)rb_{(t)} = b_{(t-1)} + (Y - y) * r

结尾

通过不断调整 WiW_{i}bb 值,机器总能将点分成两类。

试试看,这个能不能被分开:

一个坐标轴里有两类点

About

Avatar

Mark Ivory

一个草稿本而已

Series