y=wX+b" role="presentation">y=wX+b
y:图片中有猫的概率
X:图片的矩阵化表示
b:偏置量
问题:为什么通过训练,wx+b可以计算出图片中有猫的概率
分析:
y1=|w1w2w3w4|∗|x1x2x3x4|+b" role="presentation">y1=|w1w2w3w4|∗|x1x2x3x4|+b
y1=w1∗x1+w2∗x2+w3∗x3+w4∗x4+b" role="presentation">y1=w1∗x1+w2∗x2+w3∗x3+w4∗x4+b
X是图片的特征化向量表示,每一个维度代表图片的一个特征
为了方便理解,我们简单假设:
x1:眼睛特征
x2:四肢特征
x3:毛发特征
x4:尾巴特征
那么wx就可以理解为:
w1*x1:眼睛是圆形的概率
w2*x2:耳朵是三角形的概率
w3*x3:体表有毛发概率
w4*x4:身体有尾巴的概率
这样就可以理解为什么wx+b可以表示图片中包含猫的概率了。
当然实际的训练和计算过程没有这么简单,但我认为其中的转换都是这么个道理。
猫图识别过程理解:
原始输入的像素信息,通过第一层计算,可能会得到边缘、弧度等图像特征的数字化表示,这些简单的特征,再通过第二层计算,可能将眼睛、耳朵、毛发、尾巴等特征的数字化表示,以此类推,通过多层转化和计算,就可以识别出图片中是否有猫。
遗留问题:
1. 参数是怎么通过训练得到的?——应该有调整和惩罚措施
2. y=Sigmoid(wX)+b" role="presentation">y=Sigmoid(wX)+b,增加sigmoid函数是否会影响模型训练效果?个人认为不添加激活函数,模型理论上也可以训练出来。