BP神经网络

1.BP神经网络是什么

BP（Back-propagation，反向传播）神经网络是最传统的神经网络。也就是使用了Back-propagation算法的神经网络。请注意他不是时下流行的那一套深度学习。要训练深度学习level的网络你是不可以使用这种算法的。原因我们后面解释。而其实机器学习的bottleneck就是成功的突破了非常深的神经网络无法用BP算法来训练的问题。

那么反向传播的东西是什么呢？答案是：误差。就是在模拟过程中（这是一个循环，我们在训练神经网络的时候是要不断的去重复这个过程的）收集系统所产生的误差，并且返回这些误差到输出值，之后用这些误差来调整神经元的权重，这样生成一个可以模拟出原始问题的人工神经网络系统。

2.神经网络基础架构

神经网络其实就是几层神经元，每层神经元里有几个神经元点。不同layer之间的神经元相互连接。其实就是如此：

在这，每一个神经元就是三件事：输入，判断和输出。输入层的神经元（就是那个圆形的圈，代表一个神经元或者一个神经细胞）是读入你输入的数据的。只要你有数据，这个玩意就能跑。这就好比你只要有汽油，汽车就能开是一个道理。中间则是”隐含层。你可以控制这个隐含层的层数，以及每一层里有多少个神经元或者神经细胞。当然在实际操作里为了方便我们一般都直接认为你不管用几层，每层的神经元或者神经细胞数目都是一样的。因为这样的话写代码会比较方便。

3. 运算过程：矩阵乘法

我们要把输入在这个数学结构上传递到输出，要怎么办呢？答案是，使用矩阵乘法。其实这样的思路一开始是非常简单的。我们以这个例子来说明：

在这幅图里，我们把上一层的第i个神经元和下一层的第j个神经元之间的权重记为w（ij）。而把上一层传入的三个input，分别记为S（1），S（2）和S（3）。

因为数据肯定是在不同的层之间流动的。我们所做的就是通过一个矩阵乘法求解下一层的输出数值。

这个过程其实也非常简单。我们把输出记为O（1），O（2）和O（3）。结合权重，这个其实不就是一个高中生都可以理解的思想吗？以O（1）举例。O（1）里的输出自然有来自S1，2，3的。那么分别按照权重去乘就可以了。权重自然就是一个大于等于零的实数嘛。

O(1)=S(1)*w（11）+S(2)*w(21)+S(3)*w(31)

类似的我们可以求解出O(2)和O（3）。其实答案也很简单：

O(2)=S(1)*w（12）+S(2)*w(22)+S(3)*w(32)

O(3)=S(1)*w（13）+S(2)*w(23)+S(3)*w(33)

写到这里，熟悉矩阵乘法的同学肯定要恍然大悟了。没错，这就是一个矩阵的乘法！最基础的那种。写成矩阵他应该是什么样呢？

其实答案便是：

我们其实用这种方法，自然可以一层一层的把最左边输入的数据送到最右边来。我们自然可以得到一个结果。但是这个结果有可能是错的吧！所以怎么办呢？我们用真实的结果去和这个结果去比如求差，自然就可以把误差求解出来了。同样的道理，我们可以把误差按照矩阵乘法一路返回。而且在这个过程中，每个神经元和神经线自然可以得到一些”信息“。我们可以用这些信息来修正神经网络，其实也就是给所有的边去赋予不同的权重。