2026年3月25日

第93~96页

反向传播算法是一种同时计算所有这些导数的高校方法,主要是两个步骤

  1. 前向传播,计算并保存一系列中间值及网络的输出结果
  2. 反向传播,从网络的输出层开始,逆向计算每个参数的导数,同时复用之前阶段的计算结果 作者用了大量的篇幅去介绍反向算法,这个就极其深入了,暂时看不太懂,只能知道里面再干什么,具体如何计算的,怎么样求导的,就不怎么了解了

反向传播不仅过程简化,而且效率更高。

7.4 反向传播算法

本节介绍的是一个三层网络的反向传播算法,中间变量是 向量形式,偏置也是向量

总结一下

就是在每一轮计算导数时,使用前一轮计算的中间结果,加快后续的计算,就像是非比纳契数列一样,本轮使用前一轮的计算的结果,就不会进行重复的计算了,也就可以加快计算速度。

就是计算机里面算法里面的递归调用,这么理解的话,应该更容易接受一些。