第十章卷积网络

2026年6月7日

第147~150页

在图像训练领域，单个图的像素点非常的多，多到现在的系统根本就处理不了。同时，对于图像，左右的平移变换，还是同一个图，但是对于全连接的网络而言，所有的点与中间层都要重新计算一遍。

所以就引出了卷积神经网络。

10.1 不变性与等变性

不变性， f(x) = f(t(x)) 等变性， f(x) = t(f(x))

其实就是对于图像的平移、变形等的一些操作后，图像依然是那个图像，不会再是其他了

10.2 适用于一维输入的卷积网络

10.2.1 一维卷积操作

一维卷积，是对于周围输入的加权和。

这样的话，就比较容易理解了，核数，就是周围的数量的大小。这样的一个加权和，就可以把输入数据量，直接给➗️核数。相当于把输入个变小了。

10.2.2 填充

主要关注的是第一步与最后一步，涉及了输入数据中不存在的点，该怎么处理？

一种是添加新值，比如0填充；
一种是舍弃覆盖范围外的数据，会造成数据量的减少。

10.2.3 步长、核大小与扩张

步长，能够控制计算一次卷积之后的总数据的数量；核大小，就是单次计算的周围的数量扩张，是每次计算的的覆盖的广度，通过增加w2、w4 的值为0，来扩展核大小

10.2.4

卷积层

没有看懂具体的是为了什么，因为这个卷积的说法，来的太快啦。

输入与卷积核进行卷积。

那就是计算的一个过程呗，就是前面的计算方法而已

10.2.5 Channels

所谓不同的通道，意思是多组权重属性。图10.5 有很明确的显示

10.2.6 卷积网络与感受野

是说的每个输出对应的输入的个数。对于核数3的，第一层，每个输出，包含三个输入；第二层，包含5个输入；依次往后面推算

10.2.7 示例 MNIST-1D

10.3 适用于二维输入的卷积网络

理解是，一个图片的RGB三色图的不同模式。书中说的三个通道，就是三个颜色，这样的话，也理解了通道是个什么东西。

通道的理解：
同一个数据，采用不同的权重去计算，权重的组数，就是通道数

看了后续的不同的卷积网络的应用场景，都是在做数据的切分，维度的减少以及通道的增加，这样可以通过减少计算量，也可以适用前面计算的一维的卷积网络的应用。

后续的图像分类、对象检测、语义分割，都是有相同的说法，让卷积更有效。

10.7 笔记

随着网络的深入，卷积也存在一系列的问题。

总结

我们改如何应对后续可能出现的AI 浪潮？

早在2017 年左右，其实我就已经开始学习了机器学习相关的知识点，在openclaw 大规模进入日常生活之前，我就已经开始了相关的使用与探索。

但是最终的效果并不好，机器学习没有继续的跟进下去。openclaw 的核心应用，但是没有应用到比较高的层次。

活脱脱的起个大早，赶个晚集，这种感觉很不好，无力！

第十章 卷积网络