第十章 卷积网络
2026年6月7日
第147~150页
在图像训练领域,单个图的像素点非常的多,多到现在的系统根本就处理不了。同时,对于图像,左右的平移变换,还是同一个图,但是对于全连接的网络而言,所有的点与中间层都要重新计算一遍。
所以就引出了卷积神经网络。
10.1 不变性与等变性
不变性, f(x) = f(t(x)) 等变性, f(x) = t(f(x))
其实就是对于图像的平移、变形等的一些操作后,图像依然是那个图像,不会再是其他了
10.2 适用于一维输入的卷积网络
10.2.1 一维卷积操作
一维卷积,是对于周围输入的加权和。
这样的话,就比较容易理解了,核数,就是周围的数量的大小。这样的一个加权和,就可以把输入数据量,直接给➗️核数。相当于把输入个变小了。
10.2.2 填充
主要关注的是第一步与最后一步,涉及了输入数据中不存在的点,该怎么处理?
一种是添加新值,比如0填充;
一种是舍弃覆盖范围外的数据,会造成数据量的减少。
10.2.3 步长、核大小与扩张
步长,能够控制计算一次卷积之后的总数据的数量; 核大小,就是单次计算的周围的数量 扩张,是每次计算的的覆盖的广度,通过增加w2、w4 的值为0,来扩展核大小
10.2.4
卷积层
没有看懂具体的是为了什么,因为这个卷积的说法,来的太快啦。
输入与卷积核进行卷积。
那就是计算的一个过程呗,就是前面的计算方法而已
10.2.5 Channels
所谓不同的通道,意思是多组权重属性。图10.5 有很明确的显示
10.2.6 卷积网络与感受野
是说的每个输出对应的输入的个数。对于核数3的,第一层,每个输出,包含三个输入;第二层,包含5个输入;依次往后面推算
10.2.7 示例 MNIST-1D
10.3 适用于二维输入的卷积网络
理解是,一个图片的RGB三色图的不同模式。书中说的三个通道,就是三个颜色,这样的话,也理解了通道是个什么东西。
通道的理解:
同一个数据,采用不同的权重去计算,权重的组数,就是通道数
看了后续的不同的卷积网络的应用场景,都是在做数据的切分,维度的减少以及通道的增加,这样可以通过减少计算量,也可以适用前面计算的一维的卷积网络的应用。
后续的图像分类、对象检测、语义分割,都是有相同的说法,让卷积更有效。
10.7 笔记
随着网络的深入,卷积也存在一系列的问题。
总结
我们改如何应对后续可能出现的AI 浪潮?
早在2017 年左右,其实我就已经开始学习了机器学习相关的知识点,在openclaw 大规模进入日常生活之前,我就已经开始了相关的使用与探索。
但是最终的效果并不好,机器学习没有继续的跟进下去。openclaw 的核心应用,但是没有应用到比较高的层次。
活脱脱的起个大早,赶个晚集,这种感觉很不好,无力!