步长-


“stride”这个词在不同的语境中有不同的含义,在计算机科学,特别是深度学习领域以及日常用语中有以下解释:

一、在深度学习(卷积神经网络 - CNN)中的含义

  1. 定义
  2. 在卷积神经网络中,“stride”(步长)是指卷积核在输入数据(如图像、序列等)上滑动的步长大小。它决定了卷积操作后输出特征图(Feature Map)的尺寸。例如,在一个二维图像的卷积操作中,卷积核从左上角开始,按照指定的步长向右和向下滑动,对覆盖的区域进行卷积计算。

  3. 对输出特征图尺寸的影响

  4. 对于输入数据大小为(W_{in})(宽度)、(H_{in})(高度),卷积核大小为(k)(假设为正方形卷积核),步长为(s),填充为(p)的二维卷积操作,输出特征图的宽度(W_{out})和高度(H_{out})可以通过以下公式计算:
    • (W_{out}=\frac{W_{in}+2p - k}{s}+1)
    • (H_{out}=\frac{H_{in}+2p - k}{s}+1)
  5. 例如,有一个输入图像大小为(28\times28)像素,使用一个(3\times3)的卷积核,步长为(2),填充为(0),则输出特征图的宽度为(\frac{28 + 2\times0 - 3}{2}+1 = 13),高度也为(13),即输出特征图大小为(13\times13)。
  6. 作用与应用场景
  7. 减少数据维度和计算量:通过设置合适的步长,可以有效地减少输出特征图的尺寸,从而减少后续网络层的计算量和参数数量。在处理高分辨率图像或长序列数据时,较大的步长可以快速降低数据维度,使网络更高效地运行。例如,在实时目标检测系统中,为了快速处理视频帧中的图像,可能会使用较大步长的卷积操作来加速特征提取过程。
  8. 调整感受野(Receptive Field):步长也会影响神经元的感受野大小。一般来说,较大的步长会使感受野增大得更快,有助于网络更快地获取更宏观的特征。在语义分割任务中,合理调整步长可以平衡局部细节特征和全局语义特征的提取,使网络既能捕捉到足够的细节信息,又能考虑到物体的整体结构和语义类别。

二、日常含义

  1. 作名词
  2. 大步;阔步;步幅:例如,“He walked with long strides.(他大步流星地走着。)”这里“stride”描述了走路时步伐的幅度较大。
  3. 进展;进步;发展:“The company has made great strides in technology innovation.(公司在技术创新方面取得了巨大进步。)”用于表示在某个领域取得的进步或进展程度。

  4. 作动词

  5. 大步走;阔步前进:“She strode across the stage with confidence.(她自信地大步走过舞台。)”体现了一个人走路时豪迈、自信的状态,步伐较大且有气势。
  6. 跨越;跨过:“He strode over the puddle.(他跨过了水坑。)”表示以大步的方式跨越障碍物。