何为神经网络卷积层？

摘要：本文深度讲解了卷积计算的原理，并详细介绍了构成所有卷积网络主干的基本元素，包括卷积层本身、填充和步幅的基本细节、用于在相邻区域汇聚信息的汇聚层，最后给出卷积层和汇聚层的代码示例和CNN框架结构图。

本文分享自华为云社区《神经网络基础部件-卷积层详解》，作者：嵌入式视觉。

前言

在全连接层构成的多层感知机网络中，我们要通过将图像数据展平成一维向量来送入模型，但这会忽略了每个图像的空间结构信息。理想的策略应该是要利用相近像素之间的相互关联性，将图像数据二维矩阵送给模型中学习。

卷积神经网络(convolutional neural network，CNN)正是一类强大的、专为处理图像数据（多维矩阵）而设计的神经网络，CNN 的设计是深度学习中的一个里程碑式的技术。在 Transformer 应用到 CV 领域之前，基于卷积神经网络架构的模型在计算机视觉领域中占主导地位，几乎所有的图像识别、目标检测、语义分割、3D目标检测、视频理解等任务都是以 CNN 方法为基础。

卷积神经网络核心网络层是卷积层，其使用了卷积(convolution)这种数学运算，卷积是一种特殊的线性运算。另外，通常来说，卷积神经网络中用到的卷积运算和其他领域(例如工程领域以及纯数学领域)中的定义并不完全一致。

一，卷积

在理解卷积层之前，我们首先得理解什么是卷积操作。

卷积与傅里叶变换有着密切的关系。例如两函数的傅里叶变换的乘积等于它们卷积后的傅里叶变换，利用此一性质，能简化傅里叶分析中的许多问题。

operation 视语境有时译作“操作”，有时译作“运算”，本文不做区分。

1.1，卷积运算定义

为了给出卷积的定义，这里从现实世界会用到函数的例子出发。

假设我们正在用激光传感器追踪一艘宇宙飞船的位置。我们的激光传感器给出一个单独的输出 x(t)x(t)，表示宇宙飞船在时刻 tt 的位置。xx 和 tt 都是实值的，这意味着我们可以在任意时刻从传感器中读出飞船的位置。

现在假设我们的传感器受到一定程度的噪声干扰。为了得到飞船位置的低噪声估计，我们对得到的测量结果进行平均。显然，时间上越近的测量结果越相关，所以我们采用一种加权平均的方法，对于最近的测量结果赋予更高的权重。我们可以采用一个加权函数 w(a)w(a) 来实现，其中 aa 表示测量结果距当前时刻的时间间隔。如果我们对任意时刻都采用这种加权平均的操作，就得到了一个新的对于飞船位置的平滑估计函数 s :

秒客网

何为神经网络卷积层？

前言

一，卷积

1.1，卷积运算定义

相关文章