卷积神经网络教程 (CNN) – 使用 TensorFlow 在 Python 中开发图像分类器

在这篇博客中，让我们讨论什么是卷积神经网络 (CNN) 以及卷积神经网络背后的架构——旨在解决 图像识别系统和分类问题。卷积神经网络在图像和视频识别、推荐系统和自然语言处理方面有着 广泛的应用。

计算机如何读取图像？

考虑这张纽约天际线的图像，第一眼你会看到很多建筑物和颜色。 那么计算机是如何处理这张图像的呢？

纽约天际线

图像分为3 个颜色通道，即红、绿和蓝。每个颜色通道都映射到图像的像素。

图像处理

然后，计算机识别与 每个像素相关 的值并确定图像的大小。

然而，对于黑白图像，只有一个通道，概念是相同的。

为什么不是全连接网络？

当涉及到卷积神经网络时，我们无法使用全连接网络，原因如下！

考虑下图：

卷积神经网络

在这里，我们考虑了 大小为28x28x3像素的图像输入。如果我们将其输入到卷积神经网络，则第一个隐藏层本身将有大约2352个权重。

但这种情况并不实用。现在，看看这个：

卷积神经网络2

任何通用输入图像的 大小至少为200x200x3像素。第一个隐藏层的大小变成了惊人的 120,000。如果这只是第一个隐藏层，想象一下处理整个复杂图像集所需 的神经元数量。

这会导致过度拟合并且不切实际。因此，我们无法利用完全连接的网络。

什么是卷积神经网络？

卷积神经网络与神经网络一样，由具有可学习 权重和偏差的 神经元组成。每个神经元接收多个输入，对它们进行加权求和，将其传递给 激活函数并以输出响应。

整个网络具有损失函数，我们为神经网络开发的所有提示和技巧仍然适用于卷积神经网络。

很简单，对吧？

神经网络，顾名思义，是一种模仿大脑结构的 机器学习技术。它由称为神经元的学习单元网络组成。

这些神经元学习如何将 输入信号 （例如猫的图片）转换为相应的 输出信号 （例如标签“猫”），形成自动识别的基础。

我们以自动图像识别为例。确定图片是否包含猫的过程涉及 激活函数。如果图片与神经元之前见过的猫图像相似， “猫” 标签就会被激活。

因此， 神经元接触到的标记图像越多，它就越能学会如何识别其他未标记的图像。我们称之为训练神经元的过程。

卷积神经网络的起源

神经网络的智能是不可思议的。 虽然Rosenblatt早在20 世纪 60 年代就 开始研究人工神经网络，但直到2000 年代末，使用神经网络的深度学习才开始兴起。 关键的推动因素是 计算能力和数据集的规模，而谷歌在深度学习方面的开创性研究。2012 年 7 月，谷歌的研究人员将先进的神经网络暴露于从网络上截取的一系列未标记的静态图像视频。