VGG-16 网络结构详解 - 深度学习卷积神经网络
VGG-16 是一种深度卷积神经网络,由牛津大学的研究团队于 2014 年提出。它是一个 16 层的卷积神经网络,具有非常深的网络结构。下面是 VGG-16 的结构:
-
输入层:输入图像的大小为 224x224x3。
-
卷积层 1:使用 64 个 3x3 的卷积核进行卷积操作,步长为 1,padding 为 1,激活函数使用 ReLU,输出特征图的大小为 224x224x64。
-
卷积层 2:使用 64 个 3x3 的卷积核进行卷积操作,步长为 1,padding 为 1,激活函数使用 ReLU,输出特征图的大小为 224x224x64。
-
池化层 1:使用 2x2 的池化核进行最大池化操作,步长为 2,输出特征图的大小为 112x112x64。
-
卷积层 3:使用 128 个 3x3 的卷积核进行卷积操作,步长为 1,padding 为 1,激活函数使用 ReLU,输出特征图的大小为 112x112x128。
-
卷积层 4:使用 128 个 3x3 的卷积核进行卷积操作,步长为 1,padding 为 1,激活函数使用 ReLU,输出特征图的大小为 112x112x128。
-
池化层 2:使用 2x2 的池化核进行最大池化操作,步长为 2,输出特征图的大小为 56x56x128。
-
卷积层 5:使用 256 个 3x3 的卷积核进行卷积操作,步长为 1,padding 为 1,激活函数使用 ReLU,输出特征图的大小为 56x56x256。
-
卷积层 6:使用 256 个 3x3 的卷积核进行卷积操作,步长为 1,padding 为 1,激活函数使用 ReLU,输出特征图的大小为 56x56x256。
-
卷积层 7:使用 256 个 3x3 的卷积核进行卷积操作,步长为 1,padding 为 1,激活函数使用 ReLU,输出特征图的大小为 56x56x256。
-
池化层 3:使用 2x2 的池化核进行最大池化操作,步长为 2,输出特征图的大小为 28x28x256。
-
卷积层 8:使用 512 个 3x3 的卷积核进行卷积操作,步长为 1,padding 为 1,激活函数使用 ReLU,输出特征图的大小为 28x28x512。
-
卷积层 9:使用 512 个 3x3 的卷积核进行卷积操作,步长为 1,padding 为 1,激活函数使用 ReLU,输出特征图的大小为 28x28x512。
-
卷积层 10:使用 512 个 3x3 的卷积核进行卷积操作,步长为 1,padding 为 1,激活函数使用 ReLU,输出特征图的大小为 28x28x512。
-
池化层 4:使用 2x2 的池化核进行最大池化操作,步长为 2,输出特征图的大小为 14x14x512。
-
卷积层 11:使用 512 个 3x3 的卷积核进行卷积操作,步长为 1,padding 为 1,激活函数使用 ReLU,输出特征图的大小为 14x14x512。
-
卷积层 12:使用 512 个 3x3 的卷积核进行卷积操作,步长为 1,padding 为 1,激活函数使用 ReLU,输出特征图的大小为 14x14x512。
-
卷积层 13:使用 512 个 3x3 的卷积核进行卷积操作,步长为 1,padding 为 1,激活函数使用 ReLU,输出特征图的大小为 14x14x512。
-
池化层 5:使用 2x2 的池化核进行最大池化操作,步长为 2,输出特征图的大小为 7x7x512。
-
全连接层 1:将 7x7x512 的特征图展开成一个向量,并使用 4096 个神经元进行全连接操作,激活函数使用 ReLU。
-
全连接层 2:将上一层的输出再次使用 4096 个神经元进行全连接操作,激活函数使用 ReLU。
-
全连接层 3:将上一层的输出再次使用 1000 个神经元进行全连接操作,激活函数使用 Softmax。
VGG-16 在 ImageNet 数据集上进行了训练,并在图像分类、物体检测和语义分割等任务中取得了非常好的效果。
原文地址: https://www.cveoy.top/t/topic/nvtd 著作权归作者所有。请勿转载和采集!