0
\ begingroup美元

在ConvNet中,在确定了它的层数之后,还需要确定层数过滤器的大小深度每一层。空间过滤器大小背后的直觉是必须被考虑来执行识别/检测任务的图像像素的数量。必威电竞但是,我仍然没有找到深度决定背后的直觉。128和256在文献中被大量使用,但是为什么呢?

| 改善这个问题 | |
\ endgroup美元
  • \ begingroup美元 你所说的“卷积滤波器的深度”是指数量过滤器,对吧? \ endgroup美元- - - - - -nbro 9月8日10:19
  • \ begingroup美元 是的,每层的过滤器数量 \ endgroup美元- - - - - -尤里 9月9日11:23
0
\ begingroup美元

通道大小为32、128等,因为内存和效率而被使用。这些数字没有什么神圣之处。

选择通道数量背后的直觉是这样的——初始层提取低级特征——它们包括边缘检测器等。这样的功能并不多。所以,我们不会通过增加很多滤镜得到很多(当然,如果我们在RGB图像上使用3x3滤镜,即使我们的神经元只有0和1作为它们的值,我们也会有2^27个不同的滤镜。然而,它们中的大多数对于我们的工作来说是非常相似的/毫无意义的)。使用过多的过滤器甚至可能导致过拟合。

后一层负责从之前提取的较低层次特征中检测出更细微的特征,比如肘部/鼻子形状。所以,如果我们增加频道的数量,我们可能会做得更好。另外,请注意,随着我们的深入,结果层变得越来越稀疏。

虽然它可能在应用中有所不同,比如超分辨率图像,一般来说,通道的数量保持不变,或者当我们深入时增加。

一个不错的实验是尝试增加频道的数量,直到你没有更多的收益。我相信有一篇论文正是这样做的(如果有人记得,请引用它)。你甚至可以尝试在这个阶段可视化过滤器,看看过滤器是否相似。

希望它可以帮助。

| 改善这个答案 | |
\ endgroup美元

    你的答案

    点击“发布您的答案”,即表示您同意我们的服务条款,隐私政策饼干的政策

    不是你想要的答案吗?浏览其他已标记的问题必威英雄联盟必威电竞问你自己的问题