1
\ begingroup美元

我正在研究U-Net CNN的架构。我是cnn的新手,对“频道数量”感到困惑。

参考U-Net图,输入图像与一个3x3掩模进行卷积,生成一个570x570的输出。必威电竞然后,这个输出图像再经过一个3x3掩模的卷积,产生一个568 x 568的信号。必威电竞但是,64对应什么呢?

U-net说了一些关于多通道功能地图的东西。但是用3x3掩模对图像进行卷积是如何得到“64”的呢?必威电竞

在这里输入图像描述

$ \ endgroup $
2
  • \ begingroup美元 相关问题可能帮助您更好地了解(多通道)CNN的结构和功能。 $ \ endgroup $-legammler 4月29日在6:52
  • \ begingroup美元 所以我现在是如何解读U-net图的。该体系结构声明了一组64个卷积掩码,我们正试图对其进行调优。必威电竞因此,将一幅灰度图像与64个掩模进行卷积将产生64个新信号。必威电竞然而,第二个64把我弄糊涂了。如果我们重复这个操作,为什么还有64个频道?我们不是有64 x 64个频道吗? $ \ endgroup $-Izzo. 4月29日在13:22
2
\ begingroup美元

在此示例中,您的灰度图像大小为572x572和1(灰色)通道。第一个卷积运算由64个大小为3x3和每个过滤器1通道。过滤器的通道始终适合上一层的通道大小(此处:输入)。在此显式架构的第二个卷积步骤中,您再次使用64个尺寸3x3过滤器。在这种情况下,这些过滤器中的每一个都包括64个频道根据以前的输出(64特征图/渠道)。第二卷积的输出由64个特征映射组成,根据第二卷积中的64个过滤器的量。这个视频来自Andrew NG完全可视化它。

$ \ endgroup $
1
  • \ begingroup美元 我想我明白了。第一个卷积具有64,3 x 3 x 1滤波器,以产生一个570 x 570 x 64的输出。第二个卷积具有64,3 x 3 x 64滤波器,产生568 x 568 x 64输出。我现在懂算术了,读书的时候肯定看不出来。 $ \ endgroup $-Izzo. Apr 30 0:53

你的答案

点击“发布答案”,您同意我们的同意服务条款隐私政策Cookie政策

不是您要找的答案?浏览其他标记的问题必威英雄联盟必威电竞问你自己的问题