Learning Notes-Deep Learning, course4, week2

Nov 29 2017 learning notes 6 minutes read (About 936 words)

我们继续来看看course4的week2，CNN的知识还是蛮丰富的，本周主要讲了一些经典的CNN结构以及一些computer vision的技巧和知识，一起recap一下。

Classic Networks

Ng一共给我们带来了3个最为经典的CNN网络，这里我会给出网络的截图和paper原文，抽空我也会看看原文，希望大家和我一起来看看。

以上可以说是最为经典的三个cnn网络了，大家可以通过阅读paper获得一些详细的知识，都是经典之作，推荐阅读。

Residual Networks(ResNets)

对于residual networks，我们在这里具体看一下，它的具体原理可以通过下图的residual block来看看：
其实，residual block是把$a^{[l]}$直接作为$a^{[l+2]}$输入，也就是说：

$$a^{[l+2]}=g(z^{[l+2]}+a^{[l]})$$
其中$g$是activation function，如ReLU等。这种思想也被称为short circuit或者skip connection。把上面的residual block串联起来，就变成了我们的residual networks，如下图：

Residual networks最大的特点就是，普通networks随着layer增大，training error理论上是会变小，但是实际上会在某个最小点后增大，但是residual networks则会严格的随着layer增多而减小training error，下面是原文：
He K, Zhang X, Ren S, et al. Deep Residual Learning for Image Recognition[J]. 2015:770-778.

Network in Network and 1×1 Convolutions

通常我们使用的filter，都是奇数的kernel matrix，在某些情况下，1×1的filter也会被我们使用，它到底有什么作用呢？我们来看一张图：

从这张图中可以看出，1×1的filter可以压缩input的channel(depth)，因此1×1filter还是有一些意思的。下面是原文：
Lin M, Chen Q, Yan S. Network In Network[J]. Computer Science, 2013.

Inception Network

关于inception network，我们先来看一张图：

对于同一个input，我们分别采用不同的filter，甚至max pooling，在保证输出的hight和width一样的前提下，将结果堆叠起来，作为我们的输出，这样做的好处是，我们不需要自己挑选filter，我们将所有的可能都交给network，让它来决定去选择什么样子的结构。原文是：
Szegedy C, Liu W, Jia Y, et al. Going deeper with convolutions[C]. Computer Vision and Pattern Recognition. IEEE, 2015:1-9.
同时，Ng在课程上说明，inception network 中大量使用了1×1filter来降低计算量，这一点值得我们注意。
我们来看看Inception 单元的图解：

这一周的课程感觉量很大，介绍了很多的网络，我准备下面慢慢的看看这些paper，站在巨人的肩上去看世界，一定会有别样的风景！

Reference

#CNN

Learning Notes-Deep Learning, course4, week2

Classic Networks

LeNet-5

AlexNet

VGG-16

Residual Networks(ResNets)

Network in Network and 1×1 Convolutions

Inception Network

Reference

Comments

Your browser is out-of-date!