深度学习
深度学习是人工神经网络 2006 年后重获新生的名称,伴随着其实际应用中的超越式效果而风靡全球。使之成为可行的方法的计算设备 GPU 也因此大卖特卖,成为深度学习研究必备利器。
人工神经网络已经可以实现任意复杂度连续函数的逼近,这个可以在 Michael Nielsen 的《神经网络和深度学习》书中看到神经网络可以计算任何函数的具体化的证明。而深度学习则可以利用超多的隐藏层来提升表示的能力(浅层网络需要指数级的隐藏元个数才能达到相当的深层网络的表达能力)。深度学习的表示其实是大量函数的复合,并可以通过反向传播进行训练,参见下图。
现在深度学习已经席卷了语音识别、图像识别、计算机视觉、自然语言处理乃至视频预测等领域,主要的两种网络 CNN 和 RNN 完成了空间和时间的完备。但由于对于深度学习本身仍旧有太多的认知空白,一部分人仍然对其无法完全接受。尽管这样,我还是想建议大家去了解它,你可以从书本开始,比如说前面提到的《神经网络和深度学习》还有来自蒙特利尔大 的《深度学习》,来走进这个领域。这本书包含了深度学习学习、研究及应用所有需要的概念和直觉(并不含强化学习)。