卷积神经网络已经被hiton自己的新的胶囊网络代替,建议多上一点胶囊网络的资料
stargan
他其实就是想取代CNN,只不过capsule现在还不是特别work

动量(Momentum)
随机梯度下降和小批量梯度下降是机器学习中最常见的优化技术,然而在大规模应用和复杂模型中,算法学习的效率是非常低的。而动量策略旨在加速学习过程,特别是在具有较高曲率的情况下。动量算法利用先前梯度的指数衰减滑动平均值在该方向上进行回退 [26]。该算法引入了变量 v 作为参数在参数空间中持续移动的速度向量,速度一般可以设置为负梯度的指数衰减滑动平均值。对于一个给定需要最小化的代价函数,动量可以表达为:

一文概览深度学习中的五大正则化方法和七大优化策略