优点: SGD算法的收敛速度比 sigmoid 和 tanh 快;(梯度不会饱和,解决了梯度消失问题)SGD算法的收敛速度比 sigmoid 和 tanh 快;(梯度不会饱和, 你的当前访问异常,请进行认证后继续阅读剩余内容。 提交