Momentum(动量)是机器学习和深度学习中广泛使用的一种优化技术,用于改进梯度下降算法的性能。它通过引入“速度”项来平滑优化过程,解决梯度下降中常见的收敛慢、振荡和陷入局部最优等问题。以下是关于Momentum的详细介绍,包括其原理、优势和应用场景。
1. Momentum 是什么?
Momentum 是梯度下降算法的一种扩展,通过累积历史梯度(速度)来更新模型参数。这种方法可以帮助算法在优化过程中保持方向性和速度,特别是在梯度噪声较大或振荡明显的区域。
- 数学公式: Momentum 的更新规则如下: [ v_t = \beta v_{t-1} + (1 - \bet...