一、权重衰退的定义
权重衰退(Weight Decay)是一种在机器学习,特别是神经网络训练过程中经常使用的正则化方法。其主要目的是防止模型过拟合。
在神经网络中,模型的参数(也就是权重)会在训练过程中根据损失函数的梯度不断更新。而权重衰退会在每次更新权重时,给权重一个额外的衰减力,让权重的值不会变得过大。简单来说,它在损失函数中添加了一个惩罚项,这个惩罚项与权重的大小有关。
从数学角度看,假设原始的损失函数是 $L(\theta)$,其中 $\theta$ 代表模型的所有参数(权重)。加入权重衰退后的损失函数可以写成:$L(\theta)+\frac{\lambda}{2}\sum_{...