特征归一化(Feature Normalization),也称为特征缩放(Feature Scaling),是机器学习和数据分析中的一种数据预处理步骤,目的是将数据集中的特征(输入变量)转换到一个统一的标准尺度。许多机器学习算法在输入特征尺度相近时表现更好或收敛更快,因此特征归一化尤为重要。当特征的量纲或范围差异较大时(例如,年龄以“岁”为单位,收入以“元”为单位),归一化就显得非常必要。
常用的特征归一化方法
- 最小-最大归一化(Min-Max Scaling):
- 将特征缩放到一个固定的范围,通常是 [0, 1]。
- 公式:
[ X_{\text{归一化}} = \...