在机器学习(ML)中,偏置(Bias) 是一个核心概念,通常指模型预测值与真实值之间的系统性误差。它是模型误差的重要组成部分,与方差(Variance)共同决定了模型的性能。理解偏置对于构建高效、准确的机器学习模型至关重要。
1. 偏置的定义
偏置反映了模型对数据的简化假设与真实关系之间的差距。高偏置意味着模型过于简单,无法捕捉数据的复杂模式,导致欠拟合(Underfitting)。
- 数学表示: 偏置是模型预测值的期望与真实值之间的差异: [ \text{Bias} = E[\hat{f}(x)] - f(x) ] 其中:
- ( \hat{f}(x) ) 是模型的预...