特征角度评估 是在 AI 赋能前对数据的特征进行详细分析和评估的过程。特征(或变量)在机器学习模型中的作用至关重要,因为它们直接影响模型的性能、准确性和可解释性。特征角度评估的目的是确保所选特征能够为模型提供足够的信息,以帮助其有效地进行预测或分类,同时避免不必要的复杂性或误导性特征。
特征角度的评估通常包括以下几个方面:
1. 特征的相关性分析
评估特征与目标变量(标签)之间的关系是特征选择的关键步骤。以下是相关性分析的常用方法:
1.1 相关性系数(Correlation Coefficient)
- Pearson 相关系数:用于度量两个连续变量之间的线性相关性,范围从 -1(完全负...