什么是 PCA
在如今这个数据爆炸的时代,我们所接触的数据维度越来越高。就拿图像数据来说,一张普通的彩色图片,若分辨率为 1920×1080,每个像素点由 RGB 三个颜色通道表示,那么这张图片的数据维度就高达 1920×1080×3,这是一个极其庞大的数字 。在生物信息学领域,基因表达数据中常常包含成千上万个基因的表达量,维度同样高得惊人。高维度数据虽然包含了丰富的信息,但也带来了诸多问题,比如计算量大幅增加,模型训练时间变长,还容易出现过拟合现象,就像一辆装满了过多货物的卡车,行驶起来既缓慢又不稳定。
主成分分析(Principal Component Analysis,简称 PCA...