发布网友 发布时间:2024-10-23 16:01
共1个回答
热心网友 时间:2024-11-11 07:22
总结:
归一化:便于不同单位或量级的数据进行比较和加权,把数据映射到0~1范围或-1~1范围
标准化:把数据映射到服从均值为0,方差为1的正态分布
中心化:中心化后数据的均值为0,方差不做要求
为什么要对数据进行归一化、标准化或中心化处理?
1. 提高模型的收敛速度和精度
2. 使不同量纲和数量级的数据可以进行比较和加权
常用的归一化,标准化和中心化的公式有哪些?
归一化:Min-Max Normalization:x'=(x-XMIN)/(XMAX-XMIN)
平均归一化:x'=(x-μ)/(XMAX-XMIN)
标准化:Z-score:z=(x-μ)/σ
中心化:z=x-μ
归一化和标准化分别在哪些场景下使用?
归一化:分类、聚类算法和PCA技术降维时使用,适用于距离度量
标准化:不涉及距离度量、协方差计算,数据不符合正态分布时使用,适用于图像处理和距离敏感算法