当前位置:首页 > 数据中心 > 正文

数据中心化是什么意思


一、统计学里面的中心化是什么意思知乎所谓数据中心,是指数据集中的每一个数据减去该数据集的均值。
比如有一个数据集1,2,3,6,3,平均值为3,那么中心化后的数据集就是1-3,2-3,3-3,6-3、3-3,即:-2、-1、0、3、0。数据居中是为了消除维度对数据结构的影响,因为不同变量的单位不同,会造成各种统计误差。
二、何为数据中心化和标准化?其目的是什么?数据归一化意味着从值中减去平均值,然后除以标准差,而数据居中意味着从变量中减去平均值。在对某些数据进行聚类分析或者绘制相关聚类图时,需要对某些数据进行集中归一化!