变量描述:
在确定分析方法之前,我们需要了解手头的数据类型。这是最基本也是最必要的。在所有数据类型中,我们将数据类型分为几类,变量也称为分类变量,连续变量也称为定量变量。那么什么是分类变量呢?什么是定量变量?
通俗地说,分类变量在数值大小方面不具有比较意义。例如,性别中,1代表男性,2代表女性。它们仅代表类别。下图中,1代表底妆,2代表唇妆等等,只有类别关系。
数量变量一般来说,数字的大小具有比较意义。例如,在测量青少年身高时,1.4m高于1.3m。这个数字本身就具有比较意义。比如下图中沙发的价格,数字越大越贵。,数字越小越便宜,数字可以比较。通过对数据类型的解释,在本讨论中我们对不同的数据类型进行分类和解释,即分类和连续变量、连续和连续变量以及分类和分类变量。
如果数据是分类变量和连续变量,那么在分析时,分析方法大致可以分为三类:参数检验、非参数检验和可视化图形。参数检验包括t检验和方差分析。,非参数检验包括MannWhitney统计量和Kruskal-Wallis统计量。并且还可以使用可视化图形进行查看。
如果数据是连续数据和连续变量,那么在分析时,分析方法大致可以分为四类,相关分析、参数检验、非参数检验和视觉图形。相关分析一般包括Pearson相关系数和Spearman相关系数。如果连续变量和连续变量的样本量相同,参数检验中可以考虑使用配对t检验,非参数检验包括配对wilcoxon,可视化图形可以考虑使用散点图。如果数据是分类变量和分类变量,那么在分析时,分析方法大致可以分为三类:卡方检验和可视化图形。卡方检验包括皮尔逊卡方、费舍尔卡方、耶茨校正卡方、以及科克伦-阿米蒂奇检验、线性趋势卡方,也可以使用可视化图形查看(堆积柱形图、条形图)。
示例分析
(1)分析过程
我想调查饮食习惯(大米食物),不分性别(男)或女性)、意大利面),卡方检验的分类应采用皮尔逊卡方检验。
从分析结果可以看出,60%的男性更喜欢吃面食,80%的女性更喜欢吃米饭。。从数据来看,不同性别的饮食习惯存在差异。模型中的卡方值为16.667,p值小于0.05。拒绝原假设,表明模型显着,不同性别的饮食习惯存在差异。而且从堆积的柱形图中,我们也可以直观地看到,男性更喜欢吃面食,女性更喜欢吃米饭。
上一篇:一加7t pro支持内存卡么
下一篇:银行数据中心年薪40万