一、集中趋势
集中趋势分析——中心趋势的数值度量
反映一组数据向某一位置聚集的趋势,主要的统计量有均数(mean)、中位数(median)、众数(mode)、总和(sum)以及分位数。均数适用于正态分布和对称分布的数据,中位数适用于所有类型。
①均值:Mend
在一组数据中所有数据之和再除以这组数据的个数
②中位数:Median
样本中所有数值由小到大排列后第50%的数字
③众数:Mode
一组数据中出现次数最多的数值
④和:Sum
⑤分位数:Quantile
指将一个随机变量的概率分布范围分为几个等份的数值点,常用的有中位数(即二分位数)、四分位数、百分位数等。
如果各个数据之间差异程度较小,用平均值就有很好的代表性;而如果数据之间的差异程度较大,特别是有个别的极端值的情况下,用中位数或众数有较好的代表性
二、离散趋势
离散趋势分析——变异的数值度量围绕中心波动的度量
反映一组数据背离分布中心值的特征。主要的统计量有
标准差(Std.Deviation)、
方差(Variance)、
极差(range)、
最大值(maximum)、最小值(minimum),标准差和方差适用于正态分布。