1、描述性统计分析在做数据分析时,一般先会对数据进行描述性统计分析,以便于描述该数据的各种特征及其所代表的总体的特征。描述性统计分析包括对数据的集中趋势、离散程度以及分布进行分析。集中趋势统计量: 均值、中位数、众数、百分位数离散趋势统计量:标准差、方差、极差、变异系数、标准误、样本校正平方和、样本未校正平方和分布情况统计量:偏度、峰度其中代码都非常简单,mean函数计算均值,median函数计算中位数,table计算不同数据出现的频率。
2、布情况统计是很重要的两个指标,具体来说就是,偏度(skew)可以告诉你,这批数据有没有做左偏还是右偏了,峰度(kurtosis)可已告诉你这批数据是尖尖山峰的还是矮矮的山包。
3、峰度示意图
4、其实偏度和峰度的计算公式都很简单,不过我们可以使用moments包来计算偏度和峰度
5、散系数又称变异系数,是统计学当中的常用统计指标,主要用于比较不同水平的变量数列的离散程度及平均数的代表性。离散系数指标有:全距系数、平均差系数、方差系数和标准差系数等
6、分组进行描述性统计分析如何同时计算他们的描述性统计量?R语言提供了一个很好用的函数summary来解决这个问题
7、绘制了A,B,C三批数据的曲线图