1、添加误差线和误差范围数据中的不确定信息的展示也很重要。ggplot2中,四类几何对象可以用于这项工作,这取决于x的值是离散型还是连续型,以及我们是否想展示区间中的中心值
2、以上六个命令依次生成如下六张图片
3、加权数与加权平均数的概念相同,不同于普通的平均数,在加权数的计算中酋篚靶高需要考虑每个数据不同的比例权重。以2000年美国人口普查,东西部各州的统计数据集为例。此数据主要包括的是比例型数据以及每个地区的信息。
4、首先,对于点、线这些简单的几何对象,可以根据size改变点的大小例,白人百分比和贫困线下人口数量的散点图
5、按照人口总数的绝对数字设置权重size = poptotal / 1e6,可以看到图片中也自动生成了对应的图例
6、对于更加复杂、涉及到统计变换的情况,我们通过修改we坡纠课柩ight图形属性来表现权重。这些权重将被传递给统计汇总计算函数。在权重有意义的情况下,各种元素基本都支持权重的设定,例如各类smooth平滑器、箱线图、分位回归、直方图以及密度图等等。它没有对应的图例,我们无法看到这个权重变量,但是它却会改变统计汇总的结果。下图可以看到,作为权重的人口密度,会影响白种人比例和贫困线下人口比例这个散点图的分布情况
7、加权后
8、我们使用总人口数作为权重修改直方图和密度图的时候,加入weight权重会大大改变分析结果