R语言基础:展示数据分布
1、首先我们引入一个大数据集

2、对于一维连续型分布,最重要的几何对象是直方图 geom_histogram。
例如,展示diomands数据集中的depth变量


3、如果你想展示更多组间信息,那你可以使用下面的几种参数,
按照cut变量的不同取值进行线条的上



4、按照cut变量的不同取值进行填充柱状图


5、geom_density 一维密度曲线图:
如果不设置其他参数,实际上就是直方图的平滑曲线版本,无法回溯数据本身,意义不大


6、如果用cut变量的不同取值进行上色,就会得到一个信息量更大的版本


7、如果想比较两个变量之间的关系,那就需要使用其他函数,诸如
geom_boxplot:箱型图,也称箱须图
横轴取值是离散型变量时:


8、横轴取值是连续型变量时,用cut_width设置离散区间,用xlim设置横轴取值范围


9、横轴取值是离散型变量时



声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:148
阅读量:43
阅读量:188
阅读量:117
阅读量:87