搜索
写经验 领红包
 > 设计

如何读懂箱线图(箱线图解析)

导语:小小箱线不简单,箱线图的解读

尔云间 一个专门做科研的团队

原创 小果 生信果

箱线图应该是科研工作中最常见的一种图了,小云就经常遇到,但是小伙伴们想过没有,这些箱线图都代表着什么意思呢?

这张图是小云今天刚画的,可以看到,这个箱线图有五条线,让我们先来认识一下这些线都有什么意义吧:

先看中间的箱子,箱子上有三条线,从下往上分别指四分之一位数,中位数和四分之三位数,小伙伴应该很好理解,把这些数从小到大排序,在中间位置的就是中位数,另外两条线定义类似。

第一个四分位数(Q1 / 25百分位数)是最小数(不是“最小值”)和数据集的中位数之间的中间数;第三四分位数(Q3 / 75th Percentile)是数据集的中位数和最大值之间的中间值(不是“最大值”)

上下两条线是上下限,上限是非异常范围内的最大值。首先要了解一下四分位距如何计算的:

四分位距IQR=Q3-Q1,那么上限=Q3+1.5IQR。下限是非异常范围内的最小值,下限=Q1-1.5IQR。

这个箱线图大致就讲完了,箱线图体现的样本数据的分布情况,而科研分析中常用箱线图来反应差异性,向上面那个图,上面显示的数字是0.0013,小于0.05,那么这三组数据之间就存在差异性,箱线图体现的差异分析一般包括t检验,秩和检验与KS检验,KS检验常用于多组之间的比较,上图使用的就是KS比较,两组的一般就是秩和检验。

好了,这就是箱线图的主要内容了,欢迎小伙伴们来和小云分享讨论哟。

推荐阅读

小果教你三分钟看懂多条线共存的ROC图的R语言画法非癌症也能做逐步,logistic逐步回归小果教你如何计算免疫治疗标志物CYT评分快速学习如何确定差异分析阈值来筛选差异基因非癌症也能看风险,R语言单因素logistic回归

本文内容由快快网络小碧创作整理编辑!