发布网友 发布时间:2022-03-23 11:40
共5个回答
懂视网 时间:2022-03-23 16:02
箱线图分析结论的方法是:
1、首先收集数据,把需要分析的数据输入到Minitab当中。
2、然后在菜单栏依次点击图形、箱线图。
3、分析的数据是两组对比数据,所以在弹出的对话框中选择多个Y简单。
4、然后将左栏中的两组都添加到右边框里面。
5、然后点击标签、表头、确定。
6、然后就得到了箱线图。异常点就是偏离主题的点。就是需要改善的点。
热心网友 时间:2022-03-23 13:10
箱盒图(也称盒图,箱线图等)是在1977年由美国统计学家John Tukey发明,分析数据需要为定量数据。通过箱盒图,可以直观的探索数据特征。
箱盒图共有两个用途,分别如下:
直观地识别数据中异常值(离群点);
直观地判断数据离散分布情况,了解数据分布状态。
箱盒图共由五个数值点构成,分别是最小观察值(下边缘),25%分位数(Q1),中位数,75%分位数(Q3),最大观察值(上边缘)。
中横线:中位数
IQR:75%分位数(Q3)-25%分位数(Q1)
最小观察值(下边缘) = Q1 – 1.5 IQR
最大观察值 (上边缘)= Q3 + 1.5 IQR
箱盒图的使用场景情况如下:
查看可能的异常值数据情况(比如在回归分析前查看是否有异常数据);
非参数检验时查看不同类别X时,Y的数据分布情况;
其它涉及查看数据分布或者异常值查看时。
SPSSAU操作截图如下:
SPSSAU提供不同类别X时,Y的盒状图分布,比如上图中可以查看不同性别人群,C1,C2和C3共三项在区分性别时的盒状分布。
得到结果比如C1的盒状图如下:
上图可以看出,在男性时,C1中有2个异常点;女性时,C1共出现1个异常点。移动到异常点时会显示具体数据。此时如果有需要,可将此3个异常值进行处理,或者在分析时过滤掉异常值。
除了异常值的观察,还可以通过数据盒状图直观看出,男性在C1上的整体打分,会明显高于女性打分。
热心网友 时间:2022-03-23 14:28
箱线图(Boxplot)也称箱须图(Box-whisker Plot),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。热心网友 时间:2022-03-23 16:02
热心网友 时间:2022-03-23 17:54
箱线图判断异常值的标准以四分位数和四分位距为基础,四分位数具有一定的耐抗性,多达25%的数据可以变得任意远而不会很大地扰动四分位数,所以异常值不会影响箱形图的数据形状,箱线图识别异常值的结果比较客观。由此可见,箱线图在识别异常值方面有一定的优越性。
1、下四分位数Q1
(1)确定四分位数的位置。Qi所在位置=i(n+1)/4,其中i=1,2,3。n表示序列中包含的项数。
(2)根据位置,计算相应的四分位数。
例中:
Q1所在的位置=(14+1)/4=3.75,
Q1=0.25×第三项+0.75×第四项=0.25×17+0.75×19=18.5;
2、中位数(第二个四分位数)Q2
中位数,即一组数由小到大排列处于中间位置的数。若序列数为偶数个,该组的中位数为中间两个数的平均数。
例中:
Q2所在的位置=2(14+1)/4=7.5,
Q2=0.5×第七项+0.5×第八项=0.5×25+0.5×28=26.5
3、上四分位数Q3
计算方法同下四分位数。
例中:
Q3所在的位置=3(14+1)/4=11.25,
Q3=0.75×第十一项+0.25×第十二项=0.75×34+0.25×35=34.25。
4、上限
上限是非异常范围内的最大值。
首先要知道什么是四分位距如何计算的?
四分位距IQR=Q3-Q1,那么上限=Q3+1.5IQR
5、下限
下限是非异常范围内的最小值。
下限=Q1-1.5IQR
BDP个人版箱形图效果: