箱形图(Box-plot)是一种用于表示数据分布的统计图形,它通过五个关键统计量来描述数据集:最小值、第一四分位数(Q1)、中位数、第三四分位数(Q3)和最大值。以下是绘制箱形图的步骤:
收集数据 :确保数据已经准备好,并且没有缺失值。排序数据:
将数据按照数值大小顺序排列。
计算统计量
中位数(Xm):
位于数据中间位置的数值,如果数据总数是偶数,则取中间两个数的平均值。
第一四分位数(Q1):位于25%处的数值。
第三四分位数(Q3):位于75%处的数值。
四分位距(IQR):Q3与Q1的差值。
绘制箱形图
在数轴上标出Q1和Q3的位置,这两点确定了箱子的下边缘和上边缘。
在Q1和Q3之间画一条线段表示箱体,箱体的中点对应中位数Xm。
从箱体两端向外画线,直到不是异常值的最远点,表示正常值的分布区间。
在Q3+1.5IQR和Q1-1.5IQR处画两条线段作为内限,在Q3+3IQR和Q1-3IQR处画两条线段作为外限。
标记异常值
位于内限以外的点表示异常值。
温和的异常值用圆圈(○)标记,极端的异常值用星号(*)标记。
美化图表(可选):
可以添加数据标签、标题、图例等元素。
使用不同的颜色、线型或样式美化图表。
箱形图可以手动绘制,也可以使用统计软件(如Excel、R、Python等)快速生成。在Excel中,可以通过选择“插入”菜单下的“图表”选项,然后选择“箱形图”来快速创建箱形图。