离散度是衡量数据分布散乱程度的一个重要指标,通常通过以下几种方式计算:
极差:
数据样本中的最大值与最小值的差值。
公式:R = max(i) - min(i)
方差:
每个数据点与数据集平均值之差的平方和的平均数。
公式:Var = (∑(xi - μ)²) / N
标准差:
方差的平方根,反映了数据点与平均值之间的平均偏差。
公式:σ = √Var
变异系数:
标准差与平均值的比值,用于衡量数据分布的相对离散程度。
公式:CV = (标准差 / 平均值) × 100%
四分位差:
数据样本的上四分位和下四分位的差值。
公式:Qd = Q3 - Q1
平均差:
所有数据点与平均值之差的绝对值的平均数。
公式:A.d = (∑|xi - μ|) / N
以上方法都可以用来衡量数据的离散程度,其中标准差和方差是最常用的。标准差因为单位与原数据一致,通常更受青睐。变异系数则适用于比较不同数据集或样本的离散程度