相关系数是衡量两个变量之间线性相关程度的统计量,其计算公式为:
ρXY = Cov(X,Y) / (√D(X)) * (√D(Y))
其中:
`ρXY` 表示相关系数。
`Cov(X,Y)` 是变量 `X` 和 `Y` 的协方差。
`D(X)` 和 `D(Y)` 分别是变量 `X` 和 `Y` 的方差。
相关系数的值介于 -1 和 1 之间,其中:
`-1` 表示完全负相关。
`0` 表示没有线性关系。
`1` 表示完全正相关。
相关系数的绝对值越大,表示两个变量之间的线性相关程度越高。
计算步骤:
1. 收集两个变量的数据。
2. 将数据按照相同的顺序排列,并计算它们的平均值。
3. 计算每个变量与平均值的离差(即变量值减去平均值的结果)。
4. 将两个离差相乘,并计算它们之间的平均值。
5. 计算得到的平均值就是相关系数。
示例:
假设我们有两个变量 `X` 和 `Y`,它们的数据如下:
X = [1, 2, 3, 4, 5]
Y = [2, 4, 6, 8, 10]
1. 计算平均值:
平均X = (1 + 2 + 3 + 4 + 5) / 5 = 3
平均Y = (2 + 4 + 6 + 8 + 10) / 5 = 6
2. 计算离差:
离差X = [1-3, 2-3, 3-3, 4-3, 5-3] = [-2, -1, 0, 1, 2]
离差Y = [2-6, 4-6, 6-6, 8-6, 10-6] = [-4, -2, 0, 2, 4]
3. 计算离差乘积:
离差乘积 = [(-2) * (-4), (-1) * (-2), 0 * 0, 1 * 2, 2 * 4] = [8, 2, 0, 2, 8]
4. 计算离差乘积的平均值(即相关系数):
相关系数 = (8 + 2 + 0 + 2 + 8) / 5 = 20 / 5 = 4 / 2 = 2
所以,变量 `X` 和 `Y` 之间的相关系数为 `2`。
使用Excel计算相关系数:
1. 选中包含 `X` 和 `Y` 数据的单元格区域。
2. 在Excel的“插入”选项卡上,选择“图表”组中的“散点图”来创建散点图。
4. 在趋势线的属性中勾选“显示公式”和“显示R平方值”,显示的 `R` 值即为相关系数。
注意事项:
相关系数只衡量线性关系,不适用于非线性关系。
相关系数不是等距或等比变量,不能直接进行加减乘除运算。
相关系数反映了变量间共变关系的密切程度,取值范围是 -1 到 +1