在Python中,计算相关系数通常使用 `numpy` 或 `pandas` 库。以下是使用这两种库计算相关系数的方法:
使用 `numpy` 计算相关系数
import numpy as np
创建两个数组
x = np.array([1, 4, 3, 5])
y = np.array([1, 3, 4, 5])
计算相关系数
pc = np.corrcoef(x, y)
print("相关系数:", pc[0, 1])
使用 `pandas` 计算相关系数
import pandas as pd
创建一个DataFrame
data = pd.DataFrame({'x': [1, 4, 3, 5], 'y': [1, 3, 4, 5]})
计算相关系数矩阵
df_corr = data.corr(method='pearson')
print(df_corr)
使用 `seaborn` 绘制相关系数热力图
import seaborn as sns
import matplotlib.pyplot as plt
加载数据集
data = sns.load_dataset('mpg')
计算相关系数矩阵(仅数值列)
correlation_matrix = data.corr(numeric_only=True)
绘制热力图
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm')
plt.show()
使用 `scipy` 计算相关系数及p值
from scipy.stats import pearsonr
import numpy as np
创建两个数组
x = np.array([1, 4, 3, 5])
y = np.array([1, 3, 4, 5])
计算相关系数及p值
pc, p = pearsonr(x, y)
print("相关系数:", pc)
print("显著性水平:", p)
以上代码展示了如何使用 `numpy`、`pandas` 和 `scipy` 计算相关系数。选择哪种方法取决于你的具体需求以及你正在处理的数据类型