在Python中,使用`scikit-learn`库可以方便地实现多元线性回归。以下是使用`scikit-learn`进行多元线性回归的基本步骤:
1. 导入必要的库:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error
2. 准备数据集:
创建数据集
data = {
'平时成绩': [80, 90, 70, 60, 95],
'作业完成率': [90, 85, 75, 60, 98],
'期末成绩': [85, 92, 75, 65, 96]
}
df = pd.DataFrame(data)
分离自变量和因变量
X = df[['平时成绩', '作业完成率']]
y = df['期末成绩']
3. 划分训练集和测试集:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
4. 创建并拟合模型:
model = LinearRegression()
model.fit(X_train, y_train)
5. 预测新数据:
y_pred = model.predict(X_test)
6. 评估模型性能:
mse = mean_squared_error(y_test, y_pred)
print(f"Mean Squared Error: {mse}")
以上步骤展示了如何使用`scikit-learn`库进行多元线性回归的基本流程。你可以根据具体的数据集调整参数,比如`test_size`和`random_state`,以获得更好的模型性能。