Python一元和多元线性回归模型的原理及评估【附代码】
import numpy as np
import statsmodels.api as sm
from sklearn.metrics import mean_squared_error
# 生成示例数据
np.random.seed(10)
n_samples = 100
x = np.random.uniform(0, 100, size=n_samples)
y = 2 * x + np.random.normal(0, 10, size=n_samples)
# 一元线性回归模型拟合
X = x.reshape(-1, 1)
model = sm.OLS(y, X).fit()
print(model.summary()) # 打印模型摘要,包括参数估计、统计检验等
# 多元线性回归模型拟合
X = np.c_[x, x**2] # 包含额外的交互项x^2
p = np.poly1d(np.polyfit(x, y, 1)) # 用多项式拟合查看数据的初步趋势
y_poly = np.polyval(p, x) # 用多项式拟合得到的预测值
model_multi = sm.OLS(y, X).fit()
print(model_multi.summary()) # 打印多元模型摘要
# 评估模型
y_pred = model.predict(X)
y_pred_multi = model_multi.predict(X)
mse = mean_squared_error(y, y_pred)
mse_multi = mean_squared_error(y, y_pred_multi)
print(f"一元模型MSE: {mse}")
print(f"多元模型MSE: {mse_multi}")
这段代码首先生成了一个包含噪声的示例数据集,然后使用statsmodels库中的OLS函数拟合了一元和多元线性回归模型。拟合后,使用sklearn.metrics中的mean\_squared\_error函数评估了模型的性能。最后打印出了模型摘要和模型的MSE值。
评论已关闭