import pandas as pd
from sklearn.linear_model import LinearRegression
# 读取汽车数据集:
cars = pd.read_csv('data.csv')
# 对汽车品牌进行独热编码 (One-Hot Encoding):
ohe_cars = pd.get_dummies(cars[['Car']])
# 构造特征矩阵:合并数值特征和编码后的分类特征
X = pd.concat([cars[['Volume', 'Weight']], ohe_cars], axis=1)
# 定义目标变量:CO2 排放量
y = cars['CO2']
# 创建并训练线性回归模型:
regr = LinearRegression()
regr.fit(X, y)
# 预测新样本的 CO2 排放量:
# 参数说明:[排量, 重量, 各品牌独热编码(假设共 18 个品牌)]
predictedCO2 = regr.predict([[2300, 1300, 0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0]])
# 输出预测结果:
print(predictedCO2)