如何在不拆分数据帧的情况下传递不同的数据集进行训练和测试。 (蟒蛇)?

时间:2019-05-28 13:45:24

标签: python scikit-learn linear-regression data-science training-data

我经历了多个问题,这些问题可帮助您将数据框分为使用scikit进行训练和测试,而无需其他操作。

但是我的问题是我有2个不同的csvs(来自不同年份的2个不同的数据帧)。我想将其中一个用作培训,将另一个用作测试?

如何对LinearRegression /任何模型执行此操作?

1 个答案:

答案 0 :(得分:2)

  • 分别加载数据集。
  • 确保它们具有相同的行和列(功能)格式。
  • 使用将train设置为fit的模型。
  • 在训练后使用将test设置为predict的输出。
# Load the data
train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')

# Fit (train) model
reg = LinearRegression()
reg.fit(X_train, y_train)

# Predict
pred = reg.predict(X_test)

# Score
accuracy = reg.socre(X_test, y_test)