合并来自不同样本的训练数据时遇到的问题

时间:2018-08-18 02:50:18

标签: python machine-learning logistic-regression data-science train-test-split

我有两个训练数据文件,每个文件都分别作为训练和测试分割数据进行了分割。如何使用给定的文件提取训练样本

我有四个文件

  • file1:一些功能
  • file2:其他一些功能,其中包含几列 文件1共有的

详细说明

文件1列-时间戳记,事件,结果,

test 1是从文件1中分离出来的测试数据

文件2列-时间戳,用户类型,事件持续时间,结果,

test2包含从文件2中分离的测试数据。...

当我合并训练数据或测试数据时,我不能报告数据丢失(内部联接)或模棱两可的数据(如果是外部联接)。我需要对这两个数据进行逻辑回归

test 1和test 2是已从文件1和文件2中分别剥离为测试数据的测试数据集

我需要对训练样本进行逻辑回归,并使用文件3和文件4对其进行测试。由于这种单独的拆分,我在合并时遇到了问题。有人可以建议一些可能的方法来克服这个问题吗?

0 个答案:

没有答案