机器学习-使用具有不同大小的数据框生成特征

时间:2018-07-20 14:46:02

标签: pandas dataframe machine-learning scikit-learn feature-extraction

我有多个CSV文件,其中包含按时间顺序排列的生产周期的18列sensordata。每个CSV文件代表一个产品(智能手机),其生产成功(1)或不成功(0)。我将每个CSV转换为一个数据框,并将它们合并到字典中。 CSV文件的行数不同。

我现在的问题是,是否必须将它们压缩为一行,最后以1或0的结果进行比较,以比较不同的机器学习算法(如多元逻辑回归)。对于我的算法,每个输入都是一个数据框,而输出是一个标签。将所有行并排连接为单个行可以创建不同长度的特征向量。

例如:我将7个CSV文件转换为7个数据帧,并将它们放在一起并包含7行(每个数据帧一行)。

如果我必须将一个DataFrame压缩到一行,您能告诉我怎么做吗?

或者可以告诉算法,它必须考虑整个数据帧的每一行(30000行)。

非常感谢!

0 个答案:

没有答案