我有多个CSV文件,其中包含按时间顺序排列的生产周期的18列sensordata。每个CSV文件代表一个产品(智能手机),其生产成功(1)或不成功(0)。我将每个CSV转换为一个数据框,并将它们合并到字典中。 CSV文件的行数不同。
我现在的问题是,是否必须将它们压缩为一行,最后以1或0的结果进行比较,以比较不同的机器学习算法(如多元逻辑回归)。对于我的算法,每个输入都是一个数据框,而输出是一个标签。将所有行并排连接为单个行可以创建不同长度的特征向量。
例如:我将7个CSV文件转换为7个数据帧,并将它们放在一起并包含7行(每个数据帧一行)。
如果我必须将一个DataFrame压缩到一行,您能告诉我怎么做吗?
或者可以告诉算法,它必须考虑整个数据帧的每一行(30000行)。
非常感谢!