Question

我正在尝试将.csv分为2个列表，一个是训练数据，另一个是测试数据。我的条件是，如果数据有36列（完整），则它是训练数据。否则，它是测试数据，缺少最后一列，这是我对预测所做的-因变量。

我写过：

def training_test_split(self, data):
   train_list=[]
   test_list=[]
   for i in data:
       if len(i[0])==36: #I mean if the number of columns in the ith row = 36
          train_list.append(data)
       else:
          test_list.append(data)
   return [train_list, test_list]

因此，我将一行数据填充为test_list的条件，其余数据填充为train_list的条件。但是当我调用此函数时，它们都进入了train_list：我不想用熊猫。抱歉。任何见识都将得到重视！

如果在第36列中有一个“ VALUE”，那么我需要这样做。这是一组参差不齐的数据...不确定。

Python：使用if语句拆分测试和训练数据

0 个答案: