我正在尝试将.csv分为2个列表,一个是训练数据,另一个是测试数据。我的条件是,如果数据有36列(完整),则它是训练数据。否则,它是测试数据,缺少最后一列,这是我对预测所做的-因变量。
我写过:
def training_test_split(self, data):
train_list=[]
test_list=[]
for i in data:
if len(i[0])==36: #I mean if the number of columns in the ith row = 36
train_list.append(data)
else:
test_list.append(data)
return [train_list, test_list]
因此,我将一行数据填充为test_list的条件,其余数据填充为train_list的条件。但是当我调用此函数时,它们都进入了train_list: 我不想用熊猫。抱歉。任何见识都将得到重视!
如果在第36列中有一个“ VALUE”,那么我需要这样做。这是一组参差不齐的数据...不确定。