调用数据集的子集

时间:2016-09-28 19:14:40

标签: python pandas

x_train = train['date_x','activity_category','char_1_x','char_2_x','char_3_x','char_4_x','char_5_x','char_6_x',
'char_7_x','char_8_x','char_9_x','char_10_x',.........,'char_27','char_29','char_30','char_31','char_32','char_33',
'char_34','char_35','char_36','char_37','char_38']
y = y_train
x_test = test['date_x','activity_category','char_1_x','char_2_x','char_3_x','char_4_x','char_5_x','char_6_x',
'char_7_x','char_8_x','char_9_x','char_10_x','char_1_y','group_1','char_1_y','char_2_y','char_3_y', 'char_4_y','char_5_y','char_6_y','char_7_y',
'char_8_y','char_9-y','char_10_y', ...........,'char_29','char_30','char_31','char_32','char_33',
'char_34','char_35','char_36','char_37','char_38']

train.iloc([0:17,19:38])

尝试使用train([0:17,19:38)]对列进行切片后,我使用了所有列名的数据输入。这是一种非常繁琐的方法,但我只能使用19:38来调用它。我通过调用列名称获取第一个方法的Key错误消息。

1 个答案:

答案 0 :(得分:1)

正如@AndrasDeak所建议的那样 考虑pd.DataFrame train

train = pd.DataFrame(np.arange(1000).reshape(-1, 20))

然后使用像这样的建议

train.iloc[np.r_[0:17, 19:38]]