pandas DataFrame.drop函数中的Integer参数

时间:2016-09-21 14:21:22

标签: python pandas dataframe int multiple-columns

以下代码行

 X = np.array(df.drop(['label'], 1))

您能解释一下1号码的作用吗?

从文档中我了解DataFrame.drop函数从数据框中删除了名为'label'的所需列,并返回没有此列的新数据帧。但我不明白这个特定的整数参数1是做什么的。

2 个答案:

答案 0 :(得分:3)

drop中的参数axis。它与axis=1相同。这意味着您需要从DataFrame中删除在第一个参数labels中指定的列:

labels大多数情况下都会被忽略 如果需要删除axis行,则可以删除参数index,因为默认情况下为axis=0。 参数axis=1有时会被1取代,因为文字较少,但可读性较差。

样品:

import pandas as pd

df = pd.DataFrame({'label':[1,2,3],
                   'label1':[4,5,6],
                   'label2':[7,8,9]})

print (df)
   label  label1  label2
0      1       4       7
1      2       5       8
2      3       6       9

print (df.drop(['label'], 1))
   label1  label2
0       4       7
1       5       8
2       6       9

#most commonly used
print (df.drop(['label'], axis=1))
   label1  label2
0       4       7
1       5       8
2       6       9

print (df.drop(labels=['label'], axis=1))
   label1  label2
0       4       7
1       5       8
2       6       9

答案 1 :(得分:0)

您想删除名为“ age”的数据,并且必须指出它是一列。

因此,当您从数据类型中删除“年龄”时

x = np.array(data.drop([predict], 1))

如果年龄是x轴

x = np.array(data.drop([predict], 0))