如何选择包含列表和范围的数据框列

时间:2018-03-18 01:25:29

标签: python pandas dataframe indexing

请考虑这个df:

df = pd.DataFrame({'a':[1,2], 'b':[1,2], 'c':[1,2], 'd':[1,2], 'e':[1,2], 'f':[1,2], 'g':[1,2], 'h':[1,2]})

   a  b  c  d  e  f  g  h
0  1  1  1  1  1  1  1  1
1  2  2  2  2  2  2  2  2

如何选择第1列,第4列和第5列? 我尝试了什么:

df.iloc[:, [0, 3, np.arange(5,8)]]

ValueError: setting an array element with a sequence.

1 个答案:

答案 0 :(得分:3)

你可以这样做:

df.iloc[:, [0, 3] + list(range(5,8))]

[0, 3] + list(range(5,8))连接2个列表,将您的显式列表与从您所需范围派生的列表组合。

或者,您可以使用numpy.r为您构建索引数组:

import numpy as np

df.iloc[:, np.r_[0,3,5:8]]

np.r_[0,3,5:8]  # array([0, 3, 5, 6, 7])

如果您有多个范围,这将非常有用。