pandas:为数据框中的数千行建立索引

时间:2018-09-19 23:40:17

标签: pandas dataframe indexing

最初我的数据集中有10万行。我使用熊猫将csv读取到称为data的数据帧中。我尝试使用.loc对51行进行子集选择。我的索引标签是数字值0、1、2、3等。我尝试使用此命令- data = data.loc['0':'50'] 但是结果很奇怪,它占用了从0到49999的所有行,看起来它一直在占用行,直到索引值以50开头。

类似地,我尝试使用此命令-new_data = data.loc['0':'19'] 结果是从0到18999的所有行。

这可能是熊猫中的虫子吗?

1 个答案:

答案 0 :(得分:0)

由于要通过数字索引从数据框中选择数据,因此您想使用.iloc代替.loc

例如:

data.iloc[:50,:]

请记住,索引是数字类型的,而不是字符串类型的,因此使用字符串查询(就像在OP中所做的那样)会尝试匹配按字符串的比较。

相关问题