Question

最初我的数据集中有10万行。我使用熊猫将csv读取到称为data的数据帧中。我尝试使用.loc对51行进行子集选择。我的索引标签是数字值0、1、2、3等。我尝试使用此命令- data = data.loc['0':'50'] 但是结果很奇怪，它占用了从0到49999的所有行，看起来它一直在占用行，直到索引值以50开头。

类似地，我尝试使用此命令-new_data = data.loc['0':'19'] 结果是从0到18999的所有行。

这可能是熊猫中的虫子吗？

Answer 1

由于要通过数字索引从数据框中选择数据，因此您想使用.iloc代替.loc。

例如：

data.iloc[:50,:]

请记住，索引是数字类型的，而不是字符串类型的，因此使用字符串查询（就像在OP中所做的那样）会尝试匹配按字符串的比较。

pandas：为数据框中的数千行建立索引

1 个答案: