最初我的数据集中有10万行。我使用熊猫将csv读取到称为data的数据帧中。我尝试使用.loc
对51行进行子集选择。我的索引标签是数字值0、1、2、3等。我尝试使用此命令-
data = data.loc['0':'50']
但是结果很奇怪,它占用了从0到49999的所有行,看起来它一直在占用行,直到索引值以50开头。
类似地,我尝试使用此命令-new_data = data.loc['0':'19']
结果是从0到18999的所有行。
这可能是熊猫中的虫子吗?
答案 0 :(得分:0)
由于要通过数字索引从数据框中选择数据,因此您想使用.iloc
代替.loc
。
例如:
data.iloc[:50,:]
请记住,索引是数字类型的,而不是字符串类型的,因此使用字符串查询(就像在OP中所做的那样)会尝试匹配按字符串的比较。