我打赌我的问题有一个简单的答案,但我很难根据Pandas的文档来解决这个问题。
我有一个包含~2,000行和14列的大型数据帧。我需要找到其中一行中包含某个正则表达式的索引。所以举一个非常简单的例子:
label1 label2
0 cat dog
1 bird monkey
2 elephant bobcat
当我搜索'cat'时,我想获得一个系列,列表,某种可迭代的类似
0
2
你会怎么用熊猫做到的?我可以在20,000或更大的数据集上每秒做2-3次,所以速度在这里也非常重要。
答案 0 :(得分:0)
不知道它对数据集的执行速度有多快。
df.applymap(lambda x: 'cat' in x).sum(1).nonzero()
Out[12]: (array([0, 2], dtype=int64),)