我有使用正则表达式扫描特定模式的数据集。其中一些表有数百万行,逐列搜索非常耗时。所以我使用 iterrows。
这样第一个索引,行它找到它标记的匹配模式并结束循环。但问题是我无法确定列名。理想情况下,我想要找到匹配项的列名
代码示例:
for index, row in df.iterrows():
#regex to identify any 9 digit number starting with 456 goes here
目前我的输出打印了它找到第一个匹配项并退出的行的索引。有什么更好的方法可以编写它以便我可以捕获它所在的列名或列索引?就像上面的数据示例一样,理想情况下,我希望打印“Acc_Number”列。