如何在熊猫数据框中使用带有任何正则表达式的字符串过滤行

时间:2018-09-23 02:20:54

标签: python pandas

这是针对的后续问题 how to filter rows based on unix based regular expressions passed as an input argument to a data frame column

import numpy as np
import pandas as pd
import os

csvFile = "csv.csv"
csvDelim = '@@@'
 df = pd.read_csv(csvFile, engine="python", index_col=False, delimiter=csvDelim )
df.head()


ID  col_1   
0   ACLKB
1   CLKAA
2   AACLK
3   BBBCLK

我有一个python函数查找

 def find(self, findText, colName exactMatch):

      mask = (mask | (self.df[colName].astype('str') == findText))

现在findText可以 CLK 或?CLK或^ CLK或CLK $等。它可以包含任何正则表达式。现在,如何找到一种通用解决方案,使我的find函数可以找到具有任何正则表达式的字符串

我正在寻找关于如何在熊猫数据框中基于正则表达式支持过滤器行的非常好的文档

0 个答案:

没有答案