反冲错误。 Pandas使用动态查询字符串过滤数据框。

时间:2017-08-16 10:25:37

标签: python-2.7 pandas query-string

大家好, 该问题与Python反向错误有关。 我正在创建一个动态查询字符串,用于在pandas中进行过滤。 代码是:

       filters = dict(wlbWellType=['EXPLORATION'])
       query_string = ''
       index = 0
       for (k,v) in filters.iteritems():
          for i in v:
              if (index == 0):
                  query_string += '"{}"'.format((k) + ' == '+"'{}'".format(i)) 
              else:
              query_string += ' & ' '"{}"'.format((k) + ' == ' + 
              "'{}'".format(i))
             index += 1

如果我执行“print query_string”,我得到的输出是

             "wlbWellType == 'EXPLORATION'"

如果我执行“query_string”,我得到的输出是

             '"wlbWellType == \'EXPLORATION\'"'

我想要

             "wlbWellType == 'EXPLORATION'" 

作为输出而不使用print语句。似乎存在与间隙相关的错误。

query_string输出将用作:

            df.query(query_string)

有人可以帮我解决上述问题吗?

提前致谢

3 个答案:

答案 0 :(得分:2)

您可以编写自己的帮助函数(类似于您现在尝试的但使用**kwargs)并使用@varname语法作为值占位符。

def my_filter(df, **kwargs):
    qs = ' & '.join('{0} == @{0}'.format(k) for k in kwargs)
    return df.query(qs, local_dict=kwargs)

然后使用如下:

new_df = my_filter(df, wlbWellType='EXPLORATION', otherColumn='SOMETHING')

此方法比手动转义值更安全,因为@varname语法将根据值的类型适当地为您执行此操作。

答案 1 :(得分:1)

原因是你将密钥包装成python格式的字符串("' {}'"" .format)。试试这个解决方案:

query_string = ""
index = 0
for (k,v) in filters.iteritems():
  for i in v:
    if (index == 0):
      query_string += str(k) + " == " + "'{}'".format(i)
    else:
      query_string += " & " + str(k) + " == " + "'{}'".format(i)
  index += 1

答案 2 :(得分:0)

考虑以下方法:

In [44]: filters
Out[44]:
           col          val
0  wlbWellType  EXPLORATION
1          bbb          BBB

In [45]: qry = filters['col'].add(' == "').add(filters['val']).add('"').str.cat(sep=' & ')

In [46]: print(qry)
wlbWellType == "EXPLORATION" & bbb == "BBB"

语法略有不同:

In [50]: qry = (filters['col'] + ' == "' + filters['val'] + '"').str.cat(sep=' & ')

In [51]: qry
Out[51]: 'wlbWellType == "EXPLORATION" & bbb == "BBB"'