使用带有python列表的IN构建SQL查询字符串

时间:2018-01-23 00:18:05

标签: python pandas dataframe jupyter

我建立了一个大熊猫感兴趣的值列表。

table1 = pd.read_csv("logswithIPs.csv")
cips = data_dash['ip'].unique().tolist()
print(cips[:10])
['111.111.111.111', '123.123.123.123', '122.122.122.122', '2.2.2.2', '3.3.3.3', '4.4.4.4', '5.5.5.5'...'']

现在我有了上面的列表,我想知道这些IP是否存在于我的SQL数据库的表中。

filterIPs = pd.read_sql("select count(*) as count, url from "+table2+" where c_ip in "+cips+" group by url",conn)

具体来说,我的问题在于我的语法c_ip in "+cips+"

TypeError: Can't convert 'list' object to str implicitly

如何在SQL查询中正确包含列表?

*** EDIT

所以我终于让它工作了,看起来像熊猫不想要一个它想要一个字符串的列表。

所以我 cipTup = tuple(cips)。 然后在我的查询中我做了..

where c_ip in "+str(cipTup)" 

并且有效。

我的猜测是pandas知道如何将这样的字符串视为列表。?

1 个答案:

答案 0 :(得分:5)

我会将data_dash['ip'].unique()导出/保存为SQL表,以便它可以有效地用于子查询:

pd.DataFrame({'ip':data_dash['ip'].unique()}).to_sql('tmp_ip', conn, if_exists='replace')

现在您可以在SQL DB端使用它:

qry = """
select count(*) as count, url
from tab_name
where c_ip in (select ip from tmp_ip)
group by url
"""

filterIPs = pd.read_sql(qry, conn)