在python pandasql中SQL查询太慢了

时间:2014-07-07 12:37:40

标签: python sql pandas

我在下面的代码中使用pandasql创建了一个查询:

csv_path = "C:/..."
data = read_csv(csv_path, sep=';', encoding='utf-8') 

q= """
SELECT Address
FROM data
WHERE Id == 4357;
"""

print pandasql.sqldf(q,locals())

所以我从dataframe文件创建.csv,然后我进行此查询

我的原始.csv文件长度为440k +行,而编码我正在处理50行长的文件,即使使用该文件,也需要1分钟才能进行查询,并使用大约1.9 Go的物理存储器

所以我不明白为什么需要那么多时间和记忆。我查看了一些网站,但没有那么多关于pandasql的信息

0 个答案:

没有答案