我在下面的代码中使用pandasql创建了一个查询:
csv_path = "C:/..."
data = read_csv(csv_path, sep=';', encoding='utf-8')
q= """
SELECT Address
FROM data
WHERE Id == 4357;
"""
print pandasql.sqldf(q,locals())
所以我从dataframe
文件创建.csv
,然后我进行此查询
我的原始.csv
文件长度为440k +行,而编码我正在处理50行长的文件,即使使用该文件,也需要1分钟才能进行查询,并使用大约1.9 Go的物理存储器
所以我不明白为什么需要那么多时间和记忆。我查看了一些网站,但没有那么多关于pandasql的信息