到目前为止,我正在逐个遍历熊猫数据框,并根据少量数据框值向数据库发出一个选择查询以检查数据是否存在。
for index, frame in dataframe.iterrows():
# select query based on multiple frame['column_1'],frame['column_2']
如果数据量巨大,那将永远。我只是很好奇,有没有一种方法可以一次触发所有选择并筛选出可以返回结果的数据框??
答案 0 :(得分:0)
import pandas as pd
import numpy as np
columns = ["A", "B", "C"]
data = [
[1,2,3],
[1,1,1],
[3,5,4],
[2,5,3]
]
my_pandas = pd.DataFrame(data, columns=columns)
# Create a filter on the dataframe
my_pandas[my_pandas["A"] == 1]
# Create 2 filters (Don't forget the parenthesis. It's important)
my_pandas[(my_pandas["A"] == 1) & (my_pandas["C"] == 3)]
结果
A B C
0 1 2 3
答案 1 :(得分:0)
也许这篇文章可以帮助您: how to transform pandas dataframe for insertion via executemany() statement?
例如, MySQL的executemany()
几乎可以完全理解我想要的内容。也许有一些使用Pandas和numpy的东西。.我还没有和那两个一起工作