我每次通过循环创建一个新的数据帧,这样我就可以计算总和,但由于数据非常庞大(大约300万行),我得到了错误的答案 还有其他方法吗?:
df = pd.read_sql_query(
"SELECT DISTINCT SYMBOL FROM tableA WHERE TIM ==?;",
conn, params={datetime_object}
)
for sym in df.SYMBOL:
df2 = pd.read_sql_query(
"SELECT SYMBOL,OPEN FROM tableA WHERE TIM ==? AND SYMBOL ==? AND EXP==?;",
conn, params={datetime_object,sym,exp}
)
Total = df2['OPEN'].sum()
对于其他几行,我得到正确的总和但是0,我认为有些内存问题! 提前谢谢!