python - 在数据帧上解码熊猫查询？ - Thinbug

在数据帧上解码熊猫查询？

时间：2019-09-24 14:27:29

标签： python pandas

我想在数据帧上解码此熊猫查询。

 filter1 = df['customer_planning_group'] == 'G01'
 filter3 = df['calendar_yearweek'].between(201929,201939) 
 filter4 = df['SKU_Name'].isin(un_name)
 final_filter = filter1 & filter3 & filter4
 df[['calendar_yearmonth', 'calendar_yearweek','predictions', 'total_sales_volume']].where(final_filter).groupby('calendar_yearweek').sum()

到目前为止我所了解的
1.代码正在尝试使用多个过滤器从数据框中选择行
2.然后从该结果中选择几列
3.然后根据“ calendar_yearweek”列对结果进行分组
4.然后计算各个组中的总和。

我的理解正确吗？
这是对数据框进行条件选择，分组和执行汇总的正确方法吗？
数据帧大小接近1GB，在不久的将来可能会增加到4GB

我怎么会得到这段代码

数据实际上属于mysql中的一个表，但是用sql处理相同的内容要花很长时间。
我搬到了python，想以pandas读取整个文件，然后进行处理将减少时间。

我现在想上面的想法是否正确？

0 个答案:

没有答案