遍历xarray的最简单方法

时间:2018-06-21 21:12:29

标签: pandas python-xarray

我有一张这样的桌子:

此: enter image description here

此图片仅显示acct_desc_program_code和乘积的一个排列。您可以想象我有数百个。我想遍历acct_desc,program_code,product的每个排列,并为每个排列获取一系列该排列的总和,等等。因此,我可以将其放入熊猫感知模型中。我以为如果我在eomonth上创建acct_desc,program_code,product和index,也许xarray会做到这一点。由于没有简单的教程,我想在重新发明轮子之前先问一下。这似乎是一个常见的用例。哦,如果缺少eomonth,我想将sum设置为0。

或者,我可以处理postgre中不同的选择中的每个排列,并获得数据并以大循环进行分析。数据库很近,因此如果电线太热,就不会受到太大的损失。尽管如此,似乎应该更有效地在本地处理xarray中的数据分离。

1 个答案:

答案 0 :(得分:0)

答案是,不要使用xarray。这是我的答案

df['eomonth'] = pd.to_datetime(df['eomonth'])
ddf = df.drop(['eomonth','sum'],axis=1).drop_duplicates()
    for _, row in ddf.iterrows():
        x = df[(df['customer']==row['customer']) & (df['acct_desc']==row['acct_desc'])&(df['product']==row['product']) & (df['program_code']==row['program_code'])]
        #do stuff with x

我永远无法格式化这件事。必须有一个教程。无论如何,我不认为xarrays是用于此目的的,它只过滤一百万次,而不是沿着维度进行构建