熊猫:适用于DataFrameGroupBy的错误处理

时间:2020-01-29 14:34:40

标签: python pandas

如何汇总由df.groupby函数产生的DataFrame组时出现的错误。

grouped_df = df.groupby(by=[FIELD_GID]).apply(_aggr)

其中_aggr是由DataFrameGroupBy产生的每个groupby的熊猫调用的函数。更具体地说,_aggr根据其某些列聚合每个DataFrameGroupBy对象中的行,但是在某些情况下,这些列不存在或具有NaN值,因此聚合应仅导致一个空的DataFrame返回。

为简单起见,假设_aggr仅总是产生当前错误,如下所示。对于无法发生聚合的情况,是否最好在_aggr内创建并返回一个空的DataFrame或返回None或引发异常?

def _aggr(df: DataFrame):
    raise KeyError

0 个答案:

没有答案