如何汇总由df.groupby
函数产生的DataFrame组时出现的错误。
grouped_df = df.groupby(by=[FIELD_GID]).apply(_aggr)
其中_aggr
是由DataFrameGroupBy
产生的每个groupby
的熊猫调用的函数。更具体地说,_aggr
根据其某些列聚合每个DataFrameGroupBy
对象中的行,但是在某些情况下,这些列不存在或具有NaN值,因此聚合应仅导致一个空的DataFrame返回。
为简单起见,假设_aggr
仅总是产生当前错误,如下所示。对于无法发生聚合的情况,是否最好在_aggr
内创建并返回一个空的DataFrame或返回None
或引发异常?
def _aggr(df: DataFrame):
raise KeyError