我正在尝试运行此代码
num = df_out.drop_duplicates(subset=['Name', 'No.']).groupby.(['Name']).size()
但是当我这样做时,我收到了这个错误:
ValueError: not enough values to unpack (expected 2, got 0)
如果我们将我的数据框(df_out)视为excel文件,我确实有空白单元格但没有完整列或整行是空白的。我需要跳过空行来运行代码而不更改数据帧的结构。
这可能吗?
谢谢
答案 0 :(得分:2)
考虑使用df.dropna()
。它用于删除包含NA的行。有关详细信息,请参阅https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.dropna.html。
首先,你可能想要你的"空白单元"要转换为NA值,因此可以将它们删除dropna()
。这可以使用各种方法来完成,特别是df.replace(r'\s+', pandas.np.nan, regex=True)
。如果您的"空白单元格"都是空字符串,或者固定字符串等于某个值s
,您可以直接使用(第一种情况)df.replace('', pandas.np.nan)
或(第二种情况)df.replace(s, pandas.np.nan)
。