是否可以在数据框中跳过空白行?如果是,那么我该怎么做

时间:2018-04-10 17:24:01

标签: python pandas dataframe

我正在尝试运行此代码

num = df_out.drop_duplicates(subset=['Name', 'No.']).groupby.(['Name']).size()

但是当我这样做时,我收到了这个错误:

ValueError: not enough values to unpack (expected 2, got 0)

如果我们将我的数据框(df_out)视为excel文件,我确实有空白单元格但没有完整列或整行是空白的。我需要跳过空行来运行代码而不更改数据帧的结构。

这可能吗?

谢谢

1 个答案:

答案 0 :(得分:2)

考虑使用df.dropna()。它用于删除包含NA的行。有关详细信息,请参阅https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.dropna.html

首先,你可能想要你的"空白单元"要转换为NA值,因此可以将它们删除dropna()。这可以使用各种方法来完成,特别是df.replace(r'\s+', pandas.np.nan, regex=True)。如果您的"空白单元格"都是空字符串,或者固定字符串等于某个值s,您可以直接使用(第一种情况)df.replace('', pandas.np.nan)或(第二种情况)df.replace(s, pandas.np.nan)