从稀疏数据集中删除列和行

时间:2020-06-28 17:06:54

标签: python pandas

我有一个稀疏的Pandas数据框,其中包含许多空值,我想对其进行过滤,以便最终数据集中仅保留具有10个以上float条目的行和列。我尝试使用现有的代码段,但似乎不起作用:

df.drop([col for col, val = df.count(axis=1, numeric_only='float') if val < 10], axis=1, inplace=True)

谁能让我知道删除数据框中的稀疏列的最佳方法是什么?

1 个答案:

答案 0 :(得分:0)

您可以获取每一行和每一列中非缺失值的数量,检查其是否大于阈值,然后仅询问条件为True的那些行/值。

{{1}}