处理Pandas中的丢失数据

时间:2012-07-23 21:23:51

标签: pandas

我有200,000 x 500 dataframe装入熊猫。是否有一个函数可以自动告诉我哪些列缺少数据?或者我是否必须迭代每列并逐个元素检查?

一旦找到缺少的元素,如何定义自定义函数(基于列名和同一行中的其他一些数据)来自动替换。我看到了fillna()方法,但我不认为它需要一个(lambda)函数作为输入。

谢谢!

1 个答案:

答案 0 :(得分:7)

类似的东西:

import pandas as pd
pd.isnull(frame).any()

您可能正在寻找寻找缺失数据的内容

fillna目前不接受lambda函数,虽然这在github上是一个开放的问题。

您现在可以使用DataFrame.apply进行自定义填充。虽然您可以更具体地了解填写数据需要做些什么吗?只是好奇用例是什么。