我的数据框是这样的。我知道我在数据清理中丢失了一些行,因为len(df)以前是500,现在是489。 例如,我可以看到第496行丢失了。
all month day year
0 03/25/93 03 25 93
...
480 2013 1 1 2013
481 1974 1 1 1974
482 1990 1 1 1990
483 1995 1 1 1995
484 2004 1 1 2004
485 1987 1 1 1987
486 1973 1 1 1973
487 1992 1 1 1992
488 1977 1 1 1977
489 1985 1 1 1985
490 2007 1 1 2007
491 2009 1 1 2009
492 1986 1 1 1986
493 1978 1 1 1978
494 2002 1 1 2002
495 1979 1 1 1979
497 2008 1 1 2008
498 2005 1 1 2005
499 1980 1 1 1980
如何找出缺少的行? 如果我的问题重复,请指出解决方案。谢谢!
答案 0 :(得分:2)
如果您具有唯一的索引值,最简单的方法可能是使用索引上的差异,即,您可以简单地这样做:
df_original.index.difference(df_cleaned.index)