我希望将csv读入数据帧:
例如
name, age, city
Dave, , London
Bob, 24, Melbourne
Joe, 38, Boston
我希望保留未列出年龄的行。
如果我以NaN的形式将空的csv值读入数据帧,则可以使用df[‘age’].isnull()
如果我将空的csv值作为空字符串读入数据帧,则可以通过df[‘age’]!=“”
进行过滤
我已经进行了研究,以了解空和NaN之间的区别。但是,对于我来说,仍然不明显的是使用每种方法的含义/优点/缺点是什么,或者它们仅仅是两种获得相同结果的方法?
答案 0 :(得分:0)
我认为最大的不同是数据框如何处理每个值。如果您以NaN
的形式读入,则可以使用isna()
和df.info
之类的内置方法来查找空值,如果只用空字符串初始化,则不必查找空值< / p>