我有一个包含数据的文件,我试图将其放入图表中等等。在数据的某些部分,有-
个字符表示未收集的数据。我知道data.dropna()
通常会完成这项工作,但缺少的数据却由-
表示。
答案 0 :(得分:3)
假设我有一个看起来像
的csv文件test.csv
col1,col2,col3
1,-,2
-,3,4
我可以告诉pd.read_csv
处理'-'
nan
,当它被读入
df = pd.read_csv('test.csv', na_values=['-'])
df
col1 col2 col3
0 1.0 NaN 2
1 NaN 3.0 4
从那里,你可以dropna
正常