我有一个利率数据库,其条目偶尔是字符串,如" NA" s,是否可以按类型(所有字符串)跳过这些行?
04/19/2000;3.824
04/20/2000;3.834
04/21/2000;ND
04/24/2000;ND
04/25/2000;3.881
04/26/2000;3.927
我正在加载它(在保存并删除了初始注释之后)非常简单地通过
pd.io.parsers.read_csv(filepath_or_buffer="/mypath.csv")
答案 0 :(得分:2)
我会像上面提到的@EdChum那样做:
df = pd.read_csv("/mypath.csv", na_values = ['ND'], sep = ';')
df.dropna(inplace = True)
这应该将所有ND
值读作NaN
s,然后您可以立即将它们放置到位。如果需要,您还可以使用不同的NaN
值,例如['ND', 'nd']
。
na_values
指定的字符串将附加到read_csv中的默认NaN
值,除非相应地调整keep_default_na
选项。
答案 1 :(得分:1)
将dropna
与na_values
参数结合使用:
df = pd.read_csv('qs.d.ieutio1m.csv', sep=';', header=4, na_values=['ND'])
df = df.dropna()
或更简单:
df = pd.read_csv('qs.d.ieutio1m.csv', sep=';', header=4, na_values=['ND']).dropna()