Question

我有一个利率数据库，其条目偶尔是字符串，如＆＃34; NA＆＃34; s，是否可以按类型（所有字符串）跳过这些行？

04/19/2000;3.824

04/20/2000;3.834

04/21/2000;ND

04/24/2000;ND

04/25/2000;3.881

04/26/2000;3.927

我正在加载它（在保存并删除了初始注释之后）非常简单地通过

pd.io.parsers.read_csv(filepath_or_buffer="/mypath.csv")

Answer 1

我会像上面提到的@EdChum那样做：

df = pd.read_csv("/mypath.csv", na_values = ['ND'], sep = ';')
df.dropna(inplace = True)

这应该将所有ND值读作NaN s，然后您可以立即将它们放置到位。如果需要，您还可以使用不同的NaN值，例如['ND', 'nd']。

na_values指定的字符串将附加到read_csv中的默认NaN值，除非相应地调整keep_default_na选项。

Answer 2

将dropna与na_values参数结合使用：

df = pd.read_csv('qs.d.ieutio1m.csv', sep=';', header=4, na_values=['ND'])
df = df.dropna()

或更简单：

df = pd.read_csv('qs.d.ieutio1m.csv', sep=';', header=4, na_values=['ND']).dropna()