从csv中删除NaN值

时间:2017-07-01 15:08:22

标签: csv

我已经围绕这个主题搜索了几个问题,但没有找到并回答这些问题使我的代码工作。我是初学者,所以任何帮助都非常感谢。

我正在使用jupyter笔记本并拥有以下代码:

import pandas
a = pandas.read_csv("internal_html.csv")
a.dropna(axis="columns", how="any")
a.head(10)

运行代码时没有错误,但仍然显示具有NaN值的列。

谢谢!

2 个答案:

答案 0 :(得分:3)

您需要将dropna语句重新分配给。

a = a.dropna(axis="columns", how="any")

dropna 默认情况下不是就地操作。

或者你可以:

a.dropna(axis="columns", how="any", inplace=True)

编辑以处理源中的空值,如下面的注释中所述。

import pandas as pd
import numpy as np

a = pd.read_csv("internal_html.csv")
a = a.replace('',np.nan)
a = a.dropna(axis="columns", how="any")
a.head(10)

答案 1 :(得分:0)

您需要先替换 csv DataFrame 中的所有“”

nan_value = float("NaN")
df_csv.replace("", nan_value, inplace=True)
df_csv.dropna(subset = ["your_column_name"], inplace=True)