Question

这可能是一个琐碎的问题，但我看不到如何进行：

我有一个称为data的数据框，该数据框是从excel文件中提取的：

data = pd.read_excel("C:\\Users\\firstname.lastname\\Desktop\\variable+".xlsx", sheet_name=variable2, na_values='', usecols="A,B", skiprows=range(2))

这可以很好地加载文件，但是在B列中有一个字符串恰好等于“ NA”，在结果数据框中，它不会显示为NA，而只是显示为空白。

我假设熊猫将此NA解释为空白，因此将其保留为空。

但这是一个合法的NA，我想说NA不能为空。

我尝试替换：

na_values='NA'

并且还使用正则表达式用“ NA”替换空白的列值（这不是我承认的最佳解决方案，但在这种情况下可以使用，因为B列只有一个NA变为空白。

df.replace(r'^\s+$', np.nan, regex=True)

我在做什么错了？

Answer 1

根据pandas文档，尝试将keep_default_na=False添加到pd.read_excel

的参数中