这可能是一个琐碎的问题,但我看不到如何进行:
我有一个称为data的数据框,该数据框是从excel文件中提取的:
data = pd.read_excel("C:\\Users\\firstname.lastname\\Desktop\\variable+".xlsx", sheet_name=variable2, na_values='', usecols="A,B", skiprows=range(2))
这可以很好地加载文件,但是在B列中有一个字符串恰好等于“ NA”,在结果数据框中,它不会显示为NA,而只是显示为空白。
我假设熊猫将此NA解释为空白,因此将其保留为空。
但这是一个合法的NA,我想说NA不能为空。
我尝试替换:
na_values='NA'
并且还使用正则表达式用“ NA”替换空白的列值(这不是我承认的最佳解决方案,但在这种情况下可以使用,因为B列只有一个NA变为空白。
df.replace(r'^\s+$', np.nan, regex=True)
我在做什么错了?
答案 0 :(得分:0)
根据pandas文档,尝试将keep_default_na=False
添加到pd.read_excel