pd.read_excel()用`nan`字符串替换空格,pd.read_csv()使用numpy.nan

时间:2019-03-01 18:53:24

标签: python pandas

当我使用

创建[ {'uid': '12345', 'name': 'John Smith', 'val1': '25', 'val2': '65'}, {'uid': '56789', 'name': 'Joe Brown', 'val1': '1', 'val2': '2'} ]
DataFrame
电子表格中的

空白单元格用字符串pd.read_excel(my_excel_file, dtype=str) 替换。另一方面,从

生成的nan
DataFrame

pd.read_csv(my_csv_file, dtype=str) 对象代替空白。为什么会这样?

2 个答案:

答案 0 :(得分:3)

您可以为ls(name = "package:base")指定一个na_values属性。

read_excel

答案 1 :(得分:2)

我将尝试在这是为什么?上回答您的问题。当使用dtype=str来使用pd.read_excel读取Excel文件时,获得的结果与以下内容不一致您在使用pd.read_csv时会得到。主要原因或可以说,使用numpy.nan时用pd.read_csv对象替换空白单元格的优势在于,它可以帮助您使用pd.isna,该方法仅适用于numpy.nan对象,而不仅仅是nan

与此相关的讨论很多,可以说,此功能又可以在pd.read_csvpd.read_excel之间保持一致性。您可以在Github熊猫页面上详细了解讨论内容,read_excel with dtype=str converts empty cells to the string 'nan' #20377

对此进行了一些辩论