当我使用
创建[
{'uid': '12345', 'name': 'John Smith', 'val1': '25', 'val2': '65'},
{'uid': '56789', 'name': 'Joe Brown', 'val1': '1', 'val2': '2'}
]
时
DataFrame
电子表格中的空白单元格用字符串pd.read_excel(my_excel_file, dtype=str)
替换。另一方面,从
nan
DataFrame
用pd.read_csv(my_csv_file, dtype=str)
对象代替空白。为什么会这样?
答案 0 :(得分:3)
您可以为ls(name = "package:base")
指定一个na_values
属性。
read_excel
答案 1 :(得分:2)
我将尝试在这是为什么?上回答您的问题。当使用dtype=str
来使用pd.read_excel
读取Excel文件时,获得的结果与以下内容不一致您在使用pd.read_csv
时会得到。主要原因或可以说,使用numpy.nan
时用pd.read_csv
对象替换空白单元格的优势在于,它可以帮助您使用pd.isna
,该方法仅适用于numpy.nan
对象,而不仅仅是nan
。
与此相关的讨论很多,可以说,此功能又可以在pd.read_csv
和pd.read_excel
之间保持一致性。您可以在Github熊猫页面上详细了解讨论内容,read_excel with dtype=str converts empty cells to the string 'nan' #20377