我有一个Excel文件,其中包含我需要读入内存的所有数据。每行都是一个数据样本,每列都是一个特征。我正在使用pandas.read_excel()函数来读取它。
问题是这个函数会自动将一些布尔列转换为float64类型。我手动检查了一些列。仅转换具有缺失值的列。没有缺失值的列仍然是bool。
我的问题是:如何防止read_excel()函数自动将布尔列转换为float64。
这是我的代码段:
>>> fp = open('myfile.xlsx', 'rb')
>>> df = pd.read_excel(fp, header=0)
>>> df['BooleanFeature'].dtype
dtype('float64')
这里BooleanFeature
是一个布尔特征,但有一些缺失值。