我有一个保存在xls文件中的数据集。
在此数据集中,有4列代表日期,格式为dd / mm / yyyy。
我的问题是,当我使用python在python中使用pandas读取它并使用read_excel函数时,所有列均读取为字符串,除了其中之一,读取为datetime64 [ns],即使我指定了dtypes = {column = str}。为什么?
答案 0 :(得分:1)
Excel中的日期通常存储为数字,即使您将它们显示为易于理解的日期(例如dd / mm / yyyy),也可以执行减法操作。熊猫会方便地获取这些数字并将其解释为日期,从而使您可以更灵活地处理它们。
要将它们转换为字符串,可以使用converters
的{{1}}参数,如下所示:
pd.read_excel
strftime方法可让您随意设置日期格式。通过为列指定转换器,您可以在读入数据时将其应用于数据。