Question

我正在尝试解析xlsx文件，该文件总共有41列。

3有数字，字符串和日期。

以下是我解析日期的示例代码

import pandas as pd

dateparse = lambda dates: [pd.datetime.strptime(d, '%m/%d/%Y %I:%M:%S %p') for d in dates]

df = pd.read_excel('security_sample.xlsx', sheet_name='Sheet1', header=0, index= False, index_col=None, parse_dates=True, date_parser=dateparse)

print df

但遗憾的是，输出采用此格式的日期

         LastChanged
 2017-12-04 13:36:43
 2017-01-13 02:23:34
 2017-07-18 17:03:41
 2018-02-21 18:58:30
 2018-01-19 16:52:25
 2017-06-09 13:30:37
 2017-11-24 19:18:14
 2018-03-06 13:44:07
 2016-11-26 05:47:30
 2018-02-26 11:39:10

xlsx中有一列具有需要剥离的前导空格。我怎么能这样做？

几乎所有列都有空字段。所以我还需要为日期处理空值。

我需要所有列为str。

Answer 1

将dtype参数设置为str，将所有列转换为字符串，如下所示：

将pandas导入为pd

df = pd.read_excel('security_sample.xlsx', sheet_name='Sheet1', header=0, 
                  index= False, index_col=None, parse_dates=True,   
                  date_parser=dateparse,       
                  dtype ='str')

数据框无法按指定显示所需的日期时间

1 个答案: