我正在尝试解析xlsx文件,该文件总共有41列。
3有数字,字符串和日期。
以下是我解析日期的示例代码
import pandas as pd
dateparse = lambda dates: [pd.datetime.strptime(d, '%m/%d/%Y %I:%M:%S %p') for d in dates]
df = pd.read_excel('security_sample.xlsx', sheet_name='Sheet1', header=0, index= False, index_col=None, parse_dates=True, date_parser=dateparse)
print df
但遗憾的是,输出采用此格式的日期
LastChanged
2017-12-04 13:36:43
2017-01-13 02:23:34
2017-07-18 17:03:41
2018-02-21 18:58:30
2018-01-19 16:52:25
2017-06-09 13:30:37
2017-11-24 19:18:14
2018-03-06 13:44:07
2016-11-26 05:47:30
2018-02-26 11:39:10
xlsx中有一列具有需要剥离的前导空格。我怎么能这样做?
几乎所有列都有空字段。所以我还需要为日期处理空值。
我需要所有列为str。
答案 0 :(得分:0)
将dtype
参数设置为str
,将所有列转换为字符串,如下所示:
将pandas导入为pd
df = pd.read_excel('security_sample.xlsx', sheet_name='Sheet1', header=0,
index= False, index_col=None, parse_dates=True,
date_parser=dateparse,
dtype ='str')