我有一些代码可以打开一个excel文件并将其另存为pandas数据框,它最初是在Python 2.7中使用的,而我目前正在尝试使其在Python 3下工作。
最初,我使用了另一篇文章From password-protected Excel file to pandas DataFrame中@myidealab中的代码。 当前看起来像这样:
data_file = <path_for_file>
# Load excel file
xlApp = win32com.client.Dispatch("Excel.Application")
xlApp.Visible = False
pswd = getpass.getpass('password: ')
xldatabase = xlApp.Workbooks.Open(data_file, False, True, None, pswd)
dfdatabase = []
for sh in xldatabase.Sheets:
xlsheet = xldatabase.Worksheets(sh.Name)
# Get last_row
row_num = 0
cell_val = ''
while cell_val != None:
row_num += 1
cell_val = xlsheet.Cells(row_num, 1).Value
last_row = row_num - 1
# Get last_column
col_num = 0
cell_val = ''
while cell_val != None:
col_num += 1
cell_val = xlsheet.Cells(1, col_num).Value
last_col = col_num - 1
# Get content
content = xlsheet.Range(xlsheet.Cells(1, 1), xlsheet.Cells(last_row, last_col)).Value
# Load each sheet as a dataframe
dfdatabase.append(pd.DataFrame(list(content[1:]), columns=content[0]))
现在,我遇到以下错误:
AttributeError:“ pywintypes.datetime”对象没有属性 “纳秒”
问题似乎可以归结为以下几点:
# Get content
content = xlsheet.Range(xlsheet.Cells(1, 1), xlsheet.Cells(last_row, last_col)).Value
# Load each sheet as a dataframe
dfdatabase.append(pd.DataFrame(list(content[1:]), columns=content[0]))
xlsheet.Range()。Value正在读取数据并为数据分配pywintymes描述符,而pd.DataFrame()无法解释。
之前有人遇到过这个问题吗?有没有一种方法可以专门告诉xlsheet.Range()。Value如何以熊猫可以解释的方式读取值?
任何帮助都将受到欢迎! 谢谢。
答案 0 :(得分:0)
假设您事先知道了Excel工作表中日期/时间的大小/格式,这将解决此问题。 尽管如此,也许还有其他更优雅的方法可以解决它。
注意:content最初是一个元组。位置[0]是包含标头的数组,其余位置包含数据。
import datetime
import pywintypes
...
content = xlsheet.Range(xlsheet.Cells(1, 1), xlsheet.Cells(last_row, last_col)).Value
head = content[0]
data = list(content[1:])
for x in range(0,len(data)):
data[x] = list(data[x])
for y in range(0,len(data[x])):
if isinstance(data[x][y], pywintypes.TimeType):
temp = str(data[x][y]).rstrip("+00:00").strip()
if len(temp)>10:
data[x][y] = datetime.datetime.strptime(temp, "%Y-%m-%d%H:%M")
elif len(temp)>5 and len(temp)<=10:
data[x][y] = datetime.datetime.strptime(temp, "%Y-%m-%d")
elif len(temp)<=5:
data[x][y] = datetime.datetime.strptime(temp, "%H:%M")
print(data[x][y])
# Load each sheet as a dataframe
dfdatabase.append(pd.DataFrame(data, columns=head))
用作参考: python-convert-pywintyptes-datetime-to-datetime-datetime