我只是尝试使用以下代码用熊猫打开xls文件:
import pandas as pd
frame = pd.read_excel('15_6z_12N_11.xlsx', skiprows=3)
df = pd.DataFrame(frame)
#pd.read_excel('your_excel.xlsx', , skip_blank_lines=False)
print(df)
返回为
Unnamed: 0 185 ... Unnamed: 254 Unnamed: 255
0 NaN NaN ... NaN NaN
1 NaN NaN ... NaN NaN
2 NaN NaN ... NaN NaN
3 NaN NaN ... NaN NaN
4 NaN NaN ... NaN NaN
.. ... ... ... ... ...
993 NaN NaN ... NaN NaN
994 NaN NaN ... NaN NaN
995 NaN NaN ... NaN NaN
996 NaN NaN ... NaN NaN
997 NaN NaN ... NaN NaN
我的文件包含以下数据时: Data from xls
知道为什么输出不正确吗? 谢谢
Here is xls file 但是抱歉,它是俄语的
答案 0 :(得分:0)
尝试一下:
df = pd.read_excel('15_6z_12N_11.xlsx', header=[0,1,2]) #Read file, use 3 rows as header
答案 1 :(得分:0)
首先使用指定的工作表名称创建DataFrame
,省略前3行,然后将后3行转换为MultiIndex
:
df = pd.read_excel('15_6z_12N_11.xls', sheet_name='PRINT', skiprows=3, header=[0,1,2])
然后可以使用删除的Multiindex
字符串来使Unnamed
变平:
df.columns = ['_'.join(y for y in x if not 'Unnamed' in y) for x in df.columns.tolist()]