熊猫 read_excel 不会读取所有行

时间:2021-07-14 13:21:59

标签: python pandas

“pandas read_excel”有问题,这就是我的代码:

import pandas as pd

df = pd.read_excel('myExcelfile.xlsx', 'Table1', engine='openpyxl', header=1)
print(df.__len__())

如果我在 Windows PC 上的 Pycharm 中运行此代码,则会得到正确长度的数据帧,即 28757 但是如果我在我的 linux 服务器上运行这段代码,我只会得到 26645 作为输出。

任何想法是什么原因?

谢谢

2 个答案:

答案 0 :(得分:0)

试试这个方法:

import pandas as pd

data= pd.read_excel('Advertising.xlsx')

data.head()

答案 1 :(得分:0)

我得到了解决方案。 问题是我的 .xlsx 文件中的第一行是空的。

我的文件是由另一个程序自动创建的,所以我使用openpyxl删除了第一行并创建了一个新的.xlsx文件。

import openpyxl

path = 'myExcelFile.xlsx'
book = openpyxl.load_workbook(path)
sheet = book['Tabelle1']
#start at row 0, length 1 row:
sheet.delete_rows(0,1)
#save in new file:
book.save('myExcelFile_new.xlsx')

注意,在这个代码示例中,我不检查第一行是否为空! 所以不管里面有没有内容,我都删除第一行。