“pandas read_excel”有问题,这就是我的代码:
import pandas as pd
df = pd.read_excel('myExcelfile.xlsx', 'Table1', engine='openpyxl', header=1)
print(df.__len__())
如果我在 Windows PC 上的 Pycharm 中运行此代码,则会得到正确长度的数据帧,即 28757 但是如果我在我的 linux 服务器上运行这段代码,我只会得到 26645 作为输出。
任何想法是什么原因?
谢谢
答案 0 :(得分:0)
试试这个方法:
import pandas as pd
data= pd.read_excel('Advertising.xlsx')
data.head()
答案 1 :(得分:0)
我得到了解决方案。 问题是我的 .xlsx 文件中的第一行是空的。
我的文件是由另一个程序自动创建的,所以我使用openpyxl删除了第一行并创建了一个新的.xlsx文件。
import openpyxl
path = 'myExcelFile.xlsx'
book = openpyxl.load_workbook(path)
sheet = book['Tabelle1']
#start at row 0, length 1 row:
sheet.delete_rows(0,1)
#save in new file:
book.save('myExcelFile_new.xlsx')
注意,在这个代码示例中,我不检查第一行是否为空! 所以不管里面有没有内容,我都删除第一行。