我有一个Excel文件,其中包含有关特定格式的信息。我想使用python将此excel文件转换为整洁的数据集。我知道这是可能的,但是逻辑超出了我的逻辑思维范围。
对我来说重要的信息在子表中,但是我也需要在较大的表中的信息。举例来说,这就是我最后要说的。
我必须在下面的表中的每一行重复“车辆”,“ Yr / Mk / Mdl”和“序列”。
如果我使用熊猫读取了excel文件并进行了一些修改:
x = pd.read_excel(file_name, 'AccountingSchedules-DETAILSched', skiprows = 10, nrows = 100)
x.dropna(how = 'all', inplace = True) #dropping empty rows
x.fillna(method='ffill', inplace = True)
这给了我如下数据框,这不是我想要的