熊猫使用跳过合并的单元格读取Excel

时间:2018-12-28 11:32:20

标签: pandas

我正在尝试使用pandas库读取xlsx文件。我想跳过行直到第11行,然后开始阅读,我尝试了大熊猫的skiprows选项,但似乎没有用,并返回了错误xlrd.biffh.XLRDError: ZIP file contents not a known type of workbook enter image description here

我无法弄清楚这里是什么。这是我尝试过的代码。从B1:E1,B2:E2等直到B10:E10行都是合并行。

read_conversion_raw_file = pd.read_excel("test.xlsx", skiprows=10)

1 个答案:

答案 0 :(得分:-1)

我尝试使用test.xlsxtest.csv读取此文件,但在两种情况下均会出错。 因此,一种可能的解决方案是将此test.xlsx转换为文本文件test.txt,然后通过跳过前10行来读取它,

df = pd.read_csv('test.txt', sep=",", skiprows = range(10))

输出:

      Campaign                                        Site (DCM)    Placement   Date    Activity    Advertiser  Advertiser ID   Total Conversions
0   002|2018|Q1|Accounting|Accounting|LON|UK_ACGRC_ affectv.co.uk   PKMG3Y_Sage|Payroll|Sage One |UK|Display|Looka...   2018-11-28  Non-Conversion FL   Sage|UK 8205616 1
1   002|2018|Q2|Accounting|LON|UK_ACGRC_    facebook UK SAGE|Accounting|Sage_One|UK|Social|Intrests|Fa...   2018-11-28  Accounting|FY17|Q4|LP|brochure  Sage|UK 8205616 2
2   002|2018|Q2|Accounting|LON|UK_ACGRC_    facebook UK SAGE|Accounting|Sage_One|UK|Social|Intrests|Fa...   2018-11-28  HR&Payroll|FY18|Q4|LP|BOFURetargeting   Sage|UK 8205616 1
3   002|2018|Q2|Accounting|LON|UK_ACGRC_    facebook UK Sage|Accounting|SageOne|UK|Social|WebsiteRTG|F...   2018-11-12  Non-Conversion FL   Sage|UK 8205616 2
4   002|2018|Q2|CoreFinancials|LON|UK_CRFG_ facebook UK SAGE|Core Financials|Sage Live|UK|Social|Looka...   2018-11-14  Non-Conversion FL   Sage|UK 8205616 2

由于空间原因,输出格式有些混乱,但希望它可以满足您的问题要求。