需要处理来自导入的Excel电子表格选项卡的熊猫数据框,该选项卡在同一选项卡上具有多种表格格式,以转换值以添加标签并在括号中包含该值-例如,“ Denver”可以变成“ METRO(Denver)” CITY列。
我可以使用下面的方法导入电子表格标签,但找不到解决方案来定位不同的列并转换值。
import pandas as pd
xls_file = pd.ExcelFile(r"C:\Users\Excel Work Request - Intake Form.xlsx")
table = xls_file.parse('Demographics Input')
excel上的数据格式如下:
>1 Note to user
>2 Note line 2
>3 Line 3
>4 Line 4: Line4-value
>5 Account name xyz
>6
>.
>.
>.
>13 TABLE1
>14 Table1-header-row [14 column headers]
>15 Blank line
>16 n1 rows of Table1-values [14 column values ]
> <variable blank rows/lines>
> TABLE2
> Table2-header-row [ 13 column headers ]
> n2 rows of Table2-table-values [ 13 column values ]
> <some blank rows/lines>
> TABLE3
> Table3-header-row [ 11 column headers ]
> n3 rows of Table3-table-values [ 11 column values ]
> <variable blank rows/lines>
> TABLE4
> Table4-header-row [ 6 column headers ]
> n4 rows of Table4-table-values [ 6 column values ]
> <variable blank rows/lines>
> < some information not used in processing >
要求是能够访问表1-4中具有不同格式(同一选项卡上为多个表格式)的列中的值,识别每种类型的列并应用一些规则进行转换。我当时在看df.loc,但由于我对Pandas的经验不足,无法确定解决方案。