python中按单元格值的列索引号

时间:2019-07-03 12:22:23

标签: python

我是python的新手,这个问题很难解决,需要您的帮助。

Q1 Q2 Q3 Q4 Q5
25 9  57 23 7
61 41 29 5  57
54 34 58 10 7
13 13 63 26 45
31 71 40 40 40
24 38 63 63 47
31 50 43 2  61
68 33 13 9  63
28 1  30 39 71

我有一个包含上述数据的Excel报告。我想编写一个代码来浏览第一行中的所有列,并输出列值中带有S的列的索引号(即3)。我想使用索引号为该列提取数据。我不想使用行和单元格引用,因为excel文件会定期更新,因此d列将始终移动。

def find_idx():
    wb = xlrd.open_workbook(filename='data.xlsx')  # open report
    report_sheet1 = wb.sheet_by_name('Sheet 1')

    for j in range(report_sheet1.ncols): 
        j=report_sheet1.cell_value(0, j)
        if 'YTD' in j:
            break
        return j.index('Q4')
find_idx()

我得到“找不到子字符串”错误

我想要的是返回列索引号(即3),以便我可以轻松地在另一个代码中调用它。我该如何解决?

1 个答案:

答案 0 :(得分:2)

哈斯!

据我了解,您想获取一个Excel文件的列的索引,该文件的名称包含给定的子字符串,例如Y。是吗?

如果是这样,这是不需要熊猫的有效代码段:

import xlrd


def find_idx(excel_filename, sheet_name, col_name_lookup):
    """
    Returns the column index of the first column that
    its name contains the string col_name_lookup. If
    the col_name_lookup is not found, it returns -1.
    """
    wb = xlrd.open_workbook(filename=excel_filename)
    report_sheet1 = wb.sheet_by_name(sheet_name)

    for col_ix in range(report_sheet1.ncols):
        col_name = report_sheet1.cell_value(0, col_ix)

        if col_name_lookup in col_name:
            return col_ix

    return -1


if __name__ == "__main__":
    excel_filename = "./data.xlsx"
    sheet_name = "Sheet 1"
    col_name_lookup = "S"

    print(find_idx(excel_filename, sheet_name, col_name_lookup))

我尝试为变量赋予更多的语义名称(我将变量j转换为另外两个变量:col_ix(循环的实际列索引)以及变量col_name真正代表列名。

此代码假定excel文件的第一行包含列名称,如果未找到要在每个名称中查找的所需子字符串,则返回-1。