Question

我是python的新手，这个问题很难解决，需要您的帮助。

Q1 Q2 Q3 Q4 Q5
25 9  57 23 7
61 41 29 5  57
54 34 58 10 7
13 13 63 26 45
31 71 40 40 40
24 38 63 63 47
31 50 43 2  61
68 33 13 9  63
28 1  30 39 71

我有一个包含上述数据的Excel报告。我想编写一个代码来浏览第一行中的所有列，并输出列值中带有S的列的索引号（即3）。我想使用索引号为该列提取数据。我不想使用行和单元格引用，因为excel文件会定期更新，因此d列将始终移动。

def find_idx():
    wb = xlrd.open_workbook(filename='data.xlsx')  # open report
    report_sheet1 = wb.sheet_by_name('Sheet 1')

    for j in range(report_sheet1.ncols): 
        j=report_sheet1.cell_value(0, j)
        if 'YTD' in j:
            break
        return j.index('Q4')
find_idx()

我得到“找不到子字符串”错误

我想要的是返回列索引号（即3），以便我可以轻松地在另一个代码中调用它。我该如何解决？

Answer 1

哈斯！

据我了解，您想获取一个Excel文件的列的索引，该文件的名称包含给定的子字符串，例如Y。是吗？

如果是这样，这是不需要熊猫的有效代码段：

import xlrd


def find_idx(excel_filename, sheet_name, col_name_lookup):
    """
    Returns the column index of the first column that
    its name contains the string col_name_lookup. If
    the col_name_lookup is not found, it returns -1.
    """
    wb = xlrd.open_workbook(filename=excel_filename)
    report_sheet1 = wb.sheet_by_name(sheet_name)

    for col_ix in range(report_sheet1.ncols):
        col_name = report_sheet1.cell_value(0, col_ix)

        if col_name_lookup in col_name:
            return col_ix

    return -1


if __name__ == "__main__":
    excel_filename = "./data.xlsx"
    sheet_name = "Sheet 1"
    col_name_lookup = "S"

    print(find_idx(excel_filename, sheet_name, col_name_lookup))

我尝试为变量赋予更多的语义名称（我将变量j转换为另外两个变量：col_ix（循环的实际列索引）以及变量col_name真正代表列名。

此代码假定excel文件的第一行包含列名称，如果未找到要在每个名称中查找的所需子字符串，则返回-1。

python中按单元格值的列索引号

1 个答案: