我是python的新手,这个问题很难解决,需要您的帮助。
Q1 Q2 Q3 Q4 Q5
25 9 57 23 7
61 41 29 5 57
54 34 58 10 7
13 13 63 26 45
31 71 40 40 40
24 38 63 63 47
31 50 43 2 61
68 33 13 9 63
28 1 30 39 71
我有一个包含上述数据的Excel报告。我想编写一个代码来浏览第一行中的所有列,并输出列值中带有S的列的索引号(即3)。我想使用索引号为该列提取数据。我不想使用行和单元格引用,因为excel文件会定期更新,因此d列将始终移动。
def find_idx():
wb = xlrd.open_workbook(filename='data.xlsx') # open report
report_sheet1 = wb.sheet_by_name('Sheet 1')
for j in range(report_sheet1.ncols):
j=report_sheet1.cell_value(0, j)
if 'YTD' in j:
break
return j.index('Q4')
find_idx()
我得到“找不到子字符串”错误
我想要的是返回列索引号(即3),以便我可以轻松地在另一个代码中调用它。我该如何解决?
答案 0 :(得分:2)
哈斯!
据我了解,您想获取一个Excel文件的列的索引,该文件的名称包含给定的子字符串,例如Y
。是吗?
如果是这样,这是不需要熊猫的有效代码段:
import xlrd
def find_idx(excel_filename, sheet_name, col_name_lookup):
"""
Returns the column index of the first column that
its name contains the string col_name_lookup. If
the col_name_lookup is not found, it returns -1.
"""
wb = xlrd.open_workbook(filename=excel_filename)
report_sheet1 = wb.sheet_by_name(sheet_name)
for col_ix in range(report_sheet1.ncols):
col_name = report_sheet1.cell_value(0, col_ix)
if col_name_lookup in col_name:
return col_ix
return -1
if __name__ == "__main__":
excel_filename = "./data.xlsx"
sheet_name = "Sheet 1"
col_name_lookup = "S"
print(find_idx(excel_filename, sheet_name, col_name_lookup))
我尝试为变量赋予更多的语义名称(我将变量j
转换为另外两个变量:col_ix
(循环的实际列索引)以及变量col_name
真正代表列名。
此代码假定excel文件的第一行包含列名称,如果未找到要在每个名称中查找的所需子字符串,则返回-1。