如何从excel文件和python中具有复杂表结构的数据中读取和识别颜色编码数据(字体和背景)?

时间:2017-10-07 13:45:47

标签: python excel

我有一个有条件格式化的excel文件。它具有不同的字体颜色和单元格背景颜色的不同值。如何识别这些信息?另外,表结构很复杂。意味着单行标题可以包含合并的单元格/多个值。 例: enter image description here

请帮忙。谢谢

2 个答案:

答案 0 :(得分:0)

请检查以下和xlrd包,它将帮助您解决问题。

 excelbook = xlrd.open_workbook("excel urt", formatting_info=True)
excel_sheets = excelbook.sheet_names()
for item, exsh in enumerate(excel_sheets):
excel_sheet = excelbook.sheet_by_index(item)
rows, cols = excel_sheet.nrows, excel_sheet.ncols
for row in range(rows):
for col in range(cols):
thecell = excel_sheet.cell(row, col)      
xfx = excel_sheet.cell_xf_index(row, col)
xf = excelbook.xf_list[xfx]
bgx = xf.background.pattern_colour_index
print bgx

答案 1 :(得分:0)

使用openpyxl你可以读取rgb hex类型的基本颜色,但你需要检查python和openpyxl,这个库正处于开发阶段

from openpyxl import load_workbook wb = load_workbook(filename='testfile.xlsx', read_only=True) worksheet = wb.active print(worksheet['A1'].font.color)