我已经获得了excel文件(.xlsx
),其中单元格的格式是我需要捕获的相关信息。感兴趣的关键格式是(1)单元格颜色和(2)边框(左+右,全框或不存在)。
是否可以将其读入R?
答案 0 :(得分:2)
这是一个非常老的问题,但是仍然会出现在搜索中,因此我认为将人们引向tidyxl
软件包非常有用。
tidyxl::xlsx_cells()
读取Excel电子表格作为数据框,其中每一行代表电子表格的单个单元格,并带有其地址(例如A1
),内容和属性。
tidyxl::xlsx_formats()
返回Excel电子表格中所有不同单元格格式的嵌套列表。
由local_format_id
返回的数据框中的xlsx_cells()
列使您可以在xlsx_formats()
返回的列表中查找每个单元格的格式信息。
tidyxl package vignette中包含更多信息。
答案 1 :(得分:0)
我对Python openpyxl项目非常满意。也许你可以操纵(预处理)python中的xlsx以便被R(可能是CSV或XLS)消化。
http://openpyxl.readthedocs.org/en/latest/index.html#tutorial
http://openpyxl.readthedocs.org/en/latest/usage.html#read-an-existing-workbook
Quick R中有一个XLS导入: