将基因名称格式化为xlsx r包

时间:2017-08-21 14:35:07

标签: r xlsx r-xlsx

我正在尝试以正确的方式格式化excel文件中的列。首先,我担心Excel会将一些奇怪的基因名称作为 date ,这在科学中经常发生。通常,当从txt文件将数据导入excel时,我选择基因名称列并将单元格类型从常规更改为文本以保存在保存端。 当我现在使用xlsx创建我的Excel工作表时,我恐怕确实会发生这种情况。 目前我尝试重现此行为,但所有列都被格式化为一般但我希望强制将特定列强制为文本。

这有可能吗?

df <- data.frame(a=c(1,2),
                 b=c('SEPT2', 'MARCH1'),
                 c=c('1,2', '1,4'),
                 d=c('1.2', '1.4'),
                 e=c('2-SEP', '1-MARCH'),
                 f=c('APR-1', 'DEC-1'))
wb <- xlsx::createWorkbook()
sheet1 <- xlsx::createSheet(wb, sheetName='test')
xlsx::addDataFrame(df, sheet1, 
                   col.names=TRUE, row.names=FALSE)
xlsx::saveWorkbook(wb, 'test.xlsx')

我希望将b,e和f列格式化为文本。

修改

因为我在评论中询问,如何找到更多的格式值,例如科学记数法,我发现了here

text_format = CellStyle(wb, dataFormat=DataFormat("@"))
scientific_format <- CellStyle(wb, dataFormat=DataFormat('0.00E+00'))

1 个答案:

答案 0 :(得分:1)

您只需要创建格式规范并使用addDataFrame参数将其添加到colStyle

wb <- xlsx::createWorkbook()
sheet1 <- xlsx::createSheet(wb, sheetName='test')

## Create the format specification
TextFormat = CellStyle(wb, dataFormat=DataFormat("@"))
FormatList = list('2'=TextFormat, '5'=TextFormat,'6' = TextFormat)

xlsx::addDataFrame(df, sheet1, col.names=TRUE, colStyle=FormatList, 
    row.names=FALSE)
xlsx::saveWorkbook(wb, 'test.xlsx')

注意:“@”是文本格式的代码。