使用readxl包中的read_excel()读取混合数字和文本列

时间:2016-08-03 16:02:29

标签: r readxl

我正在尝试使用.xls包中的read_excel()来提取大量旧版Excel 97-2003文件(readxl)。这些文件中的一列是具有一些空格的字母数字代码(例如,"", "1", "1A", "1B", "2", "3", "3A"等)。在原始Excel文件中,此列中仅包含数字的单元格的TYPE()1,而包含字母和空白单元格的单元格的TYPE()2 }。

当我使用read_excel()读入文件时,数据框中的相应列会自动转换为chr类型(这就是我想要的),但只包含数字的元素会结束被编码为小数,所以我最终得到"", "1.000000", "1A", "1B", "2.000000", "3.000000", "3A"等。强制转换为read_excel(..., coltypes = c(...,"text",...)的文字似乎没有任何区别。

我可以通过一点点regex轻松修复生成的数据框,但是有没有办法首先避免这种情况?

0 个答案:

没有答案