我正在尝试使用.xls
包中的read_excel()
来提取大量旧版Excel 97-2003文件(readxl
)。这些文件中的一列是具有一些空格的字母数字代码(例如,"", "1", "1A", "1B", "2", "3", "3A"
等)。在原始Excel文件中,此列中仅包含数字的单元格的TYPE()
为1
,而包含字母和空白单元格的单元格的TYPE()
为2
}。
当我使用read_excel()
读入文件时,数据框中的相应列会自动转换为chr
类型(这就是我想要的),但只包含数字的元素会结束被编码为小数,所以我最终得到"", "1.000000", "1A", "1B", "2.000000", "3.000000", "3A"
等。强制转换为read_excel(..., coltypes = c(...,"text",...)
的文字似乎没有任何区别。
我可以通过一点点regex
轻松修复生成的数据框,但是有没有办法首先避免这种情况?