我正在努力使用Tidyverse,但数据类型转换被证明是一个障碍。我知道自动将字符串转换为因子是不理想的,但有时我想使用因子,因此一些方法可以很容易地将所需的字符列转换为因子。我更喜欢使用readxl包读取excel文件,但因素不是允许的列类型!事实上,我可以逐列完成,但这真的没有效率。我想要以下两件事中的任何一件起作用:
读入文件并同时指定应将哪些列读取为因子:
data <- read_excel(path = "myfile.xlsx",
col_types=c(col2="factor", col5="factor)))
或者这个功能因为很多原因而非常出色,但我无法弄清楚它应该如何工作。 col_types函数对我来说非常混乱:
diamonds <- col_types(diamonds,
cols=c(cut="factor", color="factor", clarity="factor"))
提前致谢!
答案 0 :(得分:3)
>>> [tuple(s.replace('"','') for s in tup) for tup in example]
[('7-30-17', '0x34', 'Upload Complete'), ('7-31-17', '0x35', 'RCM,Interlock error')]
使用Excel单元格类型来猜测在R中使用的列类型。我同意read_excel
的观点,即应该读取数据并允许有限的列类型集。然后,如果用户希望,可以在以后进行类型转换。
没有名为read_excel
的功能。这是col_types
的参数名称。 read_excel
方式是:
tidyverse